미니의 글은 다음과 같이 출처를 밝히시면 가져가서 활용할 수 있습니다.
[출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)]

4. DTD란?

  요새 냉방병에 눈병이 심하다고 하네요.. 저도 어째 눈이 좀 안좋아서 안과에 다녀왔네요.. 모두들 뜨거운 여름에 몸 조심하세요.. 그리고 제가 여기에 올리는 강좌는 초보자를 위한 글입니다. 첨 홈페이지를 제작할 때는 XML에 관심이 많아서 많은 분들이 찾아왔었지만, 지금은 XML의 기본사항은 마치 HTML처럼 널리 알려진 내용이 되었네요.. 그래도 또 다시 새롭게 시작하는 분들을 위해서 이 글을 정리해 놓습니다. *^^*

자 그럼 시작해 볼까요?

DTD는 XML 문서에 사용될 구성요소를 정의해 놓은 것으로 생각하면 됩니다. Document Type Definition

그런데 생각보다 DTD는 좀 어렵습니다. 만약 DTD를 설계해야 한다.. 그러면 더욱이 어려워지죠.

제 생각에 초기 DB를 설계하기 위해서 DBA가 필요했던 것처럼 XML에서 DTD를 설계하는 사람도 필요해지겠죠..

그러나 차이는 조금 있습니다. DB를 사용하려면 누구나 DB의 스키마를 정의해야 하지만..

XML을 사용하기 위해서는 DTD를 정의하기 보다는 기존에 정의된 DTD를 가져다가 사용하는 경우가 많이 발생하겠죠.

당연하죠.. 왜냐면 만약 누구나 자기 DTD만 정의해서 사용한다면 그 DTD가 가치를 지닐수 있을까요???

실제로 보면 DTD는 W3C나 기타 XML 관련 기관에서 발표되고 있고 표준화되고 있습니다.

그렇다면 우리의 공부 방향은 어디냐?? 물론 지금 이글을 보시는 분중에서는 DTD를 설계할 필요가 있으신 분도 있겠죠.

그러나 대부분은 DTD를 이해만 하면 될 겁니다. 그래서 오늘은 DTD와 XML에서 가장많이 사용되는

엘리먼트와 속성의 선언에 대해서만 알아보도록 하겠습니다.

DTD의 필요성

HTML에서 <font>라는 태그를 사용했을 때 우리는 <font>가 글자의 글꼴, 색깔, 크기등과 관련이 있다는 것을 잘 알고 있습니다.

우리가 이걸 어떻게 이해하느냐? 그것은 HTML DTD에 <font>태그는 이러이러한 것이고 속성으로는 뭘 가질수 있고..

등등의 정보가 표현되어 있기 때문입니다.

앞에서 설명했듯이 한 공동체에서 이러한 태그를 공유해 특정 부분을 정보화 할 경우 해당 정보의 가치는 더욱 높아질 것입니다.

왜냐하면 그러한 문서는 사람뿐만 아니라 컴퓨터도 쉽게 해석할 수 있고 공동체 내에서 자유롭게 변환이나 이동이 가능하기 때문입니다.

그렇다면 이러한 태그정보를 어떻게 공유할 수 있는가? 계속되는 같은 질문이죠. ^^:;

바로 DTD를 이용해서입니다. DTD의 개념은 XML 이전인 SGML에서부터 존재했습니다.

SGML에서 사용되던 DTD를 간략화 해서 XML에서 사용하게 되었지요. 그래서인지 DTD는 몇가지 문제점을 가지게 되었습니다.

첫째로 DTD에서 정의된 엘리먼트나 속성의 값이 가지게 될 타입을 정의할 수 없습니다.

즉, 정수형, 문자형, 날짜형.. 등등의 변수의 타입을 지정할 수 없는 것입니다. 그래서 DTD가 수행하는 중요한 기능중의 하나인

Validation Check(유효성검사)에서 보다 더 정밀하게 검사할 수 없게 되는 거지요.

둘째로는 DTD문서가 XML문서의 형태가 아니므로 XML 에디터 이외에 또다른 DTD 에디터를 필요로 한다는 것입니다.

이것은 XML과 DTD를 따로 배워야 한다는 문제도 발생시키죠.

그래서… 새롭게 XML 형식의 DTD를 정의하면서 타입도 지정할 수 있는 것이 등장했습니다.

그게 바로 XML Schema입니다. 참 공부하기 어렵죠.. 하나 해두면 또 하나 나오고.. 윽~~~

관심있으신 분은 W3C의 홈페이지에 가서 확인해 보시길 바랍니다. 여기서는 그냥 DTD 이야기만 하죠.

여러분이 알고 있는 HTML, WML, SMIL등등이 각각 자신의 DTD를 가지고 있는 XML 문서라고 보면 됩니다.

그럼 DTD의 구성요소를 하나씩 살펴보도록 할까요? 그러기 위해서 지난번 예제를 다시 사용하도록 하죠. <?xml version=“1.0”?>

<html>

   <head>

      XML Developer

   </head>

   <body>

     <img src=“xml.gif”/>

     <a href=“http://xmlis.pe.kr”>Hello World</a>

   </body>

</html>

엘리먼트의 선언

DTD에서 엘리먼트를 선언하는 형식은 다음과 같습니다. <!ELEMENT 이름 내용>

이름은 사용될 엘리먼트의 이름을 나타내고요. 내용은 자식으로 나타날 수 있는 것들을 적어주면 됩니다.

자 그럼 위의 예에서 <body>태그를 DTD에서 정의한다고 해보죠..

이름은 당연히 body가 되겠죠. 그리고 내용은 <body>와 <body>사이에 나타나는 것을 적어주면 됩니다.

그것이 바로 자식으로 나오는 것이죠.. 위에서 보면 <img>태그와 <a>태그가 나타나고 있죠.

그런데.. <img>나 <a>태그는 순서가 바뀌어도 되고, 또 여러번 나올수도 있다고 합시다.

<body><img…><img…><a…><img…></body>

뭐 이런형태로 나올수 있다고 가정해보죠.. 그런 경우 DTD 선언은 다음과 같이 할 수 있습니다.

이름 : body

내용 : img 또는 a가 여러번 발생 <!ELEMENT body (img|a)*>

위와 같은 형태로 작성이 가능합니다. 휴~~ 어렵죠.. 좀만 더 참고 보세요..

여기에서 어렵게 느끼는 이유는 못보던 것이 나와서입니다. |나 *같은 기호죠.. 다음 표를 참고하세요.

|

 엘리먼트 내용이 선택적으로 나타날 수 있다.

,

 엘리먼트 내용이 순서대로 나타나야 한다.

?

 엘리먼트 내용의 출현회수가 생략되거나 한번 나타난다.

*

 엘리먼트 내용의 출현회수가 생략되거나 여러번 나타난다.

+

 엘리먼트 내용의 출현회수가 최소 한번 이상 나타난다.

 엘리먼트 내용의 출현회수가 한번만 나타난다.

무슨 이야긴지 아시겠어요?? 혹 추가적인 설명이 필요하면 Q&A를 이용하시거나 저한테 멜 주세여..

자 이해하기 쉽도록 몇 개 더 해보죠.

<head>와 같은 걸 선언을 한다고 해보죠.. 이름은 head 내용은 어라?? 그냥 문자열이죠.

XML에서는 이러한 것을 #PCDATA라고 부릅니다. 파싱된 문자 데이터라나요?? 단순한 문자열로 인식하면 됩니다.

다만 그 문자열이 XML 문서을 읽을 때 파싱된다는 의미를 가지고 있습니다.

이름 : head

내용 : #PCDATA 가 한번만 출현한다. <!ELEMENT head (#PCDATA)>

뒤에 아무런 기호도 안 붙었죠. 위의 표에서 맨 마지막 것입니다.

그런데.. XML에서 <img>와 같은 태그는 내용을 포함하지 않는 엘리먼트라고 지난번에 설명했죠..

그걸 뭐라고 했죠??? 빈 엘리먼트(Empty Element)라 그랬죠.

문제는 그겁니다. 내용이 없는데 <img>는 어떻게 정의할 수 있을까?? <!ELEMENT 이름 EMPTY>

이렇게 하면 되겠죠.?? 적용시켜 보면

  <!ELEMENT img EMPTY>

휴~~ 엘리먼트에 대해서 이정도로 해두죠.. 어렵나요? 아마 첨 보는 분은 어려울 겁니다.

우리가 무엇이든 시작하려 할 때 가장 어려운 것은 용어라고 생각합니다. 머리에 들어오지 않는 용어가 문제죠.

그런 경우라면 자주 보세요.. 그 방법밖에는 달리 추천할 방법이 없네요.. T__T

속성의 선언

DTD에서 속성을 선언하는 형식은 다음과 같습니다. <!ATTLIST 엘리먼트이름 속성이름 속성형 (속성기본값)>

엘리먼트이름은 속성을 포함할 엘리먼트의 이름을 나타내고요. 속성이름은 속성의 = 왼쪽에 나타나는 이름이고요.

속성형은 속성이 가질수 있는 타입이고, 속성기본값은 속성의 필요여부등을 나타냅니다.

속성형과 속성기본값은 아래와 같이 정리할 수 있습니다.

속성형

선언형태

설명

문자열 속성

 CDATA

 일반적인 문자열

토큰 속성

 ID

 엘리먼트의 ID

 IDREF

 엘리먼트의 ID를 가리키는 포인터

 IDREFS

 하나이상의 IDREF들

 ENTITY

 외부 엔터티를 가리키는 포인터

 ENTITIES

 하나 이상의 엔터티 값들

 NMTOKEN

 토큰 문자열

 NMTOKENS

 하나 이상의 토큰 문자열들

열거 속성

 (값1 | 값2 | 값3 | …)

 선택 가능한 값을 목록으로 나타냄

속성의 기본값

설명

 #REQUIRED

 속성값이 반드시 필요한 속성이다.

 #IMPLIED

 속성값이 지정되지 않은 경우 XML 프로세서가 암시적으로 할당한다.

 #FIXED

 속성값이 DTD에 지정된 값과 반드시 같아야 한다.

여기까정입니다. 휴!~ 내가 읽어봐도 몬 소린지 하는지.. 쩝.

예를 하나만 들어보죠. 위에서 <img>태그가 있었습니다. <img>태그의 src 속성을 선언한다고 해보죠..

엘리먼트이름 : img

속성이름 : src

속성형 : 문자열 속성 (CDATA)

속성기본값 : 필요함

  <!ATTLIST img src CDATA #REQUIRED>

이런형태로 사용됩니다.

속성과 관련된 선언도 이정도로만 하겠습니다.

DTD에는 더 많은 구성요소가 있습니다. 하지만 일단 현 강좌가 기초이고 저의 실력도 삐리리 한 만큼 여기까지만 하겠습니다.

대신에 다음 강좌에서는 MS사이트에 예제로 나와있는 음반과 관련된 아주 간단한 DTD가 있습니다.

오늘 배운 엘리먼트와 속성만 나와 있죠. 그걸 가지고서 XML 문서를 만들어 가는 예제를 해보려구 합니다.

그것이 DTD와 관련된 구성요소를 계속 설명하는 것보다는 훨씬 나을 것 같아서요..

미니의 글은 다음과 같이 출처를 밝히시면 가져가서 활용할 수 있습니다.
[출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)]

4. DTD란?

  요새 냉방병에 눈병이 심하다고 하네요.. 저도 어째 눈이 좀 안좋아서 안과에 다녀왔네요.. 모두들 뜨거운 여름에 몸 조심하세요.. 그리고 제가 여기에 올리는 강좌는 초보자를 위한 글입니다. 첨 홈페이지를 제작할 때는 XML에 관심이 많아서 많은 분들이 찾아왔었지만, 지금은 XML의 기본사항은 마치 HTML처럼 널리 알려진 내용이 되었네요.. 그래도 또 다시 새롭게 시작하는 분들을 위해서 이 글을 정리해 놓습니다. *^^*

자 그럼 시작해 볼까요?

DTD는 XML 문서에 사용될 구성요소를 정의해 놓은 것으로 생각하면 됩니다. Document Type Definition

그런데 생각보다 DTD는 좀 어렵습니다. 만약 DTD를 설계해야 한다.. 그러면 더욱이 어려워지죠.

제 생각에 초기 DB를 설계하기 위해서 DBA가 필요했던 것처럼 XML에서 DTD를 설계하는 사람도 필요해지겠죠..

그러나 차이는 조금 있습니다. DB를 사용하려면 누구나 DB의 스키마를 정의해야 하지만..

XML을 사용하기 위해서는 DTD를 정의하기 보다는 기존에 정의된 DTD를 가져다가 사용하는 경우가 많이 발생하겠죠.

당연하죠.. 왜냐면 만약 누구나 자기 DTD만 정의해서 사용한다면 그 DTD가 가치를 지닐수 있을까요???

실제로 보면 DTD는 W3C나 기타 XML 관련 기관에서 발표되고 있고 표준화되고 있습니다.

그렇다면 우리의 공부 방향은 어디냐?? 물론 지금 이글을 보시는 분중에서는 DTD를 설계할 필요가 있으신 분도 있겠죠.

그러나 대부분은 DTD를 이해만 하면 될 겁니다. 그래서 오늘은 DTD와 XML에서 가장많이 사용되는

엘리먼트와 속성의 선언에 대해서만 알아보도록 하겠습니다.

DTD의 필요성

HTML에서 <font>라는 태그를 사용했을 때 우리는 <font>가 글자의 글꼴, 색깔, 크기등과 관련이 있다는 것을 잘 알고 있습니다.

우리가 이걸 어떻게 이해하느냐? 그것은 HTML DTD에 <font>태그는 이러이러한 것이고 속성으로는 뭘 가질수 있고..

등등의 정보가 표현되어 있기 때문입니다.

앞에서 설명했듯이 한 공동체에서 이러한 태그를 공유해 특정 부분을 정보화 할 경우 해당 정보의 가치는 더욱 높아질 것입니다.

왜냐하면 그러한 문서는 사람뿐만 아니라 컴퓨터도 쉽게 해석할 수 있고 공동체 내에서 자유롭게 변환이나 이동이 가능하기 때문입니다.

그렇다면 이러한 태그정보를 어떻게 공유할 수 있는가? 계속되는 같은 질문이죠. ^^:;

바로 DTD를 이용해서입니다. DTD의 개념은 XML 이전인 SGML에서부터 존재했습니다.

SGML에서 사용되던 DTD를 간략화 해서 XML에서 사용하게 되었지요. 그래서인지 DTD는 몇가지 문제점을 가지게 되었습니다.

첫째로 DTD에서 정의된 엘리먼트나 속성의 값이 가지게 될 타입을 정의할 수 없습니다.

즉, 정수형, 문자형, 날짜형.. 등등의 변수의 타입을 지정할 수 없는 것입니다. 그래서 DTD가 수행하는 중요한 기능중의 하나인

Validation Check(유효성검사)에서 보다 더 정밀하게 검사할 수 없게 되는 거지요.

둘째로는 DTD문서가 XML문서의 형태가 아니므로 XML 에디터 이외에 또다른 DTD 에디터를 필요로 한다는 것입니다.

이것은 XML과 DTD를 따로 배워야 한다는 문제도 발생시키죠.

그래서… 새롭게 XML 형식의 DTD를 정의하면서 타입도 지정할 수 있는 것이 등장했습니다.

그게 바로 XML Schema입니다. 참 공부하기 어렵죠.. 하나 해두면 또 하나 나오고.. 윽~~~

관심있으신 분은 W3C의 홈페이지에 가서 확인해 보시길 바랍니다. 여기서는 그냥 DTD 이야기만 하죠.

여러분이 알고 있는 HTML, WML, SMIL등등이 각각 자신의 DTD를 가지고 있는 XML 문서라고 보면 됩니다.

그럼 DTD의 구성요소를 하나씩 살펴보도록 할까요? 그러기 위해서 지난번 예제를 다시 사용하도록 하죠. <?xml version=“1.0”?>

<html>

   <head>

      XML Developer

   </head>

   <body>

     <img src=“xml.gif”/>

     <a href=“http://xmlis.pe.kr”>Hello World</a>

   </body>

</html>

엘리먼트의 선언

DTD에서 엘리먼트를 선언하는 형식은 다음과 같습니다. <!ELEMENT 이름 내용>

이름은 사용될 엘리먼트의 이름을 나타내고요. 내용은 자식으로 나타날 수 있는 것들을 적어주면 됩니다.

자 그럼 위의 예에서 <body>태그를 DTD에서 정의한다고 해보죠..

이름은 당연히 body가 되겠죠. 그리고 내용은 <body>와 <body>사이에 나타나는 것을 적어주면 됩니다.

그것이 바로 자식으로 나오는 것이죠.. 위에서 보면 <img>태그와 <a>태그가 나타나고 있죠.

그런데.. <img>나 <a>태그는 순서가 바뀌어도 되고, 또 여러번 나올수도 있다고 합시다.

<body><img…><img…><a…><img…></body>

뭐 이런형태로 나올수 있다고 가정해보죠.. 그런 경우 DTD 선언은 다음과 같이 할 수 있습니다.

이름 : body

내용 : img 또는 a가 여러번 발생 <!ELEMENT body (img|a)*>

위와 같은 형태로 작성이 가능합니다. 휴~~ 어렵죠.. 좀만 더 참고 보세요..

여기에서 어렵게 느끼는 이유는 못보던 것이 나와서입니다. |나 *같은 기호죠.. 다음 표를 참고하세요.

|

 엘리먼트 내용이 선택적으로 나타날 수 있다.

,

 엘리먼트 내용이 순서대로 나타나야 한다.

?

 엘리먼트 내용의 출현회수가 생략되거나 한번 나타난다.

*

 엘리먼트 내용의 출현회수가 생략되거나 여러번 나타난다.

+

 엘리먼트 내용의 출현회수가 최소 한번 이상 나타난다.

 엘리먼트 내용의 출현회수가 한번만 나타난다.

무슨 이야긴지 아시겠어요?? 혹 추가적인 설명이 필요하면 Q&A를 이용하시거나 저한테 멜 주세여..

자 이해하기 쉽도록 몇 개 더 해보죠.

<head>와 같은 걸 선언을 한다고 해보죠.. 이름은 head 내용은 어라?? 그냥 문자열이죠.

XML에서는 이러한 것을 #PCDATA라고 부릅니다. 파싱된 문자 데이터라나요?? 단순한 문자열로 인식하면 됩니다.

다만 그 문자열이 XML 문서을 읽을 때 파싱된다는 의미를 가지고 있습니다.

이름 : head

내용 : #PCDATA 가 한번만 출현한다. <!ELEMENT head (#PCDATA)>

뒤에 아무런 기호도 안 붙었죠. 위의 표에서 맨 마지막 것입니다.

그런데.. XML에서 <img>와 같은 태그는 내용을 포함하지 않는 엘리먼트라고 지난번에 설명했죠..

그걸 뭐라고 했죠??? 빈 엘리먼트(Empty Element)라 그랬죠.

문제는 그겁니다. 내용이 없는데 <img>는 어떻게 정의할 수 있을까?? <!ELEMENT 이름 EMPTY>

이렇게 하면 되겠죠.?? 적용시켜 보면

  <!ELEMENT img EMPTY>

휴~~ 엘리먼트에 대해서 이정도로 해두죠.. 어렵나요? 아마 첨 보는 분은 어려울 겁니다.

우리가 무엇이든 시작하려 할 때 가장 어려운 것은 용어라고 생각합니다. 머리에 들어오지 않는 용어가 문제죠.

그런 경우라면 자주 보세요.. 그 방법밖에는 달리 추천할 방법이 없네요.. T__T

속성의 선언

DTD에서 속성을 선언하는 형식은 다음과 같습니다. <!ATTLIST 엘리먼트이름 속성이름 속성형 (속성기본값)>

엘리먼트이름은 속성을 포함할 엘리먼트의 이름을 나타내고요. 속성이름은 속성의 = 왼쪽에 나타나는 이름이고요.

속성형은 속성이 가질수 있는 타입이고, 속성기본값은 속성의 필요여부등을 나타냅니다.

속성형과 속성기본값은 아래와 같이 정리할 수 있습니다.

속성형

선언형태

설명

문자열 속성

 CDATA

 일반적인 문자열

토큰 속성

 ID

 엘리먼트의 ID

 IDREF

 엘리먼트의 ID를 가리키는 포인터

 IDREFS

 하나이상의 IDREF들

 ENTITY

 외부 엔터티를 가리키는 포인터

 ENTITIES

 하나 이상의 엔터티 값들

 NMTOKEN

 토큰 문자열

 NMTOKENS

 하나 이상의 토큰 문자열들

열거 속성

 (값1 | 값2 | 값3 | …)

 선택 가능한 값을 목록으로 나타냄

속성의 기본값

설명

 #REQUIRED

 속성값이 반드시 필요한 속성이다.

 #IMPLIED

 속성값이 지정되지 않은 경우 XML 프로세서가 암시적으로 할당한다.

 #FIXED

 속성값이 DTD에 지정된 값과 반드시 같아야 한다.

여기까정입니다. 휴!~ 내가 읽어봐도 몬 소린지 하는지.. 쩝.

예를 하나만 들어보죠. 위에서 <img>태그가 있었습니다. <img>태그의 src 속성을 선언한다고 해보죠..

엘리먼트이름 : img

속성이름 : src

속성형 : 문자열 속성 (CDATA)

속성기본값 : 필요함

  <!ATTLIST img src CDATA #REQUIRED>

이런형태로 사용됩니다.

속성과 관련된 선언도 이정도로만 하겠습니다.

DTD에는 더 많은 구성요소가 있습니다. 하지만 일단 현 강좌가 기초이고 저의 실력도 삐리리 한 만큼 여기까지만 하겠습니다.

대신에 다음 강좌에서는 MS사이트에 예제로 나와있는 음반과 관련된 아주 간단한 DTD가 있습니다.

오늘 배운 엘리먼트와 속성만 나와 있죠. 그걸 가지고서 XML 문서를 만들어 가는 예제를 해보려구 합니다.

그것이 DTD와 관련된 구성요소를 계속 설명하는 것보다는 훨씬 나을 것 같아서요..

미니의 글은 다음과 같이 출처를 밝히시면 가져가서 활용할 수 있습니다.
[출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)]

3. XML의 구성요소

  벌써 세 번째 강좌네요. 강좌라고 하기에는 초라하기 그지없지만…~~

기초강좌를 마치고 나서는 MSSQL에서의 XML을 사용하는 방법을 할까 하네요. 예전에도 있었던 거죠.. 그리고 나서, 최근에 나온 Oracle의 XML DB에 대해서도 해볼까 하네요.. 아무래도 미니는 DB쪽에 좀더 호기심이 있네요.. ^^

오늘은 지난번에 간단하게 살펴본 XML 문서내에서 사용되는 구성요소들을 하나하나 설명하려고 합니다.

이것은 XML 스펙에 보면 잘 나와 있습니다. 한글로 된 XML 스펙이 많이 돌아다니고 있으니까요..한번씩 살펴 보세요.

  <?xml version=“1.0”?>

<html>

   <head>

      XML Developer

   </head>

   <body>

     <img src=“xml.gif”/>

     <a href=“http://www.word.pe.kr”>Hello World</a>

   </body>

</html>

위와 같은 문서도 분명히 XML 문서입니다. 위의 예제를 가지고 XML의 구성요소를 살펴보도록 하죠.

엘리먼트 (Element)

어떤 책에는 요소라고 번역되어 있기도 하더군요. 엘리먼트와 루트 엘리먼트에 대해서는 지난 강좌에서 설명을 하였죠.

복습차원에서 다시 한번 알아보면 위 문장에서 루트 엘리먼트는 <html>이 되겠죠.

루트 엘리먼트는 다른 엘리먼트를 모두 포함하고 있는 것을 말하죠.

그밖에 <head>, <body>, <a>와 같은 태그를 시작 태그라 하구요.</head>, </body>, </a> 같은 태그를 닫는 태그라 하죠

그리고 이러한 <head>..</head>, <body>…</body>, <a>…</a>를 엘리먼트라고 하죠.

그런데 HTML에서는 닫는태그를 빼먹어도 별 문제가 안됐어요.. 하지만  XML에서는 이러한 태그가 빠진다면 에러로 인식하게 됩니다.

반드시 모든 엘리먼트는 쌍으로 이루어져야 한다는 것이지요.

그렇다면 <br>, <img>와 같이 혼자서 존재할 수 있는 엘리먼트는 어떻게 해야 할까요?

XML 스펙에 따르면 위와 같은 것들은 엘리먼트 내에 내용을 포함하지 않은 것으로서 빈 엘리먼트 (Empty Element)라고 합니다.

이러한 빈 엘리먼트의 표기법은 <br></br>

<br/>

와 같은 두가지 형태로 표현 가능합니다. 일반적으로는 두 번째 방식으로 표현을 많이 하더군요.

위의 예제에서도 <img src=“xml.gif”/>와 같은 표현을 볼 수 있을 것입니다.

마지막으로 엘리먼트에서 고려해야 할 사항은 시작태그와 끝태그의 엘리먼트 이름이 같아야 한다는 것입니다.

만약 다음과 같이 엘리먼트가 사용되었다면 잘못된 것입니다. <head>XML Developer</tail>

속성 (Attribute)

위의 예에서 <img>태그를 살펴보면, <img>태그는 그림을 나타내고 그림의 소스는 xml.gif라는 것을 우리는 알 수 있습니다.

만약 <img/>와 같이 혼자만 사용되었다면 아무런 의미를 가질 수 없게 될 것입니다.

HTML에서 처럼 이와 같은 것을 속성이라고 부릅니다. 엘리먼트는 속성을 포함할 수 가 있는 거지요.

속성은 문서를 간결하고 해석하기 쉽도록 만들어줍니다.

만약 속성이 없었다면 <img>태그를 다음과 같이 표현할 수도 있을 것입니다. <img>

    <src>xml.gif</src>

    <align>center</align>

</img>

그러나 속성을 활용하면 <img src=“xml.gif” align=“center”/>

과 같은 형태로 나타낼 수 있습니다.

첫 번째 형태도 잘못된 것은 아닙니다.  그러나 두 번째의 경우가 보다 간결하고 해석하기도 용이한 형태로 이루어져 있지요..

실제로 DTD를 설계할 기회가 생긴다면 저렇게 자식 엘리먼트로 넣을 것인가? 아니면 속성으로 처리할 것인가를 가지고 많은 고민을 하게 됩니다.

MS-SQL의 경우 XML로 DB에서 데이터를 가져올 때 이 속성을 활용하고 있습니다.

속성에서 주의해야 할 것이 하나 있습니다. HTML에서는 다음과 같은 표기법도 허용되었습니다.

<img src=xml.gif>

그러나 XML에서 속성값은 반드시 “ 나 ‘로 둘러쌓여 있어야 합니다. 만약 그렇지 않다면 Well-formed한 문서가 되지 못하죠.

즉, 이러한 형태로 사용되어야 한다는 것입니다. <img src="xml.gif”>

<img src=’xml.gif’>

처리명령 (Processing Instruction)

<? 와 ?>사이에 표현되고 특정 응용 프로그램에 대해 처리할 정보나 명령을 가리키는 역할을 합니다.

대표적으로 XSL을 선언하는 부분을 예로 들수 있습니다. <?xml:stylesheet type=“text/xsl” href=“메모.xsl”?>

위와 같이 적용되면 XML의 스타일쉬트를 지정하고 타입은 text/xsl이며 소스는 메모.xsl에 있다

라고 해석할 수 있는 것이지요. 이렇게 해석할 수 있도록 제공하는 것을 처리명령이라고 합니다.

<?xml version=“1.0”?>

와 같은 것도 처리명령이라고 할 수 있습니다. 형태가 처리명령과 같지요. 여기서는 XML 버전 1.0을 사용한다라고 가리키고 있습니다.

그런데 XML에서는 이와 같은 것을 특별히 XML 선언이라고 부릅니다. 모든 XML 문서의 시작은 XML 선언으로 해야 하지요.

위 예제에서는 사용되지 않았지만 몇가지 중요한 XML의 구성요소를 추가로 설명하도록 하겠습니다.

엔터티 (Enitity)

< > & 와 같은 것들을 HTML에서 여러번 보았을 것입니다. 이것은 각각 < > &를 나타내지요.

이러한 것을 엔터티라고 합니다. 엔터티의 가장 일반적은 형태는 문자열을 특정 문자열로 대체하는 것이라고 할 수 있습니다.

예를 들어 만약 DTD문서에 다음과 같이 선언되어 있다면

<!ENTITY xml “eXtensible Markup Language”>

이것을 XML 문서 내에서 사용할 때는 &xml;과 같이 사용합니다.

그럼 XML 프로세서는 &xml; 이 부분을 eXtensible Markup Lanaguage로 변환하여 사용하게 됩니다.

또한 엔터티는 이미지와 같은 Binary 데이터나 비 ASCII 문자를 대체하기 위해서도 사용된다고 합니다.

그리고 이러한 엔터티를 DTD에서도 사용할 수 있는데요. 그러한 것을 특별히 파라미터 엔터티라고 하기도 합니다.

대략적으로 엔터티에 대한 설명을 했는데요.. 솔직히 XML 구성요소에서 가장 설명하기가 난해한 것이라고 생각됩니다.

범위도 넘 넓구요.. 엔터티는 잘 사용하면 무지 편한데.. 개념이 도통 어려워서.. 제가 공력이 쌓이면 엔터티에 대한 글을 좀더 상세히 쓰도록 하죠..

주석 (Comment)

주석은 <!– 와 –> 사이에 정의되고요. HTML에서와 같은 형태와 의미를 가지고 있습니다.

즉, 문서 자체에서 의미를 가지지 않고요. XML 프로세서가 문서를 해석할 때도 건너 뛰게 되지요.

그러므로 실제 XML 문서에 대한 설명을 위해서 주로 사용하게 되지요. <!– 이부분은 <head>와 <body>를 위한 주석입니다. –>

CDATA 섹션 (CDATA Section)

모든 문자를 마크업이나 태그로 인식하지 않고 일반 문자로 인식하도록 할 수 있는 표기법입니다.

만약 <greeting>Hello World</greeting>

과 같은 형태로 사용하면 이것은 하나의 <greeting>이라는 엘리먼트가 되구요.. 그 엘리먼트의 내용이 Hello World가 되죠.

하지만 만약 전체를 문자열로서 사용하고 싶다면??

앞에서 엔터티란 것이 있었죠.. 엔터티를 활용해서 표현할 수도 있습니다.  그러나 모두 엔터티로 처리하게에는 좀 부담스럽죠.

그래서 등장한 것이 바로 CDATA섹션입니다.

  <![CDATA[

   <greeting>Hello World</greeting>

]]>

이렇게 사용하면 <greeting>Hello World</greeting>를 모두 문자열로 인식하게 됩니다.

XSL과 같은 문서에서 자바스크립트를 많이 사용하거든요.. 그때 이 CDATA 섹션을 많이 사용하게 됩니다.

여기까지 XML의 구성요소를 설명하였습니다. 함 정리 해 볼까요?

구성요소                                         설명

엘리먼트(Element)                        마크업 태그와 그안에 포함된 내용

빈 엘리먼트 (Empty Element)       데이터와 같은 내용을 포함하지 않은 엘리먼트

루트 엘리먼트 (Root Element)      문서내 모든 엘리먼트와 내용을 포함하고 있는 XML 문서의 엘리먼트

속성 (Attribute)                 엘리먼트에 포함되어 추가적인 정보를 제공

엔터티 (Entity)                  텍스트, Binary 데이터, 비 ASCII 문자를 저장하는데 사용

처리명령 (Processing Instruction) 전체 문서나 문서의 일부를 처리하는 응용 프로그램과 연결해 주는 명령어

주석 (Comment)                   XML 프로세서가 해석하지 않는 설명문

CDATA 섹션 (CDATA Section)       특수한 문자를 일반 텍스트로 인식하도록 하는 표기법

미니의 글은 다음과 같이 출처를 밝히시면 가져가서 활용할 수 있습니다.
[출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)]

3. XML의 구성요소

  벌써 세 번째 강좌네요. 강좌라고 하기에는 초라하기 그지없지만…~~

기초강좌를 마치고 나서는 MSSQL에서의 XML을 사용하는 방법을 할까 하네요. 예전에도 있었던 거죠.. 그리고 나서, 최근에 나온 Oracle의 XML DB에 대해서도 해볼까 하네요.. 아무래도 미니는 DB쪽에 좀더 호기심이 있네요.. ^^

오늘은 지난번에 간단하게 살펴본 XML 문서내에서 사용되는 구성요소들을 하나하나 설명하려고 합니다.

이것은 XML 스펙에 보면 잘 나와 있습니다. 한글로 된 XML 스펙이 많이 돌아다니고 있으니까요..한번씩 살펴 보세요.

  <?xml version=“1.0”?>

<html>

   <head>

      XML Developer

   </head>

   <body>

     <img src=“xml.gif”/>

     <a href=“http://www.word.pe.kr”>Hello World</a>

   </body>

</html>

위와 같은 문서도 분명히 XML 문서입니다. 위의 예제를 가지고 XML의 구성요소를 살펴보도록 하죠.

엘리먼트 (Element)

어떤 책에는 요소라고 번역되어 있기도 하더군요. 엘리먼트와 루트 엘리먼트에 대해서는 지난 강좌에서 설명을 하였죠.

복습차원에서 다시 한번 알아보면 위 문장에서 루트 엘리먼트는 <html>이 되겠죠.

루트 엘리먼트는 다른 엘리먼트를 모두 포함하고 있는 것을 말하죠.

그밖에 <head>, <body>, <a>와 같은 태그를 시작 태그라 하구요.</head>, </body>, </a> 같은 태그를 닫는 태그라 하죠

그리고 이러한 <head>..</head>, <body>…</body>, <a>…</a>를 엘리먼트라고 하죠.

그런데 HTML에서는 닫는태그를 빼먹어도 별 문제가 안됐어요.. 하지만  XML에서는 이러한 태그가 빠진다면 에러로 인식하게 됩니다.

반드시 모든 엘리먼트는 쌍으로 이루어져야 한다는 것이지요.

그렇다면 <br>, <img>와 같이 혼자서 존재할 수 있는 엘리먼트는 어떻게 해야 할까요?

XML 스펙에 따르면 위와 같은 것들은 엘리먼트 내에 내용을 포함하지 않은 것으로서 빈 엘리먼트 (Empty Element)라고 합니다.

이러한 빈 엘리먼트의 표기법은 <br></br>

<br/>

와 같은 두가지 형태로 표현 가능합니다. 일반적으로는 두 번째 방식으로 표현을 많이 하더군요.

위의 예제에서도 <img src=“xml.gif”/>와 같은 표현을 볼 수 있을 것입니다.

마지막으로 엘리먼트에서 고려해야 할 사항은 시작태그와 끝태그의 엘리먼트 이름이 같아야 한다는 것입니다.

만약 다음과 같이 엘리먼트가 사용되었다면 잘못된 것입니다. <head>XML Developer</tail>

속성 (Attribute)

위의 예에서 <img>태그를 살펴보면, <img>태그는 그림을 나타내고 그림의 소스는 xml.gif라는 것을 우리는 알 수 있습니다.

만약 <img/>와 같이 혼자만 사용되었다면 아무런 의미를 가질 수 없게 될 것입니다.

HTML에서 처럼 이와 같은 것을 속성이라고 부릅니다. 엘리먼트는 속성을 포함할 수 가 있는 거지요.

속성은 문서를 간결하고 해석하기 쉽도록 만들어줍니다.

만약 속성이 없었다면 <img>태그를 다음과 같이 표현할 수도 있을 것입니다. <img>

    <src>xml.gif</src>

    <align>center</align>

</img>

그러나 속성을 활용하면 <img src=“xml.gif” align=“center”/>

과 같은 형태로 나타낼 수 있습니다.

첫 번째 형태도 잘못된 것은 아닙니다.  그러나 두 번째의 경우가 보다 간결하고 해석하기도 용이한 형태로 이루어져 있지요..

실제로 DTD를 설계할 기회가 생긴다면 저렇게 자식 엘리먼트로 넣을 것인가? 아니면 속성으로 처리할 것인가를 가지고 많은 고민을 하게 됩니다.

MS-SQL의 경우 XML로 DB에서 데이터를 가져올 때 이 속성을 활용하고 있습니다.

속성에서 주의해야 할 것이 하나 있습니다. HTML에서는 다음과 같은 표기법도 허용되었습니다.

<img src=xml.gif>

그러나 XML에서 속성값은 반드시 “ 나 ‘로 둘러쌓여 있어야 합니다. 만약 그렇지 않다면 Well-formed한 문서가 되지 못하죠.

즉, 이러한 형태로 사용되어야 한다는 것입니다. <img src="xml.gif”>

<img src=’xml.gif’>

처리명령 (Processing Instruction)

<? 와 ?>사이에 표현되고 특정 응용 프로그램에 대해 처리할 정보나 명령을 가리키는 역할을 합니다.

대표적으로 XSL을 선언하는 부분을 예로 들수 있습니다. <?xml:stylesheet type=“text/xsl” href=“메모.xsl”?>

위와 같이 적용되면 XML의 스타일쉬트를 지정하고 타입은 text/xsl이며 소스는 메모.xsl에 있다

라고 해석할 수 있는 것이지요. 이렇게 해석할 수 있도록 제공하는 것을 처리명령이라고 합니다.

<?xml version=“1.0”?>

와 같은 것도 처리명령이라고 할 수 있습니다. 형태가 처리명령과 같지요. 여기서는 XML 버전 1.0을 사용한다라고 가리키고 있습니다.

그런데 XML에서는 이와 같은 것을 특별히 XML 선언이라고 부릅니다. 모든 XML 문서의 시작은 XML 선언으로 해야 하지요.

위 예제에서는 사용되지 않았지만 몇가지 중요한 XML의 구성요소를 추가로 설명하도록 하겠습니다.

엔터티 (Enitity)

< > & 와 같은 것들을 HTML에서 여러번 보았을 것입니다. 이것은 각각 < > &를 나타내지요.

이러한 것을 엔터티라고 합니다. 엔터티의 가장 일반적은 형태는 문자열을 특정 문자열로 대체하는 것이라고 할 수 있습니다.

예를 들어 만약 DTD문서에 다음과 같이 선언되어 있다면

<!ENTITY xml “eXtensible Markup Language”>

이것을 XML 문서 내에서 사용할 때는 &xml;과 같이 사용합니다.

그럼 XML 프로세서는 &xml; 이 부분을 eXtensible Markup Lanaguage로 변환하여 사용하게 됩니다.

또한 엔터티는 이미지와 같은 Binary 데이터나 비 ASCII 문자를 대체하기 위해서도 사용된다고 합니다.

그리고 이러한 엔터티를 DTD에서도 사용할 수 있는데요. 그러한 것을 특별히 파라미터 엔터티라고 하기도 합니다.

대략적으로 엔터티에 대한 설명을 했는데요.. 솔직히 XML 구성요소에서 가장 설명하기가 난해한 것이라고 생각됩니다.

범위도 넘 넓구요.. 엔터티는 잘 사용하면 무지 편한데.. 개념이 도통 어려워서.. 제가 공력이 쌓이면 엔터티에 대한 글을 좀더 상세히 쓰도록 하죠..

주석 (Comment)

주석은 <!– 와 –> 사이에 정의되고요. HTML에서와 같은 형태와 의미를 가지고 있습니다.

즉, 문서 자체에서 의미를 가지지 않고요. XML 프로세서가 문서를 해석할 때도 건너 뛰게 되지요.

그러므로 실제 XML 문서에 대한 설명을 위해서 주로 사용하게 되지요. <!– 이부분은 <head>와 <body>를 위한 주석입니다. –>

CDATA 섹션 (CDATA Section)

모든 문자를 마크업이나 태그로 인식하지 않고 일반 문자로 인식하도록 할 수 있는 표기법입니다.

만약 <greeting>Hello World</greeting>

과 같은 형태로 사용하면 이것은 하나의 <greeting>이라는 엘리먼트가 되구요.. 그 엘리먼트의 내용이 Hello World가 되죠.

하지만 만약 전체를 문자열로서 사용하고 싶다면??

앞에서 엔터티란 것이 있었죠.. 엔터티를 활용해서 표현할 수도 있습니다.  그러나 모두 엔터티로 처리하게에는 좀 부담스럽죠.

그래서 등장한 것이 바로 CDATA섹션입니다.

  <![CDATA[

   <greeting>Hello World</greeting>

]]>

이렇게 사용하면 <greeting>Hello World</greeting>를 모두 문자열로 인식하게 됩니다.

XSL과 같은 문서에서 자바스크립트를 많이 사용하거든요.. 그때 이 CDATA 섹션을 많이 사용하게 됩니다.

여기까지 XML의 구성요소를 설명하였습니다. 함 정리 해 볼까요?

구성요소                                         설명

엘리먼트(Element)                        마크업 태그와 그안에 포함된 내용

빈 엘리먼트 (Empty Element)       데이터와 같은 내용을 포함하지 않은 엘리먼트

루트 엘리먼트 (Root Element)      문서내 모든 엘리먼트와 내용을 포함하고 있는 XML 문서의 엘리먼트

속성 (Attribute)                 엘리먼트에 포함되어 추가적인 정보를 제공

엔터티 (Entity)                  텍스트, Binary 데이터, 비 ASCII 문자를 저장하는데 사용

처리명령 (Processing Instruction) 전체 문서나 문서의 일부를 처리하는 응용 프로그램과 연결해 주는 명령어

주석 (Comment)                   XML 프로세서가 해석하지 않는 설명문

CDATA 섹션 (CDATA Section)       특수한 문자를 일반 텍스트로 인식하도록 하는 표기법

미니의 글은 다음과 같이 출처를 밝히시면 가져가서 활용할 수 있습니다.
[출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)]

2. XML의 시작

  무더운 8월입니다. ^^ 이 글을 첨 썼던 때가 2000년 12월이니까.. 와우.. 많은 시간이 흘렀네요.. 그때도 시간이 참 빠르다는 표현을 했던것 같은데~~

어느 사이트를 돌아다니다 보면 제 강좌를 복사해서 사용하는데도 있더라구요. 그래도 별 상관은 없지만.. 출처는 밝혀주심이 좋겠네요. 지난번만큼의 강좌를 다 수정해서 올리는데 약간의 시간이 걸릴거고요. 그리고 나서는 새로운 강좌를 시작할 겁니다.

자 그럼 오늘 강좌를 시작해 볼까요.. 소스는 강좌소스 에 보면 있습니다. 거기로 가서 받아가시기 바랍니다.

간단한 XML 예제

  XML 문서는 DTD의 포함 여부에 따라서 Well-formed 문서와 Valid문서로 나눌 수 있습니다.

먼저 새로운 단어를 분석해 볼까요?? Well-formed란 잘 구성되었다고 해석을 많이 하더군요.

잘 구성되었다?? XML 스펙을 보면 XML 문서가 갖추어야 할 조건들을 설명하고 있습니다.

그 조건을 잘 지키고 있다면 Well-formed라고 하는 것이지요.

참고로 첨 XML 스펙을 보았을 때 머리가 돌아 버리는 줄 알았습니다. 완전히 암호문이더군요.

다행히 그당시 제가 학교에서 컴파일러를 배우고 있던 때라 그나마 다행이었죠..

그렇다면 Valid 문서란 무엇을 나타내느냐?? 기본적인 조건에 무언가를 하나 더 지키고 있다는 것이겠죠..

그게 바로 DTD라는 겁니다. DTD란 Document Type Definition의 약자로서 문서의 타입을 정의하는 것을 말합니다.

혹시 HTML 문서에서 한번쯤 이런 것 보지 못했나요??

<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.0//EN”>

못봤나요?? 다시 한번 HTML소스를 보세요.. 직접 타이핑 한 것 말구 에디터로 만든 걸 보면 반드시 들어가 있을 겁니다.

어쨌든 그게 바로 DTD입니다. 문서의 타입은 정의해서 어디에 쓰는 걸까요?

HTML에서 기본적으로 모든 시작은 <HTML>로 합니다. 그죠..

그리고 <HTML>내에서 <HEAD>와 <BODY>가 나옵니다.

즉,,

<HTML>

  <HEAD>

  ….

  </HEAD>

  <BODY>

  ….

  

</HTML>

기본 구조가 위와 같죠.. 자 제가 이걸 어떻게 알았을까요… 당연히 HTML책이나 강좌에 나와 있죠..

그럼 어떻게 모든 사람들이 저렇게 사용할까요? 그건 바로 DTD에 있습니다.

DTD에 그렇게 하라구 나와 있거든요.. 즉 사용자는 DTD에 나온 대로만 쓰면 됩니다.

그런데 때로는 <HEAD>를 빼먹고 안쓰는 사람들 많죠..

HTML은 그래도 인정했었지만 XML에서는 유효한 문서가 아니라고 하죠.. (Non-Valid 문서)

즉, DTD가 있으면 반드시 그대로 해야 한다는 거죠.. 물론 빼먹을 수 있도록 DTD에서 선언할 수도 있지만요..

음.. 보통 질문을 많이 하는 내용중의 하나가 “Document Type Definition"과 "Document Type Declaration"의 차이를 물어보는 겁니다.

보통 DTD 문서를 "Document Type Definition"이라고 하지요..

그렇다면 "Document Type Declaration"은 무엇일까요?

이것은 XML 문서 내에서 <DOCTYPE> 요소를 사용해 DTD 문서를 선언하는 것을 말합니다.

즉, XML 문서가

<xml version=‘1.0’>

<DOCTYPE aaa system..>

<aaa>

이런 형태로 되어 있을때, <DOCTYPE>으로 선언한 부분을 "Document Type Declaration"이라고 하는 것이죠..  ^^

그러면, 다음 그림은 우리가 최종적으로 보게 될 XML문서의 내용입니다.

image

그럼 위와 같이 나타내지는 메모.xml의 내용을 살펴볼까요!!

<?xml version="1.0” encoding=“euc-kr”?>
<?xml:stylesheet type=“text/xsl” href=“메모.xsl”?>
<!DOCTYPE 메모 SYSTEM “메모.dtd” >
<메모>
        <헤더>
                <송신자>&me;</송신자>
                <수신자>홍길동</수신자>
                <수신자>이순신</수신자>
                <날짜>
                        <년>2000</년>
                        <월>12</월>
                        <일>9</일>
                </날짜>
                <제목>XML의 기본개념 과 활용방안</제목>
                <키워드>XML</키워드>
                <키워드>문서구조</키워드>
                <키워드>DTD</키워드>
        </헤더>
        <텍스트>
                <내용>
                        이글은 XML과 관련된 연재입니다. 다음과 같은 차례로 이루어져 있습니다.
                </내용>
                <목록 타입=“도형”>
                        <항목>XML이란?</항목>
                        <항목>XML 문서의 처리 – 엘리먼트, 속성, 엔터티..</항목>
                        <항목>XML, XSL 그리고 웹브라우저</항목>
                        <항목>XML 응용 분야 및 발전 가능성</항목>
                </목록>
        </텍스트>
</메모>

위 XML 문서의 내용을 하나씩 설명해 드리도록 하겠습니다.

첨이 아니신 분은 여기를 건너 뛰어도 될 것 같습니다.

  <?xml version=“1.0” encoding=“euc-kr”?>

XML 선언이라는 부분입니다. 이 문서가 XML이라는 것을 가르쳐주고 있죠. 실제로 WML이나 SMIL과 같은 언어도

이러한 선언으로 시작하는 것을 확인해 볼 수 있을 겁니다.

version이란 현재 XML 스펙 1.0을 지원한다는 것이구요. encoding은 사용할 언어를 지정합니다.

우리는 euc-kr이나 ksc5601로 지정하면 한글을 사용할 수 있습니다.

만약 이부분이 빠지면 당근 한글을 사용하지 못하게 되지요….

  <?xml:stylesheet type=“text/xsl” href=“메모.xsl”?>

XML 문서에서 <? … ?> 이런 형태로 사용되는 것을 PI라고 부릅니다. 우리말로는 처리명령이라고 하더군요.

그중에서 가장 많이 사용될 PI인데요.. 스타일쉬트를 지정하는 것입니다.

앞에서 XML은 문서의 구조를 나타내는 부분과 포맷팅, 즉 보여주는 부분이 서로 다르다고 하였죠.

바로 그 포맷팅을 담당하는 것을 가리키는 부분입니다.

만약 이부분을 빼고 문서를 IE에서 볼 경우 특정 포맷이 정해지지 않았기에 그냥 문서의 내용이 보여집니다.

한번 그 부분을 삭제하고 브라우저에서 읽어 보세요.. 아까하고는 다르지요??

  <!DOCTYPE 메모 SYSTEM “메모.dtd” >

위에서 DTD를 포함하고 있는 문서는 Valid 문서이다 라고 설명했죠. 그러한 DTD를 지정하는 부분입니다. 이 부분이 바로 “Document Type Declaration"이죠.

간단히 의미를 해석하자면 System 즉, Local PC에 있는 메모.dtd란 파일을 DTD정의로 사용하구요.

그 메모.dtd의 루트 엘리먼트가 "메모"라는 것입니다.

엉~~ 루트 엘리먼트가 모야???

먼저 엘리먼트가 무엇인지부터 살펴보죠.. 위의 XML문서에서 <메모><헤더><텍스트>와 같은 것이 보이죠.

이런 것을 엘리먼트라 합니다. 우리가 HTML에서 태그라고 했던 것 있죠.. 그걸 생각하면 쉬울 겁니다.

하지만 XML에서는

<헤더>을 시작 태그라 하구요. </헤더>를 닫는 태그라고 합니다.

그리고 <헤더>…</헤더>까지를 엘리먼트라고 하지요..

좀 이해가 되셨어요..

그리고 그중에서 특히 <메모>와 같이 가장 먼저 사용된 엘리먼트를 루트 엘리먼트라고 합니다.

문서를 트리구조로 만들 때 가장 위에 나타나게 되겠지요..

그럼 HTML에서 루트엘리먼트는 뭘까요??

당근 <html>이겠죠… 쿠쿠쿠~~ 쉽죠!!

  <송신자>&me;</송신자>

<송신자> 엘리먼트의 내용이 &me;라고 되어 있습니다. 이걸 엔터티 참조라고 하거든요.

실제 내용을 보면 이부분이 "김종민"이라고 바뀌어 있죠. 음~~ HTML에서 & 또는  정도를 생각하시면 될 것 같네요.

엔터티는 XML에서 좀더 복잡하고 다양하게 사용되지만 일단 간단한 문자열 대치정도로 생각해 두세요..

  <목록 타입="도형”>

여기에서 타입=“도형"이란 부분이 있죠.. 이것을 속성 노드라고 합니다. "타입"은 속성이름이구요.

"도형"은 속성값이 되지요.

HTML에서 < a href="xmlis.pe.kr”>이 부분을 생각하면 금방 이해하실 수 있을 겁니다.

자! 오늘은 XML 문서의 예제를 보구요. 간단한 용어 설명을 했네요.

다음엔 XML의 구성요소에 대해서 좀더 자세히 살펴보도록 하죠..

자~ 그럼 더운 여름날 휴가철에 모두들 즐겁게 보내세요… 2002/08/02 From 미니

미니의 글은 다음과 같이 출처를 밝히시면 가져가서 활용할 수 있습니다.
[출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)]

2. XML의 시작

  무더운 8월입니다. ^^ 이 글을 첨 썼던 때가 2000년 12월이니까.. 와우.. 많은 시간이 흘렀네요.. 그때도 시간이 참 빠르다는 표현을 했던것 같은데~~

어느 사이트를 돌아다니다 보면 제 강좌를 복사해서 사용하는데도 있더라구요. 그래도 별 상관은 없지만.. 출처는 밝혀주심이 좋겠네요. 지난번만큼의 강좌를 다 수정해서 올리는데 약간의 시간이 걸릴거고요. 그리고 나서는 새로운 강좌를 시작할 겁니다.

자 그럼 오늘 강좌를 시작해 볼까요.. 소스는 강좌소스 에 보면 있습니다. 거기로 가서 받아가시기 바랍니다.

간단한 XML 예제

  XML 문서는 DTD의 포함 여부에 따라서 Well-formed 문서와 Valid문서로 나눌 수 있습니다.

먼저 새로운 단어를 분석해 볼까요?? Well-formed란 잘 구성되었다고 해석을 많이 하더군요.

잘 구성되었다?? XML 스펙을 보면 XML 문서가 갖추어야 할 조건들을 설명하고 있습니다.

그 조건을 잘 지키고 있다면 Well-formed라고 하는 것이지요.

참고로 첨 XML 스펙을 보았을 때 머리가 돌아 버리는 줄 알았습니다. 완전히 암호문이더군요.

다행히 그당시 제가 학교에서 컴파일러를 배우고 있던 때라 그나마 다행이었죠..

그렇다면 Valid 문서란 무엇을 나타내느냐?? 기본적인 조건에 무언가를 하나 더 지키고 있다는 것이겠죠..

그게 바로 DTD라는 겁니다. DTD란 Document Type Definition의 약자로서 문서의 타입을 정의하는 것을 말합니다.

혹시 HTML 문서에서 한번쯤 이런 것 보지 못했나요??

<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.0//EN”>

못봤나요?? 다시 한번 HTML소스를 보세요.. 직접 타이핑 한 것 말구 에디터로 만든 걸 보면 반드시 들어가 있을 겁니다.

어쨌든 그게 바로 DTD입니다. 문서의 타입은 정의해서 어디에 쓰는 걸까요?

HTML에서 기본적으로 모든 시작은 <HTML>로 합니다. 그죠..

그리고 <HTML>내에서 <HEAD>와 <BODY>가 나옵니다.

즉,,

<HTML>

  <HEAD>

  ….

  </HEAD>

  <BODY>

  ….

  

</HTML>

기본 구조가 위와 같죠.. 자 제가 이걸 어떻게 알았을까요… 당연히 HTML책이나 강좌에 나와 있죠..

그럼 어떻게 모든 사람들이 저렇게 사용할까요? 그건 바로 DTD에 있습니다.

DTD에 그렇게 하라구 나와 있거든요.. 즉 사용자는 DTD에 나온 대로만 쓰면 됩니다.

그런데 때로는 <HEAD>를 빼먹고 안쓰는 사람들 많죠..

HTML은 그래도 인정했었지만 XML에서는 유효한 문서가 아니라고 하죠.. (Non-Valid 문서)

즉, DTD가 있으면 반드시 그대로 해야 한다는 거죠.. 물론 빼먹을 수 있도록 DTD에서 선언할 수도 있지만요..

음.. 보통 질문을 많이 하는 내용중의 하나가 “Document Type Definition"과 "Document Type Declaration"의 차이를 물어보는 겁니다.

보통 DTD 문서를 "Document Type Definition"이라고 하지요..

그렇다면 "Document Type Declaration"은 무엇일까요?

이것은 XML 문서 내에서 <DOCTYPE> 요소를 사용해 DTD 문서를 선언하는 것을 말합니다.

즉, XML 문서가

<xml version=‘1.0’>

<DOCTYPE aaa system..>

<aaa>

이런 형태로 되어 있을때, <DOCTYPE>으로 선언한 부분을 "Document Type Declaration"이라고 하는 것이죠..  ^^

그러면, 다음 그림은 우리가 최종적으로 보게 될 XML문서의 내용입니다.

image

그럼 위와 같이 나타내지는 메모.xml의 내용을 살펴볼까요!!

<?xml version="1.0” encoding=“euc-kr”?>
<?xml:stylesheet type=“text/xsl” href=“메모.xsl”?>
<!DOCTYPE 메모 SYSTEM “메모.dtd” >
<메모>
        <헤더>
                <송신자>&me;</송신자>
                <수신자>홍길동</수신자>
                <수신자>이순신</수신자>
                <날짜>
                        <년>2000</년>
                        <월>12</월>
                        <일>9</일>
                </날짜>
                <제목>XML의 기본개념 과 활용방안</제목>
                <키워드>XML</키워드>
                <키워드>문서구조</키워드>
                <키워드>DTD</키워드>
        </헤더>
        <텍스트>
                <내용>
                        이글은 XML과 관련된 연재입니다. 다음과 같은 차례로 이루어져 있습니다.
                </내용>
                <목록 타입=“도형”>
                        <항목>XML이란?</항목>
                        <항목>XML 문서의 처리 – 엘리먼트, 속성, 엔터티..</항목>
                        <항목>XML, XSL 그리고 웹브라우저</항목>
                        <항목>XML 응용 분야 및 발전 가능성</항목>
                </목록>
        </텍스트>
</메모>

위 XML 문서의 내용을 하나씩 설명해 드리도록 하겠습니다.

첨이 아니신 분은 여기를 건너 뛰어도 될 것 같습니다.

  <?xml version=“1.0” encoding=“euc-kr”?>

XML 선언이라는 부분입니다. 이 문서가 XML이라는 것을 가르쳐주고 있죠. 실제로 WML이나 SMIL과 같은 언어도

이러한 선언으로 시작하는 것을 확인해 볼 수 있을 겁니다.

version이란 현재 XML 스펙 1.0을 지원한다는 것이구요. encoding은 사용할 언어를 지정합니다.

우리는 euc-kr이나 ksc5601로 지정하면 한글을 사용할 수 있습니다.

만약 이부분이 빠지면 당근 한글을 사용하지 못하게 되지요….

  <?xml:stylesheet type=“text/xsl” href=“메모.xsl”?>

XML 문서에서 <? … ?> 이런 형태로 사용되는 것을 PI라고 부릅니다. 우리말로는 처리명령이라고 하더군요.

그중에서 가장 많이 사용될 PI인데요.. 스타일쉬트를 지정하는 것입니다.

앞에서 XML은 문서의 구조를 나타내는 부분과 포맷팅, 즉 보여주는 부분이 서로 다르다고 하였죠.

바로 그 포맷팅을 담당하는 것을 가리키는 부분입니다.

만약 이부분을 빼고 문서를 IE에서 볼 경우 특정 포맷이 정해지지 않았기에 그냥 문서의 내용이 보여집니다.

한번 그 부분을 삭제하고 브라우저에서 읽어 보세요.. 아까하고는 다르지요??

  <!DOCTYPE 메모 SYSTEM “메모.dtd” >

위에서 DTD를 포함하고 있는 문서는 Valid 문서이다 라고 설명했죠. 그러한 DTD를 지정하는 부분입니다. 이 부분이 바로 “Document Type Declaration"이죠.

간단히 의미를 해석하자면 System 즉, Local PC에 있는 메모.dtd란 파일을 DTD정의로 사용하구요.

그 메모.dtd의 루트 엘리먼트가 "메모"라는 것입니다.

엉~~ 루트 엘리먼트가 모야???

먼저 엘리먼트가 무엇인지부터 살펴보죠.. 위의 XML문서에서 <메모><헤더><텍스트>와 같은 것이 보이죠.

이런 것을 엘리먼트라 합니다. 우리가 HTML에서 태그라고 했던 것 있죠.. 그걸 생각하면 쉬울 겁니다.

하지만 XML에서는

<헤더>을 시작 태그라 하구요. </헤더>를 닫는 태그라고 합니다.

그리고 <헤더>…</헤더>까지를 엘리먼트라고 하지요..

좀 이해가 되셨어요..

그리고 그중에서 특히 <메모>와 같이 가장 먼저 사용된 엘리먼트를 루트 엘리먼트라고 합니다.

문서를 트리구조로 만들 때 가장 위에 나타나게 되겠지요..

그럼 HTML에서 루트엘리먼트는 뭘까요??

당근 <html>이겠죠… 쿠쿠쿠~~ 쉽죠!!

  <송신자>&me;</송신자>

<송신자> 엘리먼트의 내용이 &me;라고 되어 있습니다. 이걸 엔터티 참조라고 하거든요.

실제 내용을 보면 이부분이 "김종민"이라고 바뀌어 있죠. 음~~ HTML에서 & 또는  정도를 생각하시면 될 것 같네요.

엔터티는 XML에서 좀더 복잡하고 다양하게 사용되지만 일단 간단한 문자열 대치정도로 생각해 두세요..

  <목록 타입="도형”>

여기에서 타입=“도형"이란 부분이 있죠.. 이것을 속성 노드라고 합니다. "타입"은 속성이름이구요.

"도형"은 속성값이 되지요.

HTML에서 < a href="xmlis.pe.kr”>이 부분을 생각하면 금방 이해하실 수 있을 겁니다.

자! 오늘은 XML 문서의 예제를 보구요. 간단한 용어 설명을 했네요.

다음엔 XML의 구성요소에 대해서 좀더 자세히 살펴보도록 하죠..

자~ 그럼 더운 여름날 휴가철에 모두들 즐겁게 보내세요… 2002/08/02 From 미니