Добре оформен XML документ

Какво е XML?

Източник: "Технология клиент-сървър"

Текстова версия: 1.0.1

Добре оформен XML документ

Искате ли да можете да публикувате документи, които са достъпни за всеки и навсякъде, независимо от типа на браузъра, клиентската среда, типа мултимедия и т.н.? XML е добре да предостави тази възможност. XML или eXtensible Markup Language е създаден, за да даде на уеб разработчиците възможността да дефинират съдържанието на по-сложни документи и с по-правилно „показване на данни“ от преди. В днешната ситуация средният уеб разработчик използва HTML за работа както с презентации, така и със структурирани данни. Добър пример би била таблица в документ.

От този пример можем да заключим. Първо, структурата на таблицата, както и нейното представяне, се обслужват от едни и същи тагове. За да се осигури последователност и повторна употреба, те трябва да бъдат разделени. Това може да се направи с помощта на таблици със стилове. Ами данните? След разделянето на информацията за презентацията ни остава набор от маркери на таблици с неразличима структура. Ще бъде много трудно да се определи съответствието между отделните парчета данни или да се разберат данните като такива. Възможно е да се използва схема, която използва атрибута ID (за всеки маркер), за да се получи определена последователност, но този подход ще бъде твърде сложен и недостатъчно гъвкав. Да предположим, че искате да поискате данни и да определите най-новата версия на PowerProduct. Как различавате двата реда от нашия пример? Първият ред на таблицата е за корпоративната версия на PowerProduct, а вторият ред е за настолната версия. В този пример можете да продължите да добавяте данни, но ще можете ли да определите на кой ред отговаря дадена колона? Както се оказва, има ограничение при определянето на това съвпадение, което е свързано с местоположението на данните. Ако използвате тази логика за търсене в базата данни, тогава има опасност скоро да загубите ума си.

500 5 PowerProduct

Всеки елемент се идентифицира с елемент, който уникално идентифицира данните, които съдържа. Първият елемент идентифицира набор от свързани части от информация. Вторият елемент е

- идентифицира определени части от информацията. Етикет

Текст за маркиране

В допълнение към дефинирането на „набор от ориентирани“ данни, XML може да се използва и за маркиране на обикновен текст.Нека използваме следното изречение като пример:

През последното тримесечие продажбите на продукт А надвишиха продажбите на третото тримесечие с 6.5%. Увеличението на доходите показва, че продажбите на продукт А на потребителя имат съотношение 2 към 1 към корпоративните продажби.

Да кажем, че искаме да намерим този документ на уебсайт. Какво трябва да търсите? Конвенционалните програми за търсене няма да сканират целия текст на документ - този тип търсене не е практично. Вместо това той търси конкретен низ, заглавие или описание за документ, вграден в документа като метаданни. Нека улесним задачата си.

Разпродажба през последното тримесечие

Продукт А надвишава продажбите за тримесечие с 6,5%. Увеличението на доходите показва, че продажбите

към потребителя имат съотношение 2 към 1 към корпоративните продажби.

Това маркиране на текста ни позволява да търсим документи, съдържащи информация за даден продукт, без да вземаме предвид останалото. Горният пример показва текста, включен в тялото на документа. Неговото етикетиране ви позволява да изпълните заявка за текста, като използвате определени критерии.

XML и DTD

XML произхожда от SGML (стандартен генерализиран език за маркиране). XML е подмножество на много от функциите на SGML. SGML предоставя възможност за дефиниране на език, като предоставя инструментите, необходими за дефиниране на правилата, които трябва да се следват, когато определен тип процесор открие определен тип документ. И така, HTML е създаден с помощта на SGML. HTML се използва от браузърите или от какъвто и да е тип процесор, който го разбира. HTML използва дефиниция на тип документ или DTD. По принцип DTD е комбинация от дефиниции на типа документ и елементите, които съставят този документ. DTD може да бъде дефиниран в рамките на документ, като същевременно остане достъпен (включително за връзки) отвън. XML процесорът използва DTD, за да определи коректността на документа. Валиден документ е този, който отговаря на всички правила, определени от DTD. Вземете например HTML. DTD на последния дефинира отделните тагове, съставляващи например HTML, или

. DTD се показва с удебелен етикет в тези примери трябва да се сдвои с друг таг и

може би без затварящ таг.

DTD ви позволява да посочите колко елемента са свързани помежду си. Например:

Единият елемент е определен като главен, а останалите като подчинени. За да е коректно, всеки документ, съдържащ тези елементи, трябва да поддържа тези връзки. DTD е отговорен за дефинирането както на тези връзки, така и на допълнителни фактори - реда, в който се използват елементите, вида на данните, които могат да съдържат и т.н.

PCDATA е резервно име, което описва основните елементи и представлява типа данни, съдържащи се в елемента. Означава наличието на символни данни, които могат да бъдат подложени на граматичен анализ. Има допълнителни начини за дефиниране на съдържанието на елемент, както и на атрибутите, които даден елемент може да съдържа.

DTD подчертава структурата на данните, без дори да се опитва да разбере как да ги форматира. Това е отговорност на XML процесора. Използвайки приложния програмен интерфейс (API), предоставен от XML анализатора, разработчикът може да търси и чете конкретна информация за структурата на данните в документа и да форматира съответно елементите.