Вследствие возникшего многообразия способов представления текстовой и тексто-графи-ческой информации, связанных с применением разнородных программных средств, технологий форматирования и верстки текста, методов кодировки и поддержки национальных языков, появилась потребность в разработке унифицированных решений.

Такое решение содержится в стандарте ISO 8879 (SGML, Standard Generalized MarkUp Language), определяющем «обобщенный стандартный язык разметки» текста.

Термин «разметка» носит исторический характер - имеются ввиду метки, которые обычно делает редактор в процессе подготовки текста к верстке. Технология электронной разметки текста, основанная на вставке в текст специальных меток, широко используется в современных программных средствах верстки и форматирования. Метки условно можно разделить на два класса: процедурные и описательные.

Процедурные метки используемые, например, в программах Microsoft Word и Quark XPress чаще всего представляют собой коды форматирования, вставленные в текст документа.

Описательные метки, известные также под названием «обобщенных» (generalized), определяют не способ появления текста на странице, а назначение текста в документе. Описательные метки отделяют структуру документа от стиля его отображения, позволяя для одного документа иметь различные способы его отображения на экране или бумаге.

С точки зрения стандарта SGML документ рассматривается как совокупность:

- данных о структуре документа (взаимосвязи глав, разделов, параграфов, ссылки, прав доступа к элементам документа);

- данных о стиле оформления документа (используемых шрифтах, интервалах, размерах полей, способе нумерации и т.д.).

Стандарт ISO 8879 SGML определяет способ описания структуры документа, а также формат вставляемых в документ описательных меток, но не определяет формат данных о стиле оформления документа. Структура документа задается при помощи «определения типа документа» (в терминах стандарта - Document Type Definition или сокращенно DTD) , описывающего структуру документа подобно тому, как схема базы данных описывает типы поддерживаемых данных и отношения между полями. Определение типа документа (ОТД) задает взаимосвязь глав, заголовков глав, разделов и других фрагментов текста, образующих документ. Кроме того, ОТД задает правила для отношений между элементами документа, например: «заголовок главы должен быть первым элементом после начала главы» или «каждый список должен содержать по меньшей мере два пункта». Правила, содержащиеся в ОТД, позволяют автоматически контролировать правильность логической структуры документа. Таким образом, разные ОТД позволяют получить из одного и того же набора элементов разные документы (см. рис.12).


Помимо текстовой и графической информации, в SGML-документ могут быть вставлены мультимедийные элементы: аудио и видео-записи и клипы. Технология встройки мультимедийных элементов регламентируется специальным расширением SGML, описанным в стандарте ISO 10744 HyTime (Hypermedia/TimeBased Structuring Language) - языком «привязки» мультимедийных объектов.

В разделе, посвященном подготовке интерактивных электронных технических руководств, рассмотрен наглядный пример использования SGML – технологии.

Основные преимущества SGML - технологии:

1) формализация структуры документа, обеспечивающая возможность:

Описать правила, по которым формируется структура документа,

Автоматической генерации и контроля структуры документа,

Автоматического наполнения документа;

2) возможность распределенной подготовки различных разделов по строго определенным правилам (единая структура документа, единое стилевое оформление) и централизованная композиция конечного документа;

История

Рассмотрим пример простого кулинарного рецепта, размеченного с помощью XML:

Простой хлеб Мука Дрожжи Тёплая вода Соль Смешать все ингредиенты и тщательно замесить. Закрыть тканью и оставить на один час в тёплом помещении. Замесить ещё раз, положить на противень и поставить в духовку.

Объявление XML

Первая строка XML-документа называется объявление XML (англ. XML declaration ) - это строка, указывающая версию XML. В версии 1.0 объявление XML может быть опущено, в версии 1.1 оно обязательно. Также здесь может быть указана кодировка символов и наличие внешних зависимостей.

Спецификация требует, чтобы процессоры XML обязательно поддерживали Юникод -кодировки UTF-8 и UTF-16 (UTF-32 не обязателен). Признаются допустимыми, поддерживаются и широко используются (но не обязательны) другие кодировки, основанные на стандарте ISO/IEC 8859 , также допустимы другие кодировки, например, русские Windows-1251 , KOI-8 . Часто в тегах принципиально не используют не-латинские буквы, в этом случае UTF-8 является очень удобной кодировкой - объём, как правило, меньше, чем при UTF-16; декодирование может быть выполнено как для всего документа, так и для конкретных атрибутов и текстов; весь документ не содержит запрещённых символов при попытке разбора с неправильной кодировкой.

Корневой элемент

Важнейшее обязательное синтаксическое требование заключается в том, что документ имеет только один корневой элемент (англ. root element ) (также иногда называемый элемент документа (англ. document element )). Это означает, что текст или другие данные всего документа должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

Следующий простейший пример - правильно построенный документ XML:

Следующий пример не является корректным XML-документом, потому что имеет два корневых элемента :

Сущность №1 Сущность №2

Комментарий

В любом месте дерева может быть размещен элемент-комментарий . XML-комментарии размещаются внутри специального тега, начинающегося с символов . Два знака дефис (--) внутри комментария присутствовать не могут.

Теги внутри комментария обрабатываться не должны.

Теги

Остальная часть этого XML-документа состоит из вложенных элементов , некоторые из которых имеют атрибуты и содержимое . Элемент обычно состоит из открывающего и закрывающего тегов, обрамляющих текст и другие элементы. Открывающий тег состоит из имени элемента в угловых скобках, например, , а закрывающий тег состоит из того же имени в угловых скобках, но перед именем ещё добавляется косая черта, например, . Имена элементов, как и имена атрибутов, не могут содержать пробелы , но могут быть на любом языке, поддерживаемом кодировкой XML-документа. Имя может начинаться с буквы, подчёркивания, двоеточия. Остальными символами имени могут быть те же символы, а также цифры, дефис, точка.

В XML есть несколько предопределённых сущностей, таких как lt (ссылаться на неё можно написав ), " (") и " (") - последние две полезны для записи разделителей внутри значений атрибутов. Определить свои сущности можно в DTD-документе.

Иногда бывает необходимо определить неразрывный пробел, который очень часто используется в HTML и обозначается как. В XML такой предопределённой сущности нет, его записывают, а использование вызывает ошибку. Отсутствие этой весьма распространённой сущности у множества программистов зачастую вызывает удивление и это создаёт некоторые трудности при миграции своих HTML-разработок в XML.

Ссылка по номеру символа (англ. numeric character reference ) выглядит как ссылка на сущность, но вместо имени сущности указывается символ # и число (в десятичной или шестнадцатеричной записи), являющееся номером символа в кодовой таблице Юникод . Это обычно символы, которые невозможно закодировать напрямую, например, буква арабского алфавита в ASCII -кодированном документе. Амперсанд может быть представлен следующим образом:

AT& T

Существуют и другие правила, касающиеся составления корректного XML-документа.

Сильные и слабые стороны Достоинства Недостатки
  • Неоднозначность моделирования.
  • XML не содержит встроенной в язык поддержки типов данных . В нём нет строгой типизации, то есть понятий «целых чисел», «строк», «дат», «булевых значений» и т. д.
  • Иерархическая модель данных , предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами и сетевой моделью данных.
Отображение XML во Всемирной паутине

Наиболее распространены три способа преобразования XML-документа в отображаемый пользователю вид:

  • Применение стилей CSS ;
  • Применение XSL ;
  • Написание на каком-либо языке программирования обработчика XML-документа.
  • Для задания XSL трансформации (XSLT) на стороне клиента требуется наличие в XML инструкции следующего вида:

    Словари XML

    Так как XML является достаточно абстрактным языком, были разработаны словари XML.

    Словарь позволяет разработчикам договориться о некотором конечном наборе имен тегов и атрибутов этих тегов. Одним из первых словарей является XHTML , который понимают большинство браузеров. XHTML часто используют для хранения и редактирования контента в CMS .

    Были созданы более специализированные словари, например протокол передачи данных SOAP , который не является человеко-ориентированным и достаточно трудно читаем. Есть коммерческие словари, такие как CommerceML , xCBL и cXML которые используются для передачи данных, ориентированных на торговую деятельность, эти словари включают в себя описание системы заказов, поставщиков, продуктов и прочее.

    Обычно, описывая какой-либо документ, человек для себя придумывает некоторый словарь, который потом описывается посредством DTD , XSD или просто объясняет «на пальцах» заинтересованным лицам.

    Одним из словарей, получивших широкое распространение, является FB2 - словарь, описывающий формат книги, со всевозможными сносками, цитатами, даже картинками.

    Версии XML
    • XML 1.0
    • XML 1.1
    См. также Примечания Литература
    • Дэвид Хантер, Джефф Рафтер, Джо Фаусетт, Эрик ван дер Влист, и др. XML. Работа с XML, 4-е издание = Beginning XML, 4th Edition. - М .: «Диалектика», 2009. - 1344 с. - ISBN 978-5-8459-1533-7
    • Дэвид Хантер, Джефф Рафтер и др. XML. Базовый курс = Beginning XML. - М .: Вильямс, 2009. - 1344 с. - ISBN 978-5-8459-1533-7
    • Роберт Тейбор. Реализация XML Web-служб на платформе Microsoft .NET = Microsoft .NET XML Web Services. - М .: Вильямс, 2002. - 464 с. - ISBN 0-672-32088-6
    Ссылки
    • XML на сайте Консорциума Всемирной паутины (W3C)
    • Официальная спецификация стандарта XML 1.0 (англ.)
    • Официальная спецификация стандарта XML 1.1 (англ.)
    • Документация по XML на сайте IBM статьи, форумы
    Стандарты Консорциума Всемирной паутины Рекомендации Примечания Рабочие проекты Guidelines Initiative Deprecated Организации ПО Конференции Семантическая паутина Основы Подразделы Приложения Связанные темы

    вПТЙУ фПВПФТБУ

    SGML: У ЮЕН ЬФП ЕДСФ?

    уЕЗПДОС ЧУЕ ЮБЭЕ НПЦОП ЧУФТЕФЙФШ БВВТЕЧЙБФХТХ SGML. нОПЗЙЕ ЧЙДЩ ДПЛХНЕОФБГЙЙ РПУФБЧМСАФУС Ч ЖПТНБФЕ SGML. рПРХМСТОЩК СЪЩЛ ТБЪНЕФЛЙ Web-УФТБОЙГ HTML СЧМСЕФУС РТЙМПЦЕОЙЕН SGML. рПСЧМСЕФУС ЧУЕ ВПМШЫЕ РТЙЛМБДОЩИ РТПЗТБНН ДМС ТБВПФЩ У SGML: ТЕДБЛФПТЩ, УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС, УЙУФЕНЩ ДПЛХНЕОФППВПТПФБ, ЙУРПМШЪХАЭЙЕ SGML Ч ЛБЮЕУФЧЕ ЖПТНБФБ ИТБОЕОЙС ДПЛХНЕОФПЧ... SGML-РТПДХЛФЩ ЧЩРХУЛБАФ Adobe, Corel, SoftQuad, Microsoft. ч SGML ЗПФПЧСФУС ЛОЙЗЙ ЙЪДБФЕМШУФЧБ O"Reilly, ФЕИОЙЮЕУЛБС ДПЛХНЕОФБГЙС IBM, Sun Й OSF. пУОПЧЩЧБЕФУС ОБ SGML ЙОЖПТНБГЙПООБС ФЕИОПМПЗЙС НОПЗЙИ ЧЕДХЭЙИ НБЫЙОПУФТПЙФЕМШОЩИ Й БЧЙБЛПУНЙЮЕУЛЙИ ЖЙТН ЧУЕЗП НЙТБ.

    рПСЧЙЧЫБСУС Ч ОБЮБМЕ ЧПУШНЙДЕУСФЩИ SGML-ФЕИОПМПЗЙС РЕТЕЦЙЧБЕФ УЕКЮБУ РЕТЙПД ТБУГЧЕФБ. юФП ЬФП ФБЛПЕ? юФП ПОБ ДБЕФ УЧПЙН РПМШЪПЧБФЕМСН? лБЛ У ОЕК ТБВПФБФШ? оБ ЬФЙ Й ДТХЗЙЕ ЧПРТПУЩ С РЩФБАУШ ПФЧЕФЙФШ ЬФПК УФБФШЕК.

    уПДЕТЦБОЙЕ



















    лБЛ С ОБВТЕМ ОБ SGML-ФЕИОПМПЗЙА

    чУЕ ОБЮБМПУШ У ЙОФТБОЕФБ. ьФП НПДОПЕ УМПЧП ПЪОБЮБМП ДМС НЕОС ОБ РТБЛФЙЛЕ ФП, ЮФП ДПЛХНЕОФЩ, ЛПФПТЩЕ С ТЕЗХМСТОП РЙУБМ РП ТПДХ УЧПЕК ДЕСФЕМШОПУФЙ, УФБМП НПЦОП Й ОХЦОП ДЕМБФШ ДПУФХРОЩНЙ "online". дП УЙИ РПТ С РТПУФП ОБВЙТБМ ДПЛХНЕОФЩ Ч T E X-e Й РЕЮБФБМ ЙИ ОБ ВХНБЗЕ. йДЕС ДХВМЙТПЧБФШ ЙИ Ч HTML ЧТХЮОХА ПФРБМБ УТБЪХ: ОЕНЕДМЕООП ЧПЪОЙЛМБ ВЩ РТПВМЕНБ УЙОИТПОЙЪБГЙЙ ВХНБЦОПК Й ЬМЕЛФТПООПК ЧЕТУЙК ПДОПЗП Й ФПЗП ЦЕ ДПЛХНЕОФБ.

    б ЧУЛПТЕ РПФТЕВПЧБМПУШ РЕТЙПДЙЮЕУЛБС РЕТЕДБЮБ ДПЛХНЕОФПЧ РПУФПТПООЙН МАДСН Ч ЬМЕЛФТПООПК ЖПТНЕ, ЮФП, РП УМПЦЙЧЫЕКУС Х ОБУ РТБЛФЙЛЕ, ПЪОБЮБЕФ -- Ч ЖПТНБФЕ Microsoft Word. тБВПФБФШ У MS Word Х НЕОС РП ТСДХ РТЙЮЙО ОЕ ВЩМП ОЙЛБЛПЗП ЦЕМБОЙС, Л ФПНХ ЦЕ ЬФП ФПМШЛП ХУХЗХВЙМП ВЩ РТПВМЕНХ УЙОИТПОЙЪБГЙЙ ЧЕТУЙК.

    ъОБЮЙФ, ОХЦОП ВЩМП РТЙДХНБФШ УРПУПВ БЧФПНБФЙЮЕУЛПЗП РТЕПВТБЪПЧБОЙС ОБВЙТБЕНЩИ ДПЛХНЕОФПЧ Ч ТБЪМЙЮОЩЕ ЖПТНБФЩ: T E X-a -- ДМС РЕЮБФЙ ОБ ВХНБЗЕ, HTML -- ДМС РПНЕЭЕОЙС ОБ WWW УЕТЧЕТ, Word -- ДМС ПВНЕОБ У ТБВПФБАЭЙНЙ Ч Windows. лТПНЕ ФПЗП, НОЕ ИПФЕМПУШ, ЮФПВЩ ФБЛПЕ УТЕДУФЧП ПФЧЕЮБМП ЕЭЕ ТСДХ ФТЕВПЧБОЙК:

    • ВЩФШ НПДХМШОЩН, ЮФПВЩ НПЦОП ВЩМП РТЙ ОЕПВИПДЙНПУФЙ МЕЗЛП ДПВБЧМСФШ ОПЧЩЕ ЧЩИПДОЩЕ ЖПТНБФЩ ЙМЙ ЙЪНЕОСФШ БМЗПТЙФНЩ РТЕПВТБЪПЧБОЙС Ч УХЭЕУФЧХАЭЙЕ;
    • ВЩФШ ПФЛТЩФЩН, ВЕУРМБФОЩН, ЛБЛ НПЦОП НЕОШЫЕ РТЙЧСЪБООЩН Л ЛПОЛТЕФОЩН РТПЗТБННБН;
    • ВЩФШ НПВЙМШОЩН: ТБВПФБФШ, ЛБЛ НЙОЙНХН, ОБ ТБЪОЩИ UNIX-РМБФЖПТНБИ;
    • ВЩФШ МЕЗЛП ТХУЙЖЙГЙТХЕНЩН.

    рЕТЧЩН, ЮФП РПРБМПУШ НОЕ РПД ТХЛХ РПУМЕ РПИПДБ ОБ Altavista , ПЛБЪБМУС РБЛЕФ РПД ОБЪЧБОЙЕН linuxdoc-sgml . пО ЛБЛ ТБЪ Й РТЕДОБЪОБЮБМУС ДМС ЗЕОЕТБГЙЙ HTML, T E X Й RTF ЙЪ ПДОПЗП ЧИПДОПЗП ЖБКМБ. ыЙТПЛП ЙУРПМШЪХЕНЩК Ч ТБНЛБИ Linux Documentation Project , ПО ЙУРПМШЪПЧБМ Ч ЛБЮЕУФЧЕ ЧИПДОПЗП ЖПТНБФБ ОЕЪОБЛПНЩК НОЕ ДП УЙИ РПТ СЪЩЛ SGML . чРТПЮЕН, ОЙЮЕЗП УМПЦОПЗП Ч ОЕН ОЕ ПЛБЪБМПУШ -- ПО ЧЕУШНБ ОБРПНЙОБМ ЪОБЛПНЩК НОЕ HTML Й ЧЩЗМСДЕМ ЧРПМОЕ РПОСФОП. чПФ, Л РТЙНЕТХ, ЛХУПЮЕЛ SGML-ДПЛХНЕОФБ:

    The Structure of a TEI Text

    All TEI-conformant texts contain a TEI header (marked up as a teiHeader element) and the transcription of the text proper (marked up as a text element).

    дМС ФПЗП, ЮФПВЩ ОБЮБФШ ОБ ЬФПН РЙУБФШ, РПФТЕВПЧБМПУШ ЧУЕЗП МЙЫШ ЪБРПНОЙФШ ОЕУЛПМШЛП ПУОПЧОЩИ ЬМЕНЕОФПЧ ТБЪНЕФЛЙ, ОБРТЙНЕТ, ЮФП

    ПЪОБЮБЕФ ОБЮБМП РБТБЗТБЖБ, -- ОБЮБМП РЕТЕЮЙУМЕОЙС Й Ф.Р.

    оБВТБООЩК Ч SGML ФЕЛУФ ДБМЕЕ ЪБРХУЛПН ПДОПЗП ЖЙМШФТБ РТЕПВТБЪХЕФУС Ч HTML, ДТХЗПЗП -- Ч T E X, ФТЕФШЕЗП -- Ч RTF, Й ФБЛ ДБМЕЕ.

    юФП ФБЛПЕ SGML Й ЮЕН ПО ИПТПЫ фЕТНЙОПМПЗЙС

    GML (Generalized Markup Language ) ТБЪТБВПФБО Ч ОЕДТБИ ЧЕЪДЕУХЭЕК ЛПТРПТБГЙЙ IBM. еЗП ОБУМЕДОЙЛ SGML (Standard Generalized Markup Language ) РТЙОСФ Ч 1986 ЗПДХ Ч ЛБЮЕУФЧЕ НЕЦДХОБТПДОПЗП УФБОДБТФБ ДМС ПРТЕДЕМЕОЙС ОЕЪБЧЙУЙНЩИ ПФ ХУФТПКУФЧ ЧЧПДБ/ЧЩЧПДБ, ОЕЪБЧЙУЙНЩИ ПФ ЧЩЮЙУМЙФЕМШОПК УТЕДЩ НЕФПДПЧ РТЕДУФБЧМЕОЙС ФЕЛУФПЧ Ч ЬМЕЛФТПООПК ЖПТНЕ. вПМЕЕ ФПЮОП, SGML -- ЬФП НЕФБСЪЩЛ , ФП ЕУФШ УТЕДУФЧП ЖПТНБМШОПЗП ПРЙУБОЙС СЪЩЛБ, Ч ДБООПН УМХЮБЕ, СЪЩЛБ ТБЪНЕФЛЙ .

    йУФПТЙЮЕУЛЙ УМПЧП ТБЪНЕФЛБ ЙУРПМШЪПЧБМПУШ ДМС ПРЙУБОЙК БООПФБГЙК ЙМЙ ДТХЗЙИ ПВПЪОБЮЕОЙК ЧОХФТЙ ФЕЛУФБ, РТЕДОБЪОБЮЕООЩИ ДМС ХЛБЪБОЙК УПУФБЧЙФЕМА ЙМЙ "ЧЕТУФБМШЭЙЛХ" ФПЗП, ЛБЛ ЙНЕООП ЛПОЛТЕФОПЕ НЕУФП ДПМЦОП ВЩФШ ОБРЕЮБФБОП ЙМЙ УЧЕТУФБОП. рТЙНЕТЩ ЧЛМАЮБАФ РПДЮЕТЛЙЧБОЙЕ ЧПМОЙУФПК ЮЕТФПК, ПВПЪОБЮБАЭЕЕ ЛХТУЙЧ, УРЕГЙБМШОЩЕ ЪОБЮЛЙ ДМС РТПРХУЛБ ЖТБЪ ЙМЙ ЙИ РЕЮБФЙ ЛПОЛТЕФОЩН ЫТЙЖФПН, Й ФБЛ ДБМЕЕ. лПЗДБ ЖПТНБФЙТПЧБОЙЕ Й РЕЮБФШ ФЕЛУФПЧ УФБМЙ БЧФПНБФЙЪЙТПЧБООЩНЙ, ЬФПФ ФЕТНЙО УФБМ ПИЧБФЩЧБФШ ЧУЕ ЧЙДЩ УРЕГЙБМШОЩИ ЛПДПЧ ТБЪНЕФЛЙ , ЧУФБЧМСЕНЩИ Ч ЬМЕЛФТПООЩЕ ФЕЛУФЩ ДМС ХРТБЧМЕОЙС ЖПТНБФЙТПЧБОЙЕН, РЕЮБФША ЙМЙ ДТХЗПК ПВТБВПФЛПК.

    пВПВЭБС, ТБЪНЕФЛХ, ЙМЙ ЛПДЙТПЧЛХ , ПРТЕДЕМСАФ ЛБЛ МАВПЕ УТЕДУФЧП УДЕМБФШ СЧОЩН ЙОФЕТРТЕФБГЙА ФЕЛУФБ. оБ ВБОБМШОПН ХТПЧОЕ ЧУЕ ОБРЕЮБФБООЩЕ ФЕЛУФЩ ЛПДЙТПЧБОЩ Ч ЬФПН УНЩУМЕ: ЪОБЛЙ РТЕРЙОБОЙС, ЙУРПМШЪПЧБОЙЕ ЪБЗМБЧОЩИ ВХЛЧ, ТБУРПМПЦЕОЙЕ ВХЛЧ РП УФТБОЙГЕ, ДБЦЕ ЙОФЕТЧБМЩ НЕЦДХ УМПЧБНЙ НПЦОП УЮЙФБФШ Ч ЛБЛПК-ФП УФЕРЕОЙ ТБЪНЕФЛПК, ЖХОЛГЙС ЛПФПТПК -- РПНПЮШ ЮЕМПЧЕЛХ, ЮЙФБАЭЕНХ ФЕЛУФ, ПРТЕДЕМЙФШ, ЗДЕ ЛПОЮБЕФУС ПДОП УМПЧП Й ОБЮЙОБЕФУС ДТХЗПЕ, ЙМЙ ЛБЛ ЙДЕОФЙЖЙГЙТПЧБФШ ПУПВЕООПУФЙ УФТХЛФХТЩ, ФБЛЙЕ ЛБЛ ЪБЗПМПЧЛЙ, ЙМЙ РТПУФЩЕ УЙОФБЛУЙЮЕУЛЙЕ ЕДЙОЙГБ ЧТПДЕ РПДЮЙОЕООЩИ РТЕДМПЦЕОЙК. лПДЙТПЧБОЙЕ ФЕЛУФБ ДМС ЛПНРШАФЕТОПК ПВТБВПФЛЙ, Ч РТЙОГЙРЕ, ЛБЛ ТБУЫЙЖТПЧЛБ НБОХУЛТЙРФБ У РЕТЗБНЕОФБ, -- РТПГЕУУ ДЕМБОЙС СЧОЩН ОЕСЧОПЗП ЙМЙ РПДТБЪХНЕЧБЕНПЗП, РТПГЕУУ ХЛБЪБОЙС РПМШЪПЧБФЕМА ФПЗП, ЛБЛ ДПМЦОП ЙОФЕТРТЕФЙТПЧБФШУС УПДЕТЦЙНПЕ ФЕЛУФБ.

    рПД СЪЩЛПН ТБЪНЕФЛЙ РПОЙНБАФ ОБВПТ УПЗМБЫЕОЙК П ТБЪНЕФЛЕ, РТЙНЕОСЕНЩИ ДМС ЛПДЙТПЧБОЙС ФЕЛУФПЧ. сЪЩЛ ТБЪНЕФЛЙ ДПМЦЕО УРЕГЙЖЙГЙТПЧБФШ, ЛБЛБС ТБЪНЕФЛБ ДПРХУФЙНБ, ЛБЛБС ТБЪНЕФЛБ ПВСЪБФЕМШОБ, ЛБЛ ПФМЙЮЙФШ ТБЪНЕФЛХ ПФ ФЕЛУФБ Й ЮФП ТБЪНЕФЛБ ЪОБЮЙФ. SGML РТЕДПУФБЧМСЕФ ТЕЫЕОЙС ДМС РЕТЧЩИ ФТЕИ ЪБДБЮ, ПФДЕМШОБС ДПЛХНЕОФБГЙС ПВЩЮОП ОЕПВИПДЙНБ ДМС РПУМЕДОЕК.

    пУПВЕООПУФЙ SGML

    фТЙ ИБТБЛФЕТЙУФЙЛЙ SGML ПФМЙЮБАФ ЕЗП ПФ РТПЮЙИ СЪЩЛПЧ ТБЪНЕФЛЙ.

    пРЙУБФЕМШОБС ТБЪНЕФЛБ

    уЙУФЕНБ У ПРЙУБФЕМШОПК ТБЪНЕФЛПК ЙУРПМШЪХЕФ ЛПДЩ ТБЪНЕФЛЙ, ЛПФПТЩЕ РТПУФП РТЕДПУФБЧМСАФ ОБЪЧБОЙС ДМС ЛБФЕЗПТЙЪБГЙЙ ЮБУФЕК ДПЛХНЕОФБ. лПДЩ ТБЪНЕФЛЙ, ФБЛЙЕ ЛБЛ ЙМЙ \end{list} , РТПУФП ЙДЕОФЙЖЙГЙТХАФ РПТГЙА ДПЛХНЕОФБ Й ХФЧЕТЦДБАФ, ЮФП "ПОБ СЧМСЕФУС РБТБЗТБЖПН", ЙМЙ ЮФП "ЬФП -- ЛПОЕГ РПУМЕДОЙН ОБЮБФПЗП УРЙУЛБ" Й Ф.Р. у ДТХЗПК УФПТПОЩ, УЙУФЕНБ У РТПГЕДХТОПК ТБЪНЕФЛПК ПРТЕДЕМСЕФ, ЛБЛБС ПВТБВПФЛБ ДПМЦОБ ЧЩРПМОСФШУС Ч ЛПОЛТЕФОПК ФПЮЛЕ ДПЛХНЕОФБ: "Ч ЬФПН НЕУФЕ ЧЩЪЧБФШ РТПГЕДХТХ PARA У РБТБНЕФТБНЙ 1, b Й x", ЙМЙ "РЕТЕДЧЙОХФШ МЕЧХА ЗТБОЙГХ ОБ 2НН МЕЧЕЕ, РТБЧХА ЗТБОЙГХ -- ОБ 2НН РТБЧЕЕ, РТПРХУФЙФШ ПДОХ УФТПЛХ Й ЧУФБФШ ОБ ОПЧХА МЕЧХА ЗТБОЙГХ" Й Ф.Р. ч SGML ЙОУФТХЛГЙЙ, ОЕПВИПДЙНЩЕ ДМС ПВТБВПФЛЙ ДПЛХНЕОФБ У ЛБЛПК-МЙВП ЛПОЛТЕФОПК ГЕМША (ОБРТЙНЕТ, ДМС ЖПТНБФЙТПЧБОЙС), ЮЕФЛП ПФДЕМСАФУС ПФ ПРЙУБФЕМШОПК ТБЪНЕФЛЙ, ЛПФПТБС ЧУФТЕЮБЕФУС ЧОХФТЙ ДПЛХНЕОФБ. пВЩЮОП ПОЙ УПВТБОЩ ЧОЕ ДПЛХНЕОФБ Ч ПФДЕМШОЩИ РТПГЕДХТБИ ЙМЙ РТПЗТБННБИ.

    у ПРЙУБФЕМШОПК, Б ОЕ РТПГЕДХТОПК, ТБЪНЕФЛПК ПДЙО Й ФПФ ЦЕ ДПЛХНЕОФ НПЦЕФ ВЩФШ ПВТБВПФБО ТБЪОППВТБЪОЩНЙ РТПЗТБННБНЙ, ЛБЦДБС ЙЪ ЛПФПТЩИ НПЦЕФ РТЙНЕОСФШ ТБЪМЙЮОЩЕ ЙОУФТХЛГЙЙ ПВТБВПФЛЙ Л ФЕН ЕЗП ЮБУФСН, ЛПФПТЩЕ ПОБ УЮЙФБЕФ ЧБЦОЩНЙ. оБРТЙНЕТ, РТПЗТБННБ БОБМЙЪБ УПДЕТЦЙНПЗП НПЦЕФ РПМОПУФША ЙЗОПТЙТПЧБФШ УОПУЛЙ, ФПЗДБ ЛБЛ РТПЗТБННБ ЖПТНБФЙТПЧБОЙС НПЦЕФ ЙЪЧМЕЛБФШ Й УПВЙТБФШ ЙИ ДМС РЕЮБФШ Ч ЛПОГЕ ЛБЦДПК ЮБУФЙ. тБЪМЙЮОЩЕ ЧЙДЩ ЙОУФТХЛГЙК ПВТБВПФЛЙ НПЗХФ БУУПГЙЙТПЧБФШУС У ПДОПК Й ФПК ЦЕ ЮБУФША ЖБКМБ. оБРТЙНЕТ, ПДОБ РТПЗТБННБ НПЦЕФ ЙЪЧМЕЛБФШ ЙЪ ДПЛХНЕОФБ ЖБНЙМЙЙ МАДЕК Й ЗЕПЗТБЖЙЮЕУЛЙЕ ОБЪЧБОЙС ДМС УПЪДБОЙС ЙОДЕЛУБ ЙМЙ ВБЪЩ ДБООЩИ, ФПЗДБ ЛБЛ ДТХЗБС, ПВТБВБФЩЧБАЭБС ФПФ ЦЕ УБНЩК ФЕЛУФ, НПЦЕФ РЕЮБФБФШ ЖБНЙМЙЙ Й ОБЪЧБОЙС ПФМЙЮБАЭЙНУС ЫТЙЖФПН.

    фЙРЩ ДПЛХНЕОФПЧ

    SGML ЧЧПДЙФ РПОСФЙЕ ФЙРБ ДПЛХНЕОФБ , Й, УППФЧЕФУФЧЕООП, ПРТЕДЕМЕОЙС ФЙРБ ДПЛХНЕОФБ (document type definition, DTD ). дПЛХНЕОФЩ УЮЙФБАФУС ФЙРЙЪЙТПЧБООЩНЙ, ФБЛ ЦЕ, ЛБЛ Й ДТХЗЙЕ ПВТБВБФЩЧБЕНЩЕ ЛПНРШАФЕТБНЙ ПВЯЕЛФЩ. фЙР ДПЛХНЕОФБ ЖПТНБМШОП ПРТЕДЕМСЕФУС ЕЗП УПУФБЧОЩНЙ ЮБУФСНЙ Й ЙИ УФТХЛФХТПК. пРТЕДЕМЕОЙЕ, ОБРТЙНЕТ, ПФЮЕФБ НПЦЕФ ВЩФШ ФБЛЙН, ЮФП ПО УПУФПЙФ ЙЪ ЪБЗПМПЧЛБ Й, ЧПЪНПЦОП, БЧФПТБ, ЪБ ЛПФПТЩНЙ УМЕДХЕФ БООПФБГЙС Й РПУМЕДПЧБФЕМШОПУФШ ПДОПЗП ЙМЙ ВПМЕЕ БВЪБГЕЧ. мАВПК ДПЛХНЕОФ Ч ПФУХФУФЧЙЕ ЪБЗПМПЧЛБ, Ч УППФЧЕФУФЧЙЙ У ЬФЙН ЖПТНБМШОЩН ПРТЕДЕМЕОЙЕН, ОЕ ВХДЕФ ЖПТНБМШОП СЧМСФШУС ПФЮЕФПН, ФБЛ ЦЕ ЛБЛ ОЕ ВХДЕФ ЙН СЧМСФШУС Й РПУМЕДПЧБФЕМШОПУФШ БВЪБГЕЧ, ЪБ ЛПФПТПК УМЕДХЕФ БООПФБГЙС, ОЕЧЪЙТБС ОБ ФП, ОБУЛПМШЛП РПИПЦ ОБ ПФЮЕФ ФБЛПК ДПЛХНЕОФ У ФПЮЛЙ ЪТЕОЙС ЮЙФБФЕМС-ЮЕМПЧЕЛБ.

    рПУЛПМШЛХ ДПЛХНЕОФЩ ПФОПУСФУС Л ЙЪЧЕУФОЩН ФЙРБН, НПЦОП ЙУРПМШЪПЧБФШ УРЕГЙБМШОХА РТПЗТБННХ, ОБЪЩЧБЕНХА БОБМЙЪБФПТПН (parser ), ДМС ФПЗП, ЮФПВЩ ПВТБВПФБФШ ДПЛХНЕОФ, ХФЧЕТЦДБАЭЙК, ЮФП ПО ПФОПУЙФУС Л ЛПОЛТЕФОПНХ ФЙРХ, Й РТПЧЕТЙФШ, ДЕКУФЧЙФЕМШОП МЙ ЧУЕ ЬМЕНЕОФЩ, ФТЕВХЕНЩЕ ДМС ДБООПЗП ФЙРБ ДПЛХНЕОФПЧ, РТЙУХФУФЧХАФ Й ОБИПДСФУС Ч РТБЧЙМШОПК РПУМЕДПЧБФЕМШОПУФЙ. юФП ЕЭЕ ВПМЕЕ ЧБЦОП, ТБЪОЩЕ ДПЛХНЕОФЩ ПДОПЗП ФЙРБ НПЗХФ ПВТБВБФЩЧБФШУС ХОЙЖЙГЙТПЧБООЩН ПВТБЪПН. нПЦОП РЙУБФШ ВПМЕЕ ЙОФЕММЕЛФХБМШОЩЕ РТПЗТБННЩ, ЙУРПМШЪХАЭЙЕ ЪОБОЙС, ЪБЛМАЮЕООЩЕ Ч ЙОЖПТНБГЙПООПК УФТХЛФХТЕ ДПЛХНЕОФБ.

    оЕЪБЧЙУЙНПУФШ ДБООЩИ

    пУОПЧОБС ГЕМШ РТПЕЛФЙТПЧБОЙС SGML ВЩМБ Ч УПЪДБОЙЙ ЗБТБОФЙК ФПЗП, ЮФП ДПЛХНЕОФ, ЪБЛПДЙТПЧБООЩК УПЗМБУОП ЕЗП РПМПЦЕОЙСН, ВХДЕФ РЕТЕОПУЙНЩН У ПДОПК БРРБТБФОПК Й РТПЗТБННОПК УТЕДЩ Ч ДТХЗХА ВЕЪ РПФЕТЙ ЙОЖПТНБГЙЙ. дЧБ ЕЗП УЧПКУФЧБ, ПРЙУБООЩИ ЧЩЫЕ, ПФЧЕЮБАФ ЬФПНХ ФТЕВПЧБОЙА ОБ БВУФТБЛФОПН ХТПЧОЕ; ФТЕФШЕ УЧПКУФЧП -- ОБ ХТПЧОЕ УФТПЮЕЛ ВБКФПЧ (УЙНЧПМПЧ), ЛПФПТЩЕ УПУФБЧМСАФ ДПЛХНЕОФ. SGML РТЕДПУФБЧМСЕФ ПВПВЭЕООЩК НЕИБОЙЪН УФТПЛПЧПК РПДУФБОПЧЛЙ , ФП ЕУФШ, РТПУФПК НБЫЙООП-ОЕЪБЧЙУЙНЩК УРПУПВ ХЛБЪБОЙС, ЮФП ЛПОЛТЕФОБС УФТПЛБ УЙНЧПМПЧ Ч ДПЛХНЕОФЕ Ч НПНЕОФ ПВТБВПФЛЙ ДПЛХНЕОФБ ДПМЦОБ ЪБНЕОСФШУС ОБ ОЕЛПФПТХА ДТХЗХА УФТПЛХ. пДОП ПЮЕЧЙДОПЕ РТЙНЕОЕОЙЕ ЬФПНХ НЕИБОЙЪНХ -- ПВЕУРЕЮЕОЙЕ ЕДЙОПК ФЕТНЙОПМПЗЙЙ; ДТХЗПЕ, Й ВПМЕЕ ЪОБЮЙФЕМШОПЕ, -- РТПФЙЧПДЕКУФЧЙЕ ЙЪЧЕУФОПК ОЕУРПУПВОПУФЙ ТБЪОЩИ ЛПНРШАФЕТОЩИ УЙУФЕН РПОЙНБФШ ОБВПТЩ УЙНЧПМПЧ ДТХЗ ДТХЗБ, ОБРТЙНЕТ, ПДОПК УЙУФЕНЕ РТЕДУФБЧМСФШ ЧУЕ ЗТБЖЙЮЕУЛЙЕ УЙНЧПМЩ, ОЕПВИПДЙНЩЕ РТЙМПЦЕОЙА, РХФЕН ПРЙУБФЕМШОПЗП ПФПВТБЦЕОЙС ОЕРЕТЕДБЧБЕНЩИ УЙНЧПМПЧ. уФТПЛЙ, ПРТЕДЕМСЕНЩЕ ЬФЙН НЕИБОЙЪНПН, ОБЪЩЧБАФУС УХЭОПУФСНЙ (entities).

    п РТЕЙНХЭЕУФЧБИ

    юФП ДБЕФ ЙУРПМШЪПЧБОЙЕ SGML Ч ТЕБМШОПК ЦЙЪОЙ? нОЕ ПОП УТБЪХ ДБМП ЧПЪНПЦОПУФШ РТПЙЪЧПДЙФШ ДПЛХНЕОФЩ Ч МАВПН ФТЕВХЕНПН ЧЙДЕ. хДПВОП ПЛБЪБМПУШ Й ОБРЙУБОЙЕ "ЧПТДПЧЩИ" ВХНБЦЕЛ Ч РТЙЧЩЮОПК УТЕДЕ XEmacs ВЕЪ ЙУРПМШЪПЧБОЙС Windows. чУЕ ЙУРПМШЪПЧБООЩЕ РТПЗТБННЩ -- ВЕУРМБФОЩ Й ТБУРТПУФТБОСАФУС Ч ЙУИПДОЩИ ФЕЛУФБИ, ЮФП РПЪЧПМЙМП ХУФБОПЧЙФШ ЙИ ОБ ЧУЕИ ЙУРПМШЪХЕНЩИ НОПК УЙУФЕНБИ. рТЙЮЕН ПЛБЪБМПУШ, ЮФП ОБЮБФШ ТБВПФБФШ У SGML ЧПЧУЕ ОЕ УМПЦОП, ЛБЦДЩК, ЛФП ИПФШ ТБЪ ТЕДБЛФЙТПЧБМ WWW УФТБОЙЮЛХ, ОЕ ЙУРХЗБЕФУС ЧЙДБ ЛПОУФТХЛГЙК SGML.

    рПФПН ХЦЕ, РП НЕТЕ РПУФЕРЕООПЗП ЙЪХЮЕОЙС SGML, С ПУПЪОБМ, ЮФП ЬФБ ФЕИОЙЛБ ДБЕФ ЗТПНБДОПЕ ЛПМЙЮЕУФЧП ЧПЪНПЦОПУФЕК РП УТБЧОЕОЙА У ФЙРЙЮОПК "ОБУФПМШОПК ФЙРПЗТБЖЙЕК":

    рТПДХЛФЙЧОПУФШ юЕФЛП ТБЪДЕМЕООЩЕ РТПГЕУУЩ ЧЧПДБ ЙОЖПТНБГЙЙ Й ЕЕ ЖПТНБФЙТПЧБОЙС РПЪЧПМСАФ БЧФПТХ УПУТЕДПФПЮЙФШУС ОБ ЙЪМПЦЕОЙЙ НЩУМЕК, ОЕ ПФЧМЕЛБСУШ ОБ ДЧЙЗБОЙЕ ФЕЛУФБ РП ЬЛТБОХ Й РПДВПТ УФЙМЕК.

    еДЙОБС УФЙМЙУФЙЛБ мЕЗЛП ЧЩДЕТЦЙЧБФШ ТБЪМЙЮОЩЕ ДПЛХНЕОФЩ Ч ЕДЙОПН УФЙМЕ, ЙУРПМШЪХС ЕДЙОХА ФЕТНЙОПМПЗЙА. еУМЙ УФЙМШ ЙМЙ ФЕТНЙОЩ ОХЦОП ЙЪНЕОЙФШ, ЬФП ДЕМБЕФУС ТБЪПН ЧП ЧУЕИ ДПЛХНЕОФБИ, ОЕ ФТПЗБС ЙИ УПДЕТЦЙНПЕ.

    рПЧФПТОПЕ ЙУРПМШЪПЧБОЙЕ ьФПФ ФЕТНЙО, ИПТПЫП ЪОБЛПНЩК РТПЗТБННЙУФБН, ПЪОБЮБЕФ ОБМЙЮЙЕ ЧПЪНПЦОПУФЙ ЙУРПМШЪПЧБФШ ДЕФБМЙ УФБТЩИ РТПЕЛФПЧ Ч ОПЧЩИ, У НЙОЙНБМШОЩНЙ ЙЪНЕОЕОЙСНЙ. юБУФШ ДПЛХНЕОФБ, ПЖПТНМЕООБС Ч ЧЙДЕ SGML-ЬМЕНЕОФБ, НПЦЕФ РЕТЕОПУЙФШУС Ч ДТХЗЙЕ ДПЛХНЕОФЩ, МЕЗЛП РПЧФПТСФШУС Ч ТБЪОЩИ НЕУФБИ ФЕЛУФБ.

    дПМЗПЧЕЮОПУФШ ЙОЖПТНБГЙЙ йЪ-ЪБ ФПЗП, ЮФП SGML -- РТПУФПК Й УФБОДБТФОЩК ЖПТНБФ ИТБОЕОЙС ДБООЩИ, ПФУХФУФЧХЕФ ОЕПВИПДЙНПУФШ РЕТЕЖПТНБФЙТПЧБФШ ЙИ ЧЧЙДХ ХУФБТЕЧБОЙС БРРБТБФОПК ЙМЙ РТПЗТБННОПК РМБФЖПТНЩ. йОЖПТНБГЙС РТПУФП ДПУФХРОБ ОБЧУЕЗДБ. пОБ ОЕУЕФ У УПВПК ЧУЕ ОЕПВИПДЙНПЕ ДМС УПЪДБОЙС ДПЛХНЕОФБ.

    мХЮЫЕЕ ХРТБЧМЕОЙЕ ДБООЩНЙ у SGML НПЦОП ПРТЕДЕМСФШ ЙОЖПТНБГЙПООЩЕ ЬМЕНЕОФЩ Й НБОЙРХМСГЙЙ У ОЙНЙ У РТПЙЪЧПМШОПК УФЕРЕОША ДЕФБМШОПУФЙ. тБЪНЕЮЕООЩЕ ЬМЕНЕОФЩ НПЗХФ ЙНЕФШ БФТЙВХФЩ, ПРТЕДЕМСАЭЙЕ ИБТБЛФЕТЙУФЙЛЙ Й УЧПКУФЧБ ЬМЕНЕОФПЧ. ьФБ ЙОЖПТНБГЙС ОЕ РТЕДОБЪОБЮЕОБ ДМС РЕЮБФЙ, ОП НПЦЕФ РПНПЮШ Ч ХРТБЧМЕОЙЙ ЬМЕНЕОФБНЙ ДБООЩИ. оБРТЙНЕТ, БФТЙВХФ ID (ЙДЕОФЙЖЙЛБФПТ) НПЦЕФ ХОЙЛБМШОЩН ПВТБЪПН ЙДЕОФЙЖЙГЙТПЧБФШ ПДЙО БВЪБГ, ЙМЙ ГЕМЩК ТБЪДЕМ, РТЙНЕЮБОЙЕ, ЙММАУФТБГЙА, ЪБДБОЙЕ, -- МАВПК ЬМЕНЕОФ, ЛБЛ Ч ЬФПН РТЙНЕТЕ:

    йОЖПТНБГЙС
    фБЛ ЛБЛ ЙДЕОФЙЖЙЛБФПТЩ СЧМСАФУС НБЫЙООП-ЮЙФБЕНЩНЙ, ПОЙ НПЗХФ УЧСЪЩЧБФШ НЕЦДХ УПВПК ЙОЖПТНБГЙА Й ЙУРПМШЪПЧБФШУС ДМС ТБЪОППВТБЪОПЗП ХРТБЧМЕОЙС ЕК. оБРТЙНЕТ:
    • лПОФТПМЙТПЧБФШ ВЕЪПРБУОПУФШ ДПУФХРБ Л ЙОЖПТНБГЙЙ, РПЪЧПМСС ФПМШЛП ПРТЕДЕМЕООЩН МАДСН РТПУНБФТЙЧБФШ ЙМЙ ЙЪНЕОСФШ ЕЕ.
    • бЧФПНБФЙЪЙТПЧБФШ РЕТЕНЕЭЕОЙЕ ЙОЖПТНБГЙЙ -- ОБРТЙНЕТ, ПВОПЧМЕОЙЕ ДБООЩИ Ч ПДОПН НЕУФЕ НПЦЕФ ЙОЙГЙЙТПЧБФШ ПВОПЧМЕОЙЕ ФПК ЦЕ ЙОЖПТНБГЙЙ Ч ДТХЗЙИ РТЙМПЦЕОЙСИ.

    тБЪДЕМСЕНПУФШ чПЪНПЦОПУФШ ТБВПФЩ УП УФТХЛФХТЙТПЧБООЩНЙ ЛПНРПОЕОФБНЙ ДПЛХНЕОФБ РПЪЧПМСЕФ УФТПЙФШ ГЕМЩК ДПЛХНЕОФ ЙЪ УПУФБЧОЩИ ЮБУФЕК, ТБЪВТПУБООЩИ РП ПТЗБОЙЪБГЙЙ. ьФП РПЪЧПМСЕФ РПМШЪПЧБФЕМСН ДЕМЙФШУС ЙОЖПТНБГЙЕК ВЕЪ ЕЕ ДХВМЙТПЧБОЙС.

    нПВЙМШОПУФШ ч ЙОЖПТНБГЙПООЩИ УЕФСИ, ПВЯЕДЙОСАЭЙИ ТБЪОППВТБЪОЩЕ ЛПНРШАФЕТЩ, ПРЕТБГЙПООЩЕ УЙУФЕНЩ Й РТЙМПЦЕОЙС, НПВЙМШОПУФШ УФБОПЧЙФУС ЛМАЮПН ЛП ЧУЕПВЭЕК ДПУФХРОПУФЙ ЙОЖПТНБГЙЙ. рПУЛПМШЛХ SGML ОЕ ЪБЧЙУЙФ ПФ БРРБТБФХТЩ Й РТЙМПЦЕОЙК, НПЦОП МЕЗЛП ПВНЕОЙЧБФШУС ДПЛХНЕОФБНЙ НЕЦДХ ТБЪМЙЮОЩНЙ УЙУФЕНБНЙ.

    зЙВЛПУФШ Ч РТЙМПЦЕОЙЙ SGML РПЪЧПМСЕФ ЙУРПМШЪПЧБФШ ЙОЖПТНБГЙА ДБМЕЛП ЪБ ТБНЛБНЙ "ОБУФПМШОПК ФЙРПЗТБЖЙЙ". оБРТЙНЕТ:

    • УФТБОЙГЩ WWW;
    • ЙОЖПТНБГЙПООЩЕ ВБЪЩ ДБООЩИ;
    • ДЙБЗОПУФЙЮЕУЛЙЕ / ЬЛУРЕТФОЩЕ УЙУФЕНЩ;
    • ЬМЕЛФТПООБС РПЮФБ;
    • ЗЙРЕТФЕЛУФПЧБС ДПЛХНЕОФБГЙС;
    • РХВМЙЛБГЙЙ ОБ CD-ROM;
    • ЙОФЕТБЛФЙЧОЩЕ ЬМЕЛФТПООЩЕ НБОХБМЩ.
    рПЮЕНХ SGML?

    рПЮЕНХ ОЕ Word? рПФПНХ, ЮФП ЬФП ЪБЛТЩФЩК ЖПТНБФ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ПДОПЗП РТЙМПЦЕОЙС. рПФПНХ, ЮФП ЬФПЗП РТЙМПЦЕОЙС ОЕФ РПД АОЙЛУБНЙ, У ЛПФПТЩНЙ С ТБВПФБА. рПФПНХ, ЮФП ЬФП ОЕ ФЕЛУФПЧЩК ЖПТНБФ. рПФПНХ, ЮФП ОЕФ УТЕДУФЧ БЧФПНБФЙЮЕУЛПК ЗЕОЕТБГЙЙ ФБЛЙИ ДПЛХНЕОФПЧ. рПФПНХ, ЮФП ОЕФ ФПМЛПЧЩИ УТЕДУФЧ ХРТБЧМЕОЙС ЧЕТУЙСНЙ Й ЛПММЕЛФЙЧОПК ТБВПФЩ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ТБЪНЕФЛЙ РЕЮБФЙ, Б ОЕ УНЩУМПЧПК УФТХЛФХТЩ, Й ОЕФ ЧПЪНПЦОПУФЙ ЙИ УППФОПУЙФШ. рПФПНХ, ЮФП РТЙ ЬЛУРПТФЕ РПМХЮБЕФУС УПЧЕТЫЕООП ОЕХДПЧМЕФЧПТЙФЕМШОЩК HTML. рПФПНХ, ЮФП ЛБЮЕУФЧП ЧЕТУФЛЙ Й РЕЮБФЙ ОЙЦЕ УТЕДОЕЗП.

    рПЮЕНХ ОЕ T E X? рПФПНХ, ЮФП ЬФП УМЙЫЛПН ОЙЪЛПХТПЧОЕЧЩК СЪЩЛ. еЗП ОЕ ДБЫШ Ч ТХЛЙ ОБЮЙОБАЭЕНХ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ТБЪНЕФЛЙ РЕЮБФЙ, Б ОЕ УНЩУМПЧПК УФТХЛФХТЩ . рПФПНХ, ЮФП НБМП T E X-ПТЙЕОФЙТПЧБООЩИ ТЕДБЛФПТПЧ. рПФПНХ, ЮФП ОЕФ ХДПЧМЕФЧПТЙФЕМШОЩИ УТЕДУФЧ ЬЛУРПТФБ Ч Word.

    рПЮЕНХ ОЕ HTML? рПФПНХ, ЮФП УБНП РПОСФЙЕ HTML УЙМШОП ТБЪНЩФП ЗПОЛПК WWW ЪБ ЛПННЕТГЙЕК Й ЧПКОПК РТПЙЪЧПДЙФЕМЕК ВТБХЪЕТПЧ ДТХЗ У ДТХЗПН. рПФПНХ, ЮФП HTML УФТБДБЕФ ЧУЕ ФЕН ЦЕ ОЕДПУФБФЛПН: ПТЙЕОФЙТПЧБО ОБ РТЕДУФБЧМЕОЙЕ, Б ОЕ ОБ УФТХЛФХТХ. рПФПНХ, ЮФП ПО ПЮЕОШ ВЕДЕО ЧЩТБЪЙФЕМШОЩНЙ УТЕДУФЧБНЙ, Й ПФУХФУФЧХАФ ЧПЪНПЦОПУФЙ ЕЗП ТБУЫЙТЕОЙС. рПФПНХ, ЮФП ОЕ ТЕЫЕОБ РТПВМЕНБ ЛПТТЕЛФОПК ТХУЙЖЙЛБГЙЙ. рПФПНХ, ЮФП ОЕФ ХДПЧМЕФЧПТЙФЕМШОЩИ УТЕДУФЧ ЬЛУРПТФБ Ч Word.

    SGML РТПФЙЧ WYSIWYG

    дМС ФЕИ, ЛФП РТЙЧЩЛ РПМШЪПЧБФШУС ФПМШЛП "word processor"-БНЙ, ОБРТЙНЕТ, MS Word ЙМЙ WordPerfect, НПЦЕФ ВЩФШ ЙОФЕТЕУОП УПРПУФБЧМЕОЙЕ ЙИ У SGML ЙОУФТХНЕОФБНЙ. ьФЙ ДЧЕ ЗТХРРЩ РТПЗТБННОЩИ УТЕДУФЧ, ОЕУНПФТС ОБ УИПЦЕУФШ ТЕЫБЕНЩИ ЪБДБЮ -- РТПЙЪЧПДУФЧП ДПЛХНЕОФПЧ -- ЧЕУШНБ ДТХЗ ПФ ДТХЗБ ПФМЙЮБАФУС РП БТИЙФЕЛФХТЕ Й ЖХОЛГЙСН.

    Word processor -- ЬФП ЙОФЕММЕЛФХБМШОБС РЙЫХЭБС НБЫЙОЛБ. пО ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У ЧЙЪХБМШОЩН РТЕДУФБЧМЕОЙЕН ФЕЛУФБ, ИБТБЛФЕТЙЪХАЭЕЗПУС ОБВПТПН УФЙМЕК: УФЙМЕК УЙНЧПМПЧ (ЫТЙЖФ, ЛЕЗМШ, ОБЮЕТФБОЙЕ), БВЪБГЕЧ (ЛТБУОБС УФТПЛБ, ЧЩТБЧОЙЧБОЙЕ, РПМПЦЕОЙЕ РП ЫЙТЙОЕ УФТБОЙГЩ), УФТБОЙГ (ЛПМПОФЙФХМЩ, УОПУЛЙ), ТБЪДЕМПЧ Й ДПЛХНЕОФПЧ (ЖПТНБФ ВХНБЗЙ, ПЗМБЧМЕОЙЕ), Й РТПЮЙИ. Word processor ОЕ ТБВПФБЕФ У ЧОХФТЕООЕК УФТХЛФХТПК ДПЛХНЕОФБ.

    SGML ТЕДБЛФПТ, ОБРТПФЙЧ, ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У УПДЕТЦЙНЩН ДПЛХНЕОФБ. дМС SGML ТЕДБЛФПТБ, ОБРТЙНЕТ, ТБЪДЕМ -- ЬФП ЬМЕНЕОФ, Ч ЛПФПТЩК НПЗХФ ЧЛМАЮБФШУС РПДТБЪДЕМЩ, Б ОЕ РТПНЕЦХФПЛ ПФ ПДОПЗП БВЪБГБ, ОБВТБООПЗП УФЙМЕН "ъБЗПМПЧПЛ" ДП ДТХЗПЗП, ЛБЛ ДМС word processor-a.

    ьФП РПЪЧПМСЕФ БЧФПТХ УПУТЕДПФПЮЙФШУС ОБ УПДЕТЦБОЙЙ ФЕЛУФБ, Б ОЕ ЧПЪЙФШУС У ЕЗП ЖПТНБФЙТПЧБОЙЕН Й ЧЩВПТПН УФЙМЕК. чЙЪХБМШОБС УФЙМЙУФЙЛБ ДПЛХНЕОФБ ПРТЕДЕМСЕФУС РТЙ ЕЗП ЬЛУРПТФЕ Ч ЧЩИПДОЩЕ ЖПТНБФЩ, Б ОЕ РТЙ ОБВПТЕ ФЕЛУФБ.

    п РТПЗТБННОПН ПВЕУРЕЮЕОЙЙ

    юФПВЩ ОБЮБФШ ТБВПФБФШ У ДПЛХНЕОФБНЙ Ч SGML РПМШЪПЧБФЕМА ОХЦОЩ ДЧБ ПУОПЧОЩИ УТЕДУФЧБ: ТЕДБЛФПТ Й УТЕДУФЧБ ЬЛУРПТФБ (ЖПТНБФЙТПЧБОЙС).

    SGML-ТЕДБЛФПТ

    SGML-ТЕДБЛФПТ ПФМЙЮБЕФУС ЛБЛ ПФ РТЙЧЩЮОЩИ ФЕЛУФПЧЩИ ТЕДБЛФПТПЧ, ФБЛ Й ПФ "word processor"-ПЧ. пФ РЕТЧЩИ -- ОБМЙЮЙЕН РПДДЕТЦЛЙ УФТХЛФХТЙТПЧБООЩИ ДПЛХНЕОФПЧ, ПФ ЧФПТЩИ -- ПФУХФУФЧЙЕН РПДДЕТЦЛЙ ЧЙЪХБМШОПЗП ЖПТНБФЙТПЧБОЙС. тЕДБЛФПТ ТБЪВЙТБЕФ DTD ТЕДБЛФЙТХЕНПЗП ДПЛХНЕОФБ Й "ЧЕДЕФ" РПМШЪПЧБФЕМС Ч УППФЧЕФУФЧЙЙ У ОЙН. оБРТЙНЕТ, ЕУМЙ DTD РТЕДХУНБФТЙЧБЕФ ЬМЕНЕОФ , Ч ЛПФПТПН НПЗХФ ЧУФТЕЮБФШУС ФПМШЛП ЬМЕНЕОФЩ ЙМЙ , ФП РПМШЪПЧБФЕМА, ТЕДБЛФЙТХАЭЕНХ ЬМЕНЕОФ , ВХДЕФ РТЕДМПЦЕОП ЧУФБЧЙФШ ПДЙО ЙЪ ЬФЙИ ДЧХИ ТБЪТЕЫЕООЩИ ЬМЕНЕОФПЧ. SGML-ТЕДБЛФПТ ФБЛЦЕ ПВЩЮОП УПДЕТЦЙФ УТЕДУФЧБ ОБЧЙЗБГЙЙ РП ЙЕТБТИЙЙ ДПЛХНЕОФ.

    йЪ ЮЙУМБ РПРХМСТОЩИ SGML-ТЕДБЛФПТПЧ НПЦОП ОБЪЧБФШ ArborText ADEPT*Editor , SoftQuad Author/Editor , psgml , Adobe FrameMaker+SGML , Corel WordPerfect , Й НОПЦЕУФЧП ДТХЗЙИ.

    уТЕДУФЧБ ЖПТНБФЙТПЧБОЙС

    уХЭЕУФЧХЕФ НОПЦЕУФЧП УТЕДУФЧ ТБВПФЩ У SGML ФЕЛУФБНЙ. вóМШЫХА ЙИ ЮБУФШ УПУФБЧМСАФ УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС -- ЬЛУРПТФБ SGML Ч ДТХЗЙЕ ЖПТНБФЩ ДМС РЕЮБФЙ, РТПУНПФТБ Й Ф.Р. чЩИПДОЩЕ ЖПТНБФЩ НПЗХФ ВЩФШ МАВЩНЙ, ЪБЧЙУС МЙЫШ ПФ ДПУФХРОПЗП РТПЗТБННОПЗП ПВЕУРЕЮЕОЙС Й ОХЦД РПМШЪПЧБФЕМС. оБРТЙНЕТ, С ЙУРПМШЪХА ЛПОЧЕТФЕТЩ Ч HTML, RTF Й L A T E X.

    SGML (англ. Standard Generalized Markup Language - стандартный обобщённый язык разметки; произносится [эс-джи-эм-эл ]) - метаязык, на котором можно определять язык разметки для документов. SGML - наследник разработанного в 1969 году в IBM языка GML (Generalized Markup Language), который не стоит путать с Geography Markup Language, разрабатываемым Open GIS Consortium.

    Изначально SGML был разработан для совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах. Он широко использовался в печатной и издательской сфере, но его сложность затруднила его широкое распространение для повседневного использования.

    Основные части документа SGML:

    1. SGML-декларация - определяет, какие символы и ограничители могут появляться в приложении;

    2. Document Type Definition - определяет синтаксис конструкций разметки. DTD может включать дополнительные определения, такие, как символьные ссылки-мнемоники;

    3. Спецификация семантики, относится к разметке - также даёт ограничения синтаксиса, которые не могут быть выражены внутри DTD;

    4. Содержимое SGML-документа - по крайней мере, должен быть корневой элемент.

    SGML предоставляет множество вариантов синтаксической разметки для использования различными приложениями. Изменяя SGML-декларацию, можно даже отказаться от использования угловых скобок, хотя этот синтаксис считается стандартным, так называемым concrete reference syntax .

    SGML стандартизован ISO: «ISO 8879:1986 Information processing-Text and office systems-Standard Generalized Markup Language (SGML)»

    HTML и XML произошли от SGML. HTML - это приложение SGML, а XML - это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML являются SGML Docbook (документирование) и «Z Format» (типография и документирование).

    XML (англ. eXtensible Markup Language - расширяемый язык разметки; произносится [икс-эм-э́ль ]) - рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML - текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML). XML является упрощённым подмножеством языка SGML.

    Стандартом определены два уровня правильности документа XML:

    · Правильно построенный (англ. well-formed ). Правильно построенный документ соответствует всем общим правилам синтаксиса XML, применимым к любому XML-документу. И если, например, начальный тег не имеет соответствующего ему конечного тега, то это неправильно построенный документ XML. Документ, который неправильно построен, не может считаться документом XML; XML-процессор (парсер) не должен обрабатывать его обычным образом и обязан классифицировать ситуацию как фатальная ошибка.

    · Действительный (англ. valid ). Действительный документ дополнительно соответствует некоторым семантическим правилам. Это более строгая дополнительная проверка корректности документа на соответствие заранее определённым, но уже внешним правилам, в целях минимизации количества ошибок, например, структуры и состава данного, конкретного документа или семейства документов. Эти правила могут быть разработаны как самим пользователем, так и сторонними разработчиками, например, разработчиками словарей или стандартов обмена данными. Обычно такие правила хранятся в специальных файлах - схемах, где самым подробным образом описана структура документа, все допустимые названия элементов, атрибутов и многое другое. И если документ, например, содержит не определённое заранее в схемах название элемента, то XML-документ считается недействительным ; проверяющий XML-процессор (валидатор) при проверке на соответствие правилам и схемам обязан (по выбору пользователя) сообщить об ошибке.

    Данные два понятия не имеют достаточно устоявшегося стандартизированного перевода на русский язык, особенно понятие valid , которое можно также перевести, как имеющий силу , правомерный , надёжный , годный , или даже проверенный на соответствие правилам, стандартам, законам . Некоторые программисты применяют в обиходе устоявшуюся кальку «Валидный ».

    Технология XML. Предназначение, область применения.

    XML - расширяемый язык разметки. Представляющий собой свод общих синтаксических правил. XML - текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML, HTML). XML является упрощённым подмножеством языка SGML.

    Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Интернет. Словари, основанные на XML (например, RDF, RSS, MathML, XHTML, SVG), сами по себе формально описаны, что позволяет программно изменять и проверять документы на основе этих словарей, не зная их семантики, то есть не зная смыслового значения элементов. Важной особенностью XML также является применение так называемых пространств имён.

    XML - это иерархическая структура, предназначенная для хранения любых данных, визуально структура может быть представлена как дерево. Важнейшее обязательное синтаксическое требование является то, что документ имеет только один корневой элемент. Это означает, что текст должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

    Перечислим важнейшие задачи, решение которых обеспечивает платформа XML:

    Создание Веб второго поколения;

    Выполнение функций языка-посредника при обмене данными между программными системами, реализующими, возможно, различные технологии, и обеспечение тем самым их интероперабельности;

    Интеграция неоднородных информационных ресурсов, различных технологий управления данными и приложений;

    Создание новой ветви технологий баз данных, называемых XML-ориентированными базами данных;

    Наряду с использованием технологий XML-ориентированных баз данных по их прямому назначению - для управления репозиториями XML-документов, можно ожидать, что они найдут применение и в решении проблемы "скрытого" Веб; благодаря единству модели данных XML-документов, представленных на Веб-сервере, и в доступной через него XML-ориентированной базе данных, появляется возможность "открыть" "скрытые" информационные ресурсы баз данных для механизмов таких Веб-серверов;

    Обеспечение инструментария для новых сфер применения Веб, таких как электронный бизнес, электронные библиотеки, электронные издания и т.п.

    Области применений стандартов платформы XML постоянно расширяются и охватывают ряд технологий и стандартов как горизонтальной, так и вертикальной сферы.

    Технология Ajax.

    AJAX (, от англ. Asynchronous Javascript and XML - «асинхронный JavaScript и XML») - подход к построению интерактивных пользовательских интерфейсов веб-приложений, заключающийся в «фоновом» обмене данными браузера с веб-сервером. В результате, при обновлении данных, веб-страница не перезагружается полностью, и веб-приложения становятся более быстрыми и удобными.

    Технология

    AJAX - не самостоятельная технология, а концепция использования нескольких смежных технологий. AJAX базируется на двух основных принципах:

    Использование технологии динамического обращения к серверу «на лету», без перезагрузки всей страницы полностью, например:

    С использованием XMLHttpRequest (основной объект);

    Через динамическое создание дочерних фреймов;

    Через динамическое создание тега .

    Использование DHTML для динамического изменения содержания страницы;

    В качестве формата передачи данных обычно используются JSON или XML.

    Преимущества

    -Экономия трафика

    Использование AJAX позволяет значительно сократить трафик при работе с веб-приложением благодаря тому, что часто вместо загрузки всей страницы достаточно загрузить только изменившуюся часть, как правило, довольно небольшую.

    -Уменьшение нагрузки на сервер

    AJAX позволяет несколько снизить нагрузку на сервер. К примеру, на странице работы с почтой, когда вы отмечаете прочитанные письма, серверу достаточно внести изменения в базу данных и отправить клиентскому скрипту сообщение об успешном выполнении операции без необходимости повторно создавать страницу и передавать её клиенту.

    -Ускорение реакции интерфейса

    Поскольку нужно загрузить только изменившуюся часть, пользователь видит результат своих действий быстрее.

    Недостатки

    -Отсутствие интеграции со стандартными инструментами браузера

    Динамически создаваемые страницы не регистрируются браузером в истории посещения страниц, поэтому не работает кнопка «Назад», предоставляющая пользователям возможность вернуться к просмотренным ранее страницам, но существуют скрипты, которые могут решить эту проблему.

    Другой недостаток изменения содержимого страницы при постоянном URL заключается в невозможности сохранения закладки на желаемый материал. Частично решить эти проблемы можно с помощью динамического изменения идентификатора фрагмента (части URL после #), что позволяют многие браузеры.

    -Динамически загружаемое содержимое недоступно поисковикам (если не проверять запрос, обычный он или XMLHttpRequest)

    Поисковые машины не могут выполнять JavaScript, поэтому разработчики должны позаботиться об альтернативных способах доступа к содержимому сайта.

    -Старые методы учёта статистики сайтов становятся неактуальными

    -Усложнение проекта

    Перераспределяется логика обработки данных - происходит выделение и частичный перенос на сторону клиента процессов первичного форматирования данных. Это усложняет контроль целостности форматов и типов. Конечный эффект технологии может быть нивелирован необоснованным ростом затрат на кодирование и управление проектом, а также риском снижения доступности сервиса для конечных пользователей.

    -Требуется включенный JavaScript в браузере

    SGML (англ. Standard Generalized Markup Language - стандартный обобщённый язык разметки; произносится [эс-джи-эм-эл]) - метаязык, на котором можно определять язык разметки для документов. SGML - наследник разработанного в 1969 году в IBM языка GML (Generalized Markup Language), который не стоит путать с Geography Markup Language, разрабатываемым Open GIS Consortium.

    Изначально SGML был разработан для совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах. Он широко использовался в печатной и издательской сфере, но его сложность затруднила его широкое распространение для повседневного использования.

    Основные части документа SGML:

    SGML-декларация - определяет, какие символы и ограничители могут появляться в приложении;

    Document Type Definition - определяет синтаксис конструкций разметки. DTD может включать дополнительные определения, такие, как символьные ссылки-мнемоники;

    Спецификация семантики, относится к разметке - также даёт ограничения синтаксиса, которые не могут быть выражены внутри DTD;

    Содержимое SGML-документа - по крайней мере, должен быть корневой элемент.

    SGML предоставляет множество вариантов синтаксической разметки для использования различными приложениями. Изменяя SGML-декларацию, можно даже отказаться от использования угловых скобок, хотя этот синтаксис считается стандартным, так называемым concrete reference syntax.

    Пример синтаксиса SGML:

    typically something like this

    SGML стандартизован ISO: «ISO 8879:1986 Information processing-Text and office systems-Standard Generalized Markup Language (SGML)»

    HTML и XML произошли от SGML. HTML - это приложение SGML, а XML - это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML являются SGML Docbook (документирование) и «Z Format» (типография и документирование).

    XML - Extensible Markup Language, то есть Расширяемый Язык Разметки, возник в результате развития языка HTML (HyperText Markup Language, языка разметки гипертекста). Однако было бы грубой ошибкой воспринимать его лишь как некую усовершенствованную версию языка HTML. По сути, язык XML представляет собой новое поколение языков разметки. Здесь следует иметь в виду 3 момента, принципиально отличающих XML от HTML и его предшественников (GML - Generalized Markup Language, SGML - Standard General Markup Language):

    XML, в отличие от HTML, НЕ ИМЕЕТ ПРЕДОПРЕДЕЛЕННЫХ ТЭГОВ - точнее, каждый разработчик может создавать СВОИ СОБСТВЕННЫЕ XML-тэги - столько, сколько нужно. Количество таких тэгов практически неограничено. Таким образом, XML является метаязыком, позволяющим создавать другие языки разметки, такие как, например, HTML.

    По мере развития языка HTML количество тэгов быстро увеличивалось. В конце концов их число достигло "критического значения" - разработчикам web-документов стало трудно запоминать все новые и новые тэги, но еще в худшем положении оказались разработчики браузеров - им приходится создавать все новые версии браузеров, которые "понимали бы" новые тэги. Более "умные" браузеры становятся и большими по объему, предъявляют все возрастающие требования к компьютерам, на которых они используются. Дело усугубляется тем, что в последнее время все большую популярность приобретают карманные устройства (в частности, они все шире используются в электронной коммерции), с ограниченным объемом памяти и "слабенькими" экранами, а потому, браузеры, используемые на них, имеют лишь очень ограниченные возможности. Язык XML, не имеющий определенной заранее системы тэгов, позволяет решить эту проблему. "Платой" за универсальность является большая строгость оформления web-документов. Правила оформления XML-документов просты:

    недопустимы незакрытые контейнеры тэгов (но можно объединять открывающий и закрывающий тэги в одном, например:
    )

    "вложенные" контейнеры не могут "перекрываться"

    строчные и прописные буквы воспринимаются как разные символы

    в качестве названий тэгов нельзя использовать ключевые слова

    в названиях тэгов нельзя использовать пробелы, знаки пунктуации, круглые, квадратные и фигурные скобки

    знак подчеркивания (_) и цифры могут встречаться в названиях тэгов, но цифра не может быть перым символом названия тэга

    (При необходимости использовать несколько слов в качестве названия тэга их следует писать слитно, начиная каждое слово с большой буквы.)

    Документы, отвечающие этим правилам, называются well-formed documents.

    XML служит для ОПИСАНИЯ СТРУКТУРЫ ДАННЫХ, главным образом, ИЕРАРХИЧЕСКИХ СТРУКТУР.

    Одной из основных тенденций развития web-технологий является РАЗДЕЛЕНИЕ ДАННЫХ, СТРУКТУРЫ ДОКУМЕНТА И ЕГО СТИЛЕВОГО ОФОРМЛЕНИЯ. Как известно, одним из способов обособления данных от структуры документа является динамическое связывание СУБД с web-документами через интерфейс ODBC (Open DataBase Connectivity). Обособление стилей достигается за счет использования каскадных таблиц стилей. XML позволяет описывать нереляционные базы данных. Поскольку тэги могут создаваться разработчиком, их названия обычно характеризуют смысл данных.

    XML, как средство описания структуры данных, обеспечивает ОБМЕН ДАННЫМИ между различными приложениями, выступая, таким образом, в качестве своеобразного "клея".

    Значение этой "связующей" функции XML трудно переоценить. Благодаря возможности обмена данными между различными приложениями web-технологии "выходят" на качественно новый уровень.

    Hypertext Markup Language (HTML ) это простая система для создания гипертекстовых документов, которые переносимы с одной платформы на другую. В сущности, HTML документы это SGML документы с общей семантикой, которая подходит для представления информации в большом количестве приложений. HTML может использоваться для представления:

      Гипертекстовых новостей, почты, документации и гипермедиа

      Меню опций

      Результатов запросов к базам данных

      Простых документов с встроенными графическими образами

      А также, для гипертекстового просмотра существующих массивов информации

    Проект World Wide Web (WWW) объединяет разбросанную по миру информацию. Для этого WWW использует Internet HyperText Transfer Protocol (HTTP) - Протокол Передачи Гипертекста, который позволяет ввести соглашения на способы представления данных при взаимодействии клиента и сервера.

    Данные передаются в теле сообщения в соответствии с MIME стандартом. HTML это одно из представлений информации в WWW. Предполагается, что HTML соответствует одному из типов MIME, а именно text/html. Дополнительно, HTML это разработка, соответствующая Международному Стандарту ISO 8879 - Standard Generalized Markup Language (SGML), который является системой для определения структурированных типов документов.

    HTML документ

    HTML документ подобен текстовому файлу, за исключением того, что некоторые символы (строки) являются управляющими. Эти символы называются тэгами и определяют структуру документа.

    HTML документы должны начинаться с тэга , стоящего в начале файла, и заканчиваться тэгом . Между этими тэгами HTML документ организован как ЗАГОЛОВОК (HEAD) и ТЕЛО (BODY) документа, подобно почтовому сообщению. Внутри HEAD части указывается ЗАГОЛОВОК (TITLE) и другая информация о документе в целом. Внутри BODY части с помощью HTML тэгов текст структурируется в параграфы, списки и пр. с возможностью выделения стилем отдельных слов и целых предложений и создания ссылок на части этого и внешние документы. Технически, открывающий и закрывающий тэги для HTML, HEAD и BODY элементов можно не использовать. Тем не менее, делать это не рекомендуется, так как HEAD/BODY структура позволяет приложениям определять особенности документов (например заголовок), не просматривая весь документ целиком.

    Структура HTML элементов

    В HTML документе тэги определяют начало и конец заголовков, параграфов, списков, подсветку символов и ссылки. Большинство HTML элементов в документе определены как открывающий тэг, который указывает имя элемента и атрибуты, затем указывается тело элемента, за которым следует закрывающий тэг. Символами-ограничителями для открывающего тэга являются ""; для закрывающего - "". Например:

    Это Заголовок

    Это параграф.

    Некоторые элементы появляются только как открывающий тэг. Например, для создания линии- разделителя используется тэг
    . Кроме того, закрывающие тэги для некоторых элементов (P, LI, DT, DD) могут быть опущены. Тело элемента это последовательность символов и вложенных элементов. Некоторые элементы, такие как элементы, определяющие ссылки, не могут быть вложенными друг в друга. При этом элементы, определяющие ссылки и выделения символов могут быть помещены внутрь других конструкций.

    Отображение документа

    Конкретный вид отображения документа может изменяться от клиента к клиенту. HTML тэги определяют только общий стиль отображения документа. Что означает, например, что HTML рассматривает заголовок первого уровня только как заголовок первого уровня, но не определяет, что заголовок первого уровня должен отображаться шрифтом Times размера 24 в центре верхней части страницы. Преимущество такого подхода заключается в том, что если пользователь решит изменить заголовок первого уровня на шрифт Helvetica размера 20 выравненный по левому краю, все, что ему надо сделать, это изменить определение заголовка первого уровня в его WWW просмоторщике. Таким образом, конкретное представление документа на экране монитора определяет пользователь конкретного клиента.

    Основная сила HTML заключается в его способности связывать области текста (а также картинок) с другими документами. Просмотрщики выделяют эти области (обычно цветом и/или подчеркиванием)для того, чтобы указать, что это гипертекстовые ссылки. Anchor это часть текста, которая отмечает начало и/или конец гипертекстовой ссылки. Текст, находящийся между открывающим и закрывающим тэгом является стартовой точкой или местом назначения гипертекстовой ссылки. Атрибуты данного тэга следующие: HREF

    Необязательный. Если присутствует атрибут HREF, Anchor это чувствительный текст: стартовая точка для ссылки. Если читатель выбирает этот текст, ему будет представлен другой документ, чей сетевой адрес был указан в значении атрибута HREF. Формат сетевого адреса аналогичен URL. Это позволяет структуре HREF="#identifier" ссылаться на другой anchor в текущем документе, или в удаленном документе при указании его адреса перед знаком "#".

    Необязательный. Если присутствует, позволяет использовать anchor как место назначения ссылки. Значением атрибута является идентификатор anchor"а. В качестве значения идентификатора может быть использована обычная текстовая строка, за исключением того, что внутри одного документа все подобные идентификаторы должны быть уникальны.

    Необязательные. Позволяют указывать взаимосвязи между документом из которого была сделана ссылка, и документом, на который была сделана ссылка.

    Все атрибуты необязательны, за исключением того, что для того, чтобы тэг имел смысл, должен присутствовать либо атрибут HREF, либо атрибут NAME.

    Примеры использования

    ...

    Определяет место в документе, на которое будет сделана ссылка

    ...

    ...