Спецификация языка HTML
Радик Усманов
radik@binep.ac.ru
Сервер FREEnet Web
Сентябрь Сентябрь (лат.September)— девятый месяц Григорианского календаря, один из четырёх григорианских месяцев с 30-ю днями. Сентябрь— начало осени в северном полушарии Земли и начало весны в южном. 8, 1995 г.
Реферат Реферат (нем.Referat, от лат.refere— докладывать, сообщать)— письменный доклад или выступление по определённой теме, в котором собрана информация из одного или нескольких источников. Рефераты могут являться изложением содержания научной работы, художественной книги ит.п.:
Документ содержит русский Русские— восточнославянский народ, проживающий в основном в России, а также составляющий значительную долю населения Украины, Белоруссии, Казахстана, Узбекистана, Латвии, Киргизстана, Эстонии, Литвы, Молдавии, Приднестровья, Туркменистана. Разговаривают на русском языке восточной подгруппы славянской группы индоевропейской языковой семьи. Русских связывают общая история, культура и этническое происхождение. перевод черновой версии спецификации
языка гипертекстовой разметки HTML.
Перевод выполнен по заказу корпорации Корпорация (от новолат. corporatio— объединение)— юридическое лицо, которое, будучи объединением физических лиц, при этом независимо от них (то есть самоуправляемо). В широком смысле под корпорацией можно понимать всякое объединение с экономическими целями деятельности.
"
Университетские сети знаний"
(УНИКОР) для проведения работ по проекту
"Instauratio Magna"
, в рамках программы Госкомвуза
"Национальная академическая система баз данных и баз знаний высшей
школы России".
Текст перевода и его отдельные части могут свободно распространяться
и быть использованы организациями и отдельными лицами в целях создания
и развития информационных систем и средств обработки информации. Не
допускается коммерческое использование текста и его отдельных частей, а
также распространение его в измененном виде.
Перевод Перевод— деятельность по интерпретации смысла текста на одном языке (исходном языке [ИЯ]) и созданию нового, эквивалентного текста на другом языке (переводящем языке [ПЯ]). спецификации HTML производился в 1994 году и некоторая
информация на момент публикации устарела. По этой причине в оригинальный
текст включены примечания (замкнуты в скобках и
помечены, как "прим. ред."). Некоторые из них вынесены из
текста и размещаются в конце данного документа в разделе
"Изменения и дополнения".
Язык разметки гипертекста (HTML Проект Internet ) Рабочая группа IIIR
| | Tim Berners-Lee, CERN Daniel Connolly, Atrium Атриум или атрий (лат.atrium, от ater— «закопчённый», «чёрный», то есть помещение, почерневшее от копоти), каведиум— центральная часть древнеримского и древнеиталийского жилища (домуса), представлявшая собой внутренний световой двор, откуда имелись выходы во все остальные помещения. В современной архитектуре атриумом называется центральное, как правило многосветное, распределительное пространство общественного здания, инсолируемое через зенитный световой фонарь или проем в перекрытии, а также атриумы создаются на круизных судах гигантских размеров класса Panamax. июнь 1993 |
Язык разметки гипертекста
Представление текстовой и метаинформации
для обработки и обмена
Статус данного документа
Данный документ является проектом Internet. Проекты Internet
являются рабочими документами инженерного подразделения сети Internet
(IETF), его региональных отделений и рабочих групп. Отметим, что и
другие группы могут распространять рабочие Рабочий класс— социальный класс наёмных работников, не владеющих средствами производства и живущих продажей своей рабочей силы. В индустриальном обществе он составляет большинство населения. При этом от собственно рабочего класса следует отличать всех занятых по найму нефизическим трудом в промышленности (инженеры, бухгалтеры, секретари и т.д), а также наемных работников в торговле и сфере услуг, которые образуют группу служащих. Некоторых работников сферы услуг, занимающихся физическим трудом, при этом обычно относят к рабочему классу (например, водителей и автослесарей), тогда как других (например, официантов и домработниц) обычно к рабочему классу не относят. документы Документ (от лат.documentum— образец, свидетельство, доказательство) — материальный объект, содержащий информацию в зафиксированном виде и специально предназначенный для её передачи во времени и пространстве .
В узком смысле Документ — облеченный в письменную форму акт, удостоверяющий наличие фактов определенного значения. В широком смысле и книга, и скульптура - документы. в качестве
проектов Internet.
Проекты Internet являются рабочими документами, действительными не
более шести месяцев Николай Николаевич Месяцев (3 июля 1920, Вольск, Саратовская губерния)— советский государственный и партийный деятель, председатель Государственного комитета Совета Министров СССР (Комитета при СМ СССР) по радиовещанию и телевидению (1964—1970).. Проекты Internet Интернет (произносится [интэрнэт]; англ.Internet)— всемирная система объединённых компьютерных сетей, построенная на использовании протокола IP и маршрутизации пакетов данных. Интернет образует глобальное информационное пространство, служит физической основой для Всемирной паутины и множества других систем (протоколов) передачи данных. Часто упоминается как «Всемирная сеть» и «Глобальная сеть». В обиходе иногда говорят «Инет». могут быть отменены, обновлены
или заменены другими документами в любой момент. Нежелательно делать
ссылки на проекты Internet или упоминать их иначе как "рабочие
проекты" или "проекты в процессе разработки".
Нет ограничений на распространение этого документа. Данный
документ является проектом стандарта для обмена информацией в сетях.
Желательно посылать Ваши комментарии по адресу timbl@info.cern.ch или
же на обсуждение Диалог (греч. — первоначальное значение— разговор, беседа двух людей) в обыденном смысле— литературная или театральная форма устного или письменного обмена высказываниями (репликами) в разговоре между двумя и более людьми;— в философском и научных смыслах— специфическая форма и организация общения, коммуникации. Традиционно противопоставляется монологу. в www-talk@info.cern.ch .
Данный текст является версией 1.2 рассматриваемого проекта. Этот
документ доступен в гипертекстовом виде в системе World-Wide Web
http://info.cern.ch/hypertext/WWW/MarkUp/HTML.html
(прим. ред. 1)
Аннотация Аннотация (от лат.annotatio— замечание) или резюме (от фр.rsum — «сокращённый»)— краткая характеристика издания: рукописи, монографии, статьи или книги. Аннотация показывает отличительные особенности и достоинства издаваемого произведения, помогает читателям сориентироваться в их выборе.
Язык разметки гипертекста (HyperText Markup Language - HTML) можно
использовать для представления:
- гипертекстовых новостей, почты, сопровождающей информации и сопутствующей гиперсреды,
- меню с опциями
- результатов запросов к базам данных
- простых структурированных документов со встроенной графикой
- гипертекстовых обзоров имеющейся информации
Программа World Wide Web (W3) инициирует каналы передачи связной «Связной»— российская компания, федеральная розничная сеть, специализирующаяся на продаже услуг сотовых операторов, персональных средств связи, аксессуаров, портативной цифровой аудио- и фототехники. Штаб-квартира— в Москве.
информации по всему земному шару. Язык HTML предоставляет простой
формат для предоставления этой информации. Требуется, чтобы все
программы, совместимые с W3, могли поддерживать язык HTML. Программа Программа - (от греч. — пред, греч. — запись) термин, в переводе означающий «предписание», т.е.
W3 использует протокол Internet (протокол передачи гипертекста -
HTTP), который позволяет передавать кодированную информацию между
клиентом и сервером, при этом результат Результат— заключительное последствие последовательности действий или событий, выраженных качественно или количественно. Возможные результаты включают преимущество, неудобство, выгоду, потерю, ценность и победу. возвращается через
расширенное MIME сообщение. Поэтому язык HTML является лишь одним, но
довольно важным, из описаний, используемых в программе W3.
Описание языка HTML ссылается на спецификацию URL в документах
RFC.
Реализацию анализаторов и генераторов языка HTML можно найти на
различных W3 серверах, в программах просмотра, среди общедоступного
исходного кода программы W3. Они также могут быть созданы с
использованием различных общедоступных анализаторов SGML, таких, как
[SGMLS]. HTML относится к документам типа SGML с очень обобщенной
семантикой, пригодной для кодирования информации, получаемой от
большого набора прикладных программ. Этот язык является более общим,
чем многие другие специфические реализации языка SGML, и вместе с тем
он полностью сохраняет независимость от конкретных устройств.
Терминология Терминология - наука о терминах. В настоящее время используется термин «терминоведение».
Данная спецификация Спецификация— (позднелат.specificatio, от лат. species - род, вид, разновидность и facio - делаю) инженерный термин, обозначающий набор требований и параметров, которым удовлетворяет некоторая сущность. К примеру, мост через реку удовлетворяет таким параметрам, как максимальный общий вес нагрузки, максимальная нагрузка на ось, максимальная скорость ветра ит.д. языка использует нижеприведенные слова в
заранее определенном значении.
| Representation - | описание, представление, отображение Функция— математическое понятие, отражающее связь между элементами множеств. Можно сказать, что функция это «закон», по которому каждому элементу одного множества (называемому областью определения) ставится в соответствие некоторый элемент другого множества (называемого областью значений). информации. |
| Кодирование Кодирование информации— процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки информации для ее передачи. Например, язык
HTML является представлением гипертекста в закодированном
виде. |
| Rendering - | обработка. Форма предоставления информации человеку. |
Степень долженствования
| "может быть" (may) | Реализация языка не обязана во всех случаях
следовать данному указанию
| | "должно" (must, shall) | Если данное указание не соблюдается, то
реализация не удовлетворяет данной спецификации. |
| "следовало бы" (should) | Если данное указание не выполняется, то хотя
данная реализация считается удовлетворяющей стандарту, однако на практике могут возникнуть нежелательные последствия. |
| "обычно" (typical) | Для многих элементов дано описание механизма
обычной обработки. Он не является обязательной частью стандарта, однако приведен в качестве описания для разработчиков и для того, чтобы помочь пользователям уяснить, для чего
предназначены те или иные элементы языка. |
Замечания
Параграфы, этого документа, отмеченные как замечания, не являются
обязательной частью спецификации HTML, а всего лишь пояснением к нему.
Классификация элементов в реализации языка HTML
| основные | Все программы-анализаторы должны распознавать указанные
элементы. Все элементы являются главными, если не указано обратное. |
| дополнительные | стандартные элементы языка HTML, которые могут без
опасности игнорироваться анализаторами. Правильное действие - игнорировать дополнительные элементы, а содержимое документа обрабатывать так, как если бы в нем не было этих меток (например, это может быть EM или любые неопределенные элементы). |
| устаревшие | Элементы, не являющиеся стандартом языка HTML.
Анализаторам следует по возможности поддерживать данные Данные (калька от лат.data) — это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. элементы с тем, чтобы сохранить совместимость с предыдущими версиями данной спецификации.
. |
HTML и MIME
Подтип языка HTML определяется как:
| имя типа в стандарте MIME | текст. |
| имя подтипа | html. |
| обязательные параметры | отсутствуют. |
| необязательные параметры | набор символов. |
Наборы символов
Базовый набор символов (SGML BASESET) для языка HTML - это ISO
Latin-1. На данный набор могут ссылаться любые обращения к символам.
Набор символов, реальный используемый при кодировке HTML документа,
может быть ISO Latin 1, или же его 7-битная часть, являющаяся набором
ASCII-кодов. HTML документу нет нужды включать какие-либо символы,
чей десятичный код превышает 127. Возможно «Возможно» (фр.Peut-tre)— фильм режиссёра Седрика Клапиша 1999 года., что такой механизм Механизм (греч. mechan— машина)— это совокупность совершающих требуемые движения тел (обычно— деталей машин), подвижно связанных и соприкасающихся между собой. Механизмы служат для передачи и преобразования движения.
пересылки, как электронная почта, наложит ограничения на количество
битов в байтах кодировки документа, хотя протокол HTTP, используемый
в программе W3, всегда «Всегда» — кинофильм. Детям рекомендуется просмотр совместно с родителями. позволяет передавать 8-битные данные.
Если документ HTML кодируется с использованием 7-битных символов,
то для кодировки символов из верхней половины набора ISO Latin-1
могут использоваться механизмы Механизм (греч. mechan— машина)— это совокупность совершающих требуемые движения тел (обычно— деталей машин), подвижно связанных и соприкасающихся между собой. Механизмы служат для передачи и преобразования движения. обращений по числовому значению и
обращения к объектам. Таким образом, могут быть приготовлены
документы, пригодные к пересылке по системам с 7-битными
ограничениями.
Введение Введение — в собственном смысле — предварительные сообщения общего характера, предпосылаемые произведению, обычно научного характера, с целью ввести читателя в курс предмета.
Язык разметки гипертекста (HyperText Makeup Language - HTML)
формулируется в терминах языка стандартной обобщенной разметки
(Standard Generalized Markup Language - SGML) []. Язык SGML
представляет собой метод создания структурированных документов, а
также языков для их разметки.
В языке SGML каждый документ имеет три части: -
Декларации
Декларация(фр. declaration-заявление)— 1) в конституционном праве название политико-юридических актов, имеющее целью придать им торжественный характер, подчеркнуть их особо важное значение для судеб соответствующего государства (напр., Декларация о государственном суверенитете РСФСР, Декларация прав и свобод человека и гражданина РСФСР). Специфической чертой Д. как нормативно-правового акта является общий, неконкретный характер содержащихся в них положений, требующий дополнительного законодательного регулирования; 2) в международном праве торжественный акт, формулирующий согласованные сторонами общие принципы и цели. языка SGML, привязывающие к определенным значениям
параметры обработки, а также имена синтаксис Синтаксис (от др.-греч. — «построение, порядок, составление»)— раздел лингвистики, изучающий строение предложений и словосочетаний.а. Например,
декларация SGML в описании типа документа HTML объявляет, что
строка, с которой начинается метка, - это </ , а максимальная
длина имени составляет 40 символов.
- Пролог, состоящий из одной или нескольких деклараций о типе
документа. Они определяют типы элементов, взаимосвязи между
элементами и их атрибуты, а также условные обозначения, которые
могут быть задействованы при разметке. Декларация
Декларация(фр. declaration-заявление)— 1) в конституционном праве название политико-юридических актов, имеющее целью придать им торжественный характер, подчеркнуть их особо важное значение для судеб соответствующего государства (напр., Декларация о государственном суверенитете РСФСР, Декларация прав и свобод человека и гражданина РСФСР). Специфической чертой Д. как нормативно-правового акта является общий, неконкретный характер содержащихся в них положений, требующий дополнительного законодательного регулирования; 2) в международном праве торжественный акт, формулирующий согласованные сторонами общие принципы и цели. HTML DTD,
например, указывает, что элемент HEAD содержит по крайней мере
один элемент TITLE.
- Данные, которые состоят из разметки документа и собственно
информации.
Мы используем термин HTML для обозначения как типа документа, так
и языка разметки для кодировки документов данного типа.
Все документы типа HTML придерживаются единых деклараций языка
SGML и пролога. Следовательно, реализации программы WorldWide Web в
общем случае лишь передают и сохраняют ту часть документа HTML,
которая содержит данные. Чтобы создать для обработки на анализаторе
SGML объект с документом, необходимо поставить текст HTML DTD перед
имеющимися данными.
И наоборот, для реализации анализатора языка HTML необходимо лишь
воссоздать те части анализатора SGML, которые необходимы для разбора
данных, появляющихся вслед за разбором деклараций HTML DTD.
Структурированный текст
Данные в формате HTML похожи на текстовой файл, за исключением
того, что некоторые из символов интерпретируются как разметка.
Разметка придает документу некую структуру.
Данные Данные (калька от лат.data) — это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. представляют собой иерархию элементов. Каждый элемент имеет
имя, атрибуты и несет некую информацию. Большинство Большинство — большая часть чего-либо. Под большинством в редких случаях имеют ввиду абсолютное большинство, то есть более половины какой-либо группы. Обычно большинство означает количественное преимущество одной части над другой. К примеру, треть и четверть. элементов
представлены в документе в виде начальной метки, указывающей имя и
атрибуты. Далее следует собственно содержание элемента. И наконец,
заканчивает все это конечная метка. Например,
<HTML>
<TITLE>
Простой блок данных
</TITLE>
<H1>
Пример структуры
</H1>
Обычный параграф
<P>
<UL>
<LI>Первая запись, включающая
<A NAME="URI">
текст
</A>
<LI>Вторая запись
</UL>
</HTML>
(прим.ред. 2)
Некоторые элементы языка (такие как P, LI) являются пустыми. Они
не имеют поля данных, и ограничиваются лишь начальной меткой.
В остальных элементах поле данных представляет собой набор
символов и вложенных элементов. Заметим, что описание HTML DTD
фактически накладывает некие ограничения на количество допустимых
вложений - большинство Большинство — большая часть чего-либо. Под большинством в редких случаях имеют ввиду абсолютное большинство, то есть более половины какой-либо группы. Обычно большинство означает количественное преимущество одной части над другой. К примеру, треть и четверть. элементов не могут быть вложены в другие
элементы. Ни один из элементов не может быть вложенным сам в себя
рекурсивным образом. Анкеры и выделенные символы могут быть помещены
в другие конструкции.
(прим.ред. 3)
Метки
Каждый элемент начинается с метки, меткой же и заканчивается
каждый непустой элемент. Начальные метки выделяются символ Символ— особая коммуникационная модель, интегрирующая индивидуальные сознания в единое смысловое пространство культуры. Его функция связана с «интеграцией коллективного сознания в рамках единого смыслового пространства» и с «предельной индивидуализацией смысловых „миров“». Диалогическая структура символа выполняет интегративную и индивидуализирующую функции.ами < и >,
а конечные - символами </ и >.
Имена
Имя элемента следует в метке сразу за символом открытия <. Имя
начинается с буквы, за которой могут следовать еще 33 буквы, цифры,
пробела или дефиса. В именах игнорируется разница между прописными и
строчными буквами.
Атрибуты
Начальная метка позволяет вставить между именем и символом >
пробелы и атрибуты. Атрибут состоит из имени, символа равенства и
значения. Слева и справа от символа равенства можно оставлять
пробелы.
Значение Значение— ассоциативная связь между знаком и предметом обозначения. атрибута указывается в виде строки, заключенной в
одинарные или двойные кавычки Кавычки — парный знак препинания, который употребляется для выделения прямой речи, цитат, отсылок, названий литературных произведений, газет, журналов, предприятий, а также отдельных слов, если они включаются в текст не в своём обычном значении, используются в ироническом смысле, предлагаются впервые или, наоборот, как устаревшие, и т. п..
Чтобы определить значение атрибута, осуществляется анализ данной
строки в формате RCDATA (см. ниже). Например, такой подход позволяет
представлять символы кавычек в значении атрибута как обращения к
символам по числовому значению. Длина строки со значением атрибута
после такого анализа не должна превышать 1024 символов.
Типы элементов
Имя метки соотносится с типом элемента, объявленным в декларации Декларация(фр. declaration-заявление)— 1) в конституционном праве название политико-юридических актов, имеющее целью придать им торжественный характер, подчеркнуть их особо важное значение для судеб соответствующего государства (напр., Декларация о государственном суверенитете РСФСР, Декларация прав и свобод человека и гражданина РСФСР). Специфической чертой Д. как нормативно-правового акта является общий, неконкретный характер содержащихся в них положений, требующий дополнительного законодательного регулирования; 2) в международном праве торжественный акт, формулирующий согласованные сторонами общие принципы и цели.
HTML DTD. Объявление типа элемента ассоциирует его имя со -
списком атрибутов, их типом и статусом
-
типом данных (EMPTY, CDATA, RCDATA, ELEMENT или MIXED),
определяющим синтаксис элемента
-
моделью данных, задающей шаблон
Шаблон в технике— пластина (лекало, трафарет ит.п.) с вырезами, по контуру которых изготовляются чертежи или изделия либо инструмент для измерения размеров. для вложенных элементов и данных
Пустые элементы
Пустые Пустые (яп. уро, «пустота»; с помощью фуриганы получает прочтение [хоро:], от англ.hollow— «пустой»), «минусы»— вымышленные существа, злые духи в аниме и манге «Блич». Пустые живут в альтернативной реальности Уэко Мундо, которая находится между Землей и Сообществом душ («раем»). Они иногда отправляются в реальный мир, чтобы питаться душами живых людей; особенно опасны, так как большинство людей не могут их видеть. Чтобы справляться с пустыми, земной мир патрулируют проводники душ. Как и проводники душ, пустые отличаются друг от друга по боевым способностям. Некоторые, наиболее сильные, могут пользоваться уникальными боевыми приёмами, а эволюционировавшие пустые— арранкары,— получив часть способностей проводников душ, получают и возможность владеть мечом. элементы имеют в своей декларации ключевое слово EMPTY.
Например:
<!ELEMENT HR - 0 EMPTY>
Это означает, что
| <HR> | - допустимо |
| <HR>текст</HR> - | недопустимо |
Текст
Ключевое слово CDATA указывает на то, что элемент содержит текст.
Текстом считается любая информация, расположенная до метки
завершения. Например, декларация
<!ELEMENT XMP - - CDATA>
определяет, что нижеприведенный текст является приемлемым XMP
элементом.
| <xmp>Here's an example. It looks | Это пример Пример рассматривается в риторике чаще всего в контексте доказательств и аргументов. Для Квинтилиана пример является одним из дополняющих, наглядных доводов к высказыванию, либо упоминанием полезного, настоящего или якобы существующего образца убеждения того, что определено тобой одним. Правда, в отличие от доказательств, связь с предметом обсуждения должна быть установлена прежде автором или оратором.. Хотя и |
| like it has <tags> and | кажется, что он содержит |
| <!--comments--> in it, but | метки и комментарии, это |
| it does not. Even this | не так. Текстом является |
| </ is data.</xmp> | даже </ . |
Встреченная в тексте комбинация </ идентифицируется как начальный
ограничитель завершающей метки только тогда, когда за ней следует
буква. Но как только начальный ограничитель завершающей метки
опознан, текст элемента CDATA завершается. Следующий пример содержит
ошибку:
<xmp>There is no way to represent </end> tags in CDATA </xmp>.
Заменяемый текст
Элементы, содержащие данные типа RCDATA, очень похожи на элементы
с данными CDATA. Отличие состоит в том, что содержащийся в них текст
может содержать обращения к объектам и обращения к символам по их
числовому значению. Элементы, объявленные как
<!ELEMENT TITLE - - RCDATA>
могут содержать любой набор символов в своем тексте.
Обращения к символам по числовому значению
Если пользователь Пользователь— лицо или организация, которое использует действующую систему для выполнения конкретной функции. хочет использовать в своих документах какой-либо
символ, уже зарезервированный в качестве элемента разметки, то ему
следует воспользоваться обращением к нужному символу. Строка &#, за
которой следует буква или цифра, указывает на применение условного
обозначения вместо символа. За ограничителем следуют цифры
десятичного числа и точка с запятой. Например,
<title>You can even represent </end> tags in RCDATA </title>
Обращения к объект Объект (лат.objectum— предмет)— философская категория, если определять её в пределах эпистемологии, выражающая нечто, существующее в реальной действительности (то есть независимо от сознания)— предмет, явление или процесс, на которые направлена предметно-практическая и познавательная деятельность субъекта (наблюдателя). В качестве объекта может выступать и сам субъект, в качестве субъекта выступает личность, социальная группа или всё общество.ам
(прим.ред. 4)
В декларация Декларация(фр. declaration-заявление)— 1) в конституционном праве название политико-юридических актов, имеющее целью придать им торжественный характер, подчеркнуть их особо важное значение для судеб соответствующего государства (напр., Декларация о государственном суверенитете РСФСР, Декларация прав и свобод человека и гражданина РСФСР). Специфической чертой Д. как нормативно-правового акта является общий, неконкретный характер содержащихся в них положений, требующий дополнительного законодательного регулирования; 2) в международном праве торжественный акт, формулирующий согласованные сторонами общие принципы и цели.х HTML DTD объявлены объекты для символов "менее,
чем", "больше, чем" и "амперсанд", а также для каждого символа из
набора ISO Latin 1. Так что Вам предоставляется возможность Возможность — направление развития, присутствующее в каждом явлении жизни; выступает и в качестве предстоящего, и вполне объяснимо рациональным путем: в каждой возможности присутствует вероятная невозможность, «возможность невозможного». Возможность не определяется познанием того, что может быть. Познание вероятностей, возможностей не всегда влияет на нашу возможность. На изучении возможности основывается, главным образом, исследование бытия и события.
обращаться к символам не только по номеру, но и по имени.
Если за строкой & следует буква или цифра, то это обозначает
обращение к объекту. За разграничителем должны следовать имя объекта
и точка с запятой. Например,
Kurt Gödel was a famous logician and mathematician.
Замечание. Убедитесь, что строки документа не содержит никаких
неучтенных символов разметки. При написании документов на
языке HTML следует замещать все встречающиеся символы <,> и
& на обращения к символам по числовому значению или
обращения к объектам.
Модели данных в элементе
В некоторых элементах указывается ключевое слово, определяющее не
тип, а модель Модель (фр.modle, от лат.modulus— «мера, аналог, образец»)— некоторый материальный или мысленно представляемый объект или явление, являющийся упрощённой версией моделируемого объекта или явления (прототипа) и в достаточной степени повторяющий свойства, существенные для целей конкретного моделирования(опуская несущественные свойства, в которых он может отличаться от прототипа). данных. Это означает допустимость применения не только
данных, но и вложенных элементов. Если модель данных в элементе не
включает символа #PCDATA, то информация в поле данных относится к
рассматриваемому элементу. Пробелы Пробел— интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания. в поле данных такого элемента
рассматриваются как разметка и игнорируются. Символы, не являющиеся
разметкой, и следовательно, относящиеся к данными, недопустимы.
Например, декларация
<!ELEMENT HEAD - - (TITLE? & ISINDEX? & NEXTID? & LINK*)>
объявляет элемент, который можно использовать следующим образом
<head>
<isindex>
<title>Head Example</title>
</head>
Однако следующие примеры содержат ошибки
<head> no data allowed! </head>
(данные в этом элементе недопустимы)
<head><isindex><title>Two isindex tags</title><isindex></head>
(дважды встречается метка isindex)
Смешанные данные
Если в элементе модель данных содержит символ #PCDATA, то
содержимое такого элемента рассматривается как смесь нескольких
элементов. Например,
<!ELEMENT PRE - - (#PCDATA | A | B | I | U | P)+>
<!ATTLIST PRE
WIDTH NUMBER #implied
>
Это означает, что элемент PRE состоит из одного или нескольких
элементов или текстов A, B, I, U или P. Пример PRE элемента:
<pre>
<b>NAME</b>
cat -- concatenate<a href=#>
<b>EXAMPLE</b>
cat <xyz
</pre>
Содержимое предыдущего элемента PRE рассматривается как
A B element
The string '' cat -- concatenate''
An A element
The string ''\n''
Another B element
The string ''\n cat <xyz''
Комментарии и другая разметка
Если Вы хотите включить в HTML документ комментарий таким образом,
чтобы он игнорировался анализатором, поставьте перед ним и после него
ограничители <!-- и --> соответственно. Весь текст, расположенный
между начальным ограничителем и символами --, будет игнорироваться.
Следовательно, комментарии не могут быть вложенными. В заключительном
ограничителе между -- и символом > можно вставлять пробелы (но в
начальном ограничителе между <! и -- вставки не допускаются).
Например,
<HEAD>
<TITLE>HTML Guide: Recommended Usage</TITLE>
<!-- $Id: recommended.html,v 1.3 93/01/06 18:38:11 connolly Exp $ -->
</HEAD>
В языке SGML есть несколько конструкций, которые в HTML будут
нежелательны или воспринимаются как ошибка Ошибка— несоответствие между объектом или явлением, принятым за эталон (материальный объект, решение задачи, действие, которое привело бы к желаемому результату), и объектом/явлением, сопоставленным первому..
Ограничитель
| <? | Инструкция для обработки. Заканчивается символом >. |
| <![ | Выделенная часть документа. В языке HTML выделенные
части нежелательны. См. описание SGML стандарта. |
| <! | Выделенная декларация. Заканчивается символом >. Язык
HTML не объявляет карту коротких ссылок. Поэтому такая
конструкция Конструкция — инженерное решение архитектурного сооружения, строения, машины относительно структуры, плана и взаимного расположения. будет ошибочной. |
|---|
Разделители строк
Разделитель строки рассматривается как элемент разметки (и
соотвественно игнорируется), если он помещен в элемент в начале или
конце поля данных. Это позволяет Вам писать либо
<pre>some example text</pre>
либо
<pre>
some example text
</pre>
Оба примера будут обработаны одинаковым образом.
Кроме того, если строка документа не является пустой, но все равно не
содержит информацию для анализатора, она будет игнорироваться
полностью. Например, элемент
<pre>
<!-- this line is ignored, including the linebreak character -->
first line
third line<!-- the following linebreak is content: -->
fourth line<!-- this one's ignored because it's the last piece of
content: -->
</pre>
содержит лишь строки
first line
third line
fourth line
Пробелы и табуляторы
Символы пробелов должны воспроизводиться как горизонтальные
пробелы. В языке HTML несколько рядом стоящих символов пробела должны
воспроизводиться как один пробел.
Порядок воспроизведения символа горизонтальной табуляции (HT) не
определен, и поэтому символ HT не должен использоваться в документах,
за исключением тех случаев, когда он является частью элемента PRE
(либо вышедших из употребления XMP, LISTING и PLAINTEXT).
Ни пробелы Пробел— интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания., ни табуляторы нельзя использовать для того, чтобы
сделать документ в формате SGML более красивым и легко читаемым.
Список инструментария для разметки
Следующие разделители могут, в зависимости от контекста,
производить разметку
| Разделитель | Его значение Значение— ассоциативная связь между знаком и предметом обозначения. |
| <!-- | комментарий |
| &# | обращение к символу по числовому значению |
| & | обращение к объекту |
| </ | метка завершения |
| <! | декларация элемента разметки |
| ]]> | конец выделенной части документа (приводит к ошибке) |
| < | начальная метка |
Элементы языка HTML
Здесь приведен список элементов, используемых в языке HTML.
Документы должны (но не обязательно) содержать элемент HEAD, за
которым следует элемент BODY.
Документы старого типа могут содержать лишь данные обычных
элементов HEAD и BODY, причем в любом порядке. Это осуждается, но тем
не менее, анализаторы должны воспринимать такое построение документа.
Обратите внимание Внимание— избирательная направленность восприятия на тот или иной объект. также на статус элементов.
Общие свойства документа
HEAD
Элемент HEAD содержит всю информацию о документе в целом. Однако
он не содержит какого-либо текста. Последний является лишь частью
документа и должен находиться в элементе BODY. В элементе заголовка
HEAD можно использовать лишь строго заданный набор элементов.
Нижеприведенные элементы определяют общие свойства документа. Они
должны появляться в элементе HEAD. Порядок элементов значения не
имеет.
| TITLE | Название элемента. |
| ISINDEX | Элемент, посылаемый серверу вместе с документом,
предназначенным для информации к поиску. . |
| NEXTID | Параметр Параметр (от др.-греч. — соразмеряю)— величина, значения которой служат для различения групп элементов некоторого множества между собой. (Следует отличать от идентификатора отдельного элемента.), используемый текстовыми редакторами для создания ,
уникальных идентификатор Идентификатор, ID (англ.data name, identifier — наименование данных) - это уникальный признак объекта, позволяюший различать объекты и/или объект по идентификатору.ов. ,
(Устарел и не рекомендуется использовать. Прим.ред.). |
| LINK | Элемент, определяющий связь этого документа с другими. В ,
документе может присутствовать несколько элементов LINK. ,
См. описание связей между документами и описание элемента ,
Анкер. |
| BASE | Запись, сделанная на языке URL при фиксировании
данного , документа.
. |
|---|
(прим.ред. 5)
Форматирование текста
В элементе BODY документа встречаются элементы из приведенного
ниже списка. Они выстроены в том порядке, в каком должны подаваться
на устройство Устройство(также прибор, жарг.девайс— от англ.device)— рукотворный объект со сложной внутренней структурой, созданный для выполнения определённых функций, обычно в области техники. вывода.
Заголовки (Headings) | Язык поддерживает заголовки разделов
различных уровней. |
Анкеры (Anchors) | Части текста, которые формируют начало и/или конец связей в гипертексте, называются, анкерами и формируются меткой A. |
Метки параграфов (Paragraph marks) | Элемент P указывает на границу между параграфами. |
Стиль адреса (Address style) | Этот элемент указывает, в каком стиле предстает перед клиентом элемент ADDRESS. |
Выделенный блок текста.
(Blockquote style) | . |
| Списки | списки, словари Словарь— книга, информация в которой упорядочена c помощью разбивки на небольшие статьи, отсортированные по названию или тематике. Различают энциклопедические и лингвистические словари. и т.д. |
Преформатированный текст (Preformatted text) | Части текста, предварительно отформатированные с использованием шрифта фиксированной ширины. |
Выделение символов (Character highlighting) | Элементы форматирования, не вызывающие разбиения на параграфы. |
Графика
| IMG | Метка IMG может использоваться для включения в текст графических изображений. |
|---|
Устаревшие элементы
Элементы, не указанные выше, считаются устаревшими. Однако они должны
распознаваться анализаторами в целях совместимости с предыдущими
версиями языка.
BODY
В противоположность элементу HEAD элемент BODY содержит всю ту
информацию, из которой собственно и состоит рассматриваемый документ.
Порядок следования элементов здесь именно тот, в каком они предстают
перед читателем. См. далее список элементов, применимых в пределах
элемента BODY.
Анкер (элемент A)
(прим.ред. 3)
Анкер - это некий текст, который указывает на начало и/или конец
связи в гипертексте. Текст между открывающей и закрывающей метками
определяет начало связи или указываемое ею место (или и то, и другое
вместе). Метка анкера может иметь следующие атрибуты:
| HREF | Необязательный. (Адрес гипертекстовой ссылки. Прим.ред.)
Если атрибут HREF установлен, то анкер
является точно выверенный текстом - началом соединения. Если
читатель Чтение— один из важнейших видов речевой деятельности, тесно связанный как с произношением, так и с пониманием речи. Также «чтение»— это способность воспринимать, понимать информацию, записанную (передаваемую) тем или иным способом, воспроизводить техническими устройствами. выбрал этот текст, то ему (ей) будет представлен
другой элемент, чей сетевой адрес определяется значением
HREF атрибута. Формат сетевого адреса определяется в другом
месте. Такой подход позволяет с помощью формы
HREF="#индикатор" ссылаться на другой анкер в том же самом
документе. Если же анкер относится к другому документу,
атрибут является относительным именем, именем относительно
данного документа (либо он указывает базовый адрес, если
таковой имеется). |
| NAME | Необязательный. Если этот атрибут указан, то он позволяет
данному анкеру быть местом в документе, на которое ссылается
какой-либо анкер. Значение атрибута является идентификатором
анкера. Идентификатор анкера - это произвольная строка
текста, которая тем не менее уникальна в пределах
рассматриваемого HTML документа. Другие документы тоже могут
создавать ссылки именно на этот анкер, помещая его
идентификатор в поле адреса документа после символа #. |
| REL | Необязательный. Атрибут REL может дать взаимоотношение(ия) в
описанной ранее связи гипертекста. Значение атрибута - это
список значений для взаимоотношений, написанный через
запятую. Значения атрибута и их семантика будут
регистрироваться комитетом по языку HTML. Если ничего не
указано, то по умолчанию предполагается, что
взаимоотношениях не несут каких-либо значений. Атрибут REL
нельзя применять, если нет атрибута HREF. См. значения для
взаимоотношений, атрибут REV. |
| REV | Необязательный. Полностью аналогичен атрибуту REL за
исключением того, что тип соединения имеет обратную
семантику. Связь из анкера A в анкер B с атрибутом REL="X"
полностью аналогична связи из B в A с атрибутом REV="X".
Анкер может иметь оба атрибута REL и REV. |
| URN | Необязательный. Если этот атрибут указан, то это определяет
универсальный номер ресурса для данного документа. |
| TITLE | Необязательный. Данный атрибут является чисто
информационным. Если атрибут присутствует в анкере, его
значение должно (может прим.ред.) совпадать со значением элемента
TITLE в документе, чей адрес указан в атрибуте HREF. См. замечание 2. |
| METHODS | Необязательный. Значение этого атрибута - строка. Она
должна представлять собой список через запятую методов
HTTP, которые программа общего пользования в состоянии
поддерживать. См. замечание 3. |
|---|
Все приведенные выше атрибуты являются необязательными, хотя для
того, чтобы анкер действовал, нужны NAME и HREF. См. также описание
LINK.
Пример использования анкеров
See <A HREF="http://info.cern.ch/">CERN</A>'s information
for more details.
A <A NAME=serious>serious</A> crime is one which is
associated with imprisonment.
The Organization may refuse employment to anyone convicted
of a <a href=#>
Замечание 1. Универсальные номера для ресурсов (Universal resource
numbers - URN) должны обеспечивать распознавание документа в
случае обнаружения его дубликатов. Должно существовать программное
обеспечение клиента, осуществляющее отсев копий для уже имеющейся
информации.
Формат номеров URN обсуждается различными рабочими группами из
инженерного подразделения сети Internet (1993).
(На сегодняшний день спецификация URN не определена. Прим.ред.)
Замечание 2. Атрибут названия для связей (TITLE).
Соединение может содержать атрибут TITLE. Если этот атрибут
имеется, он должен давать название документа, чей адрес определен
в атрибуте HREF. Есть по крайней мере две причины для
использования такого атрибута.
- Программа просмотра может запросить показ названия документа
в качестве предварительного условия для его выборки. Например,
в виде метки с записью, или маленького ящика, возникающего,
когда мышь попадает на анкер или же при вызове документа.
- Некоторые документы не имеют названия, так что использование
атрибута названия для связи является для них единственным
способом получить название. В основном это документы, не
являющиеся размеченным текстом, графикой, текстом и меню для
программы Gopher. Именно так работает упомянутая программа
Gopher. Очевидно, что это приводит к дублированию данных и было
бы рискованно безоглядно надеяться на то, что атрибут названия
у соединения будет корректным и уникальным для соответствующего
документа.
Замечание. 3 Атрибут метода для связи (METHODS).
Анкеры и связи используют атрибут метода для указания действий,
которые клиент может применять к объектам. Эти действия более
точно формулируются в HTTP протоколе, если таковой применяется.
Однако этот атрибут, как и атрибут TITLE, в силу некоторых причин
может использоваться для повышения информативности соединения.
Например, программа чтения может вызывать различные способы
визуализации информации в зависимости от разрешенного в атрибуте
метода (например, клиент, осуществляющий поиск, может пользоваться
различными иконами).
Элемент ADDRESS
Данный элемент предназначен для указания адреса, подписей,
авторства и т.д. Элемент появляется часто в начале или конце
документа.
Типовая обработка элемента. Обычно элемент адреса использует
наклонный шрифт, а также его текст может быть выровнен по правой
границе листа. Элемент адреса применяет символ конца параграфа.
Разбивка элемента адреса на отдельные параграфы не приводит к
появлению в самом тексте документа каких-либо пустых мест.
Примеры использования
<ADDRESS><A HREF="Author.html">A.N.Other</A></ADDRESS>
<ADDRESS>
Newsletter editor<p>
J.R.Brown<p>
JimquickPost News, Jumquick, CT 01234<p>
Tel (123) 456 7890
</ARRDESS>
Элемент BASE
Элемент BASE позволяет документу самому назначать URL в случаях,
когда он может быть прочтен извне (либо переназначить URL, если это
необходимо. Прим.ред). Метки URL в документе могут иметь
сокращенную форму и указывать смещение относительно некого базового
адреса.
Где бы не был указан базовый адрес, для работы с сокращенными URL
читатель будет применять главный URL, используемый для адресации
документа в целом.
Элемент BASE может иметь только один атрибут - HREF.
(Данный элемент применяется только в элементе HEAD. Прим.ред.)
Элемент выделения блока (BLOCKQUOTE)
Элемент BLOCKQUOTE допускает обработку специальным образом текста,
выделенного в каком-либо источнике.
Типовая обработка элемента. Типовая обработка может заключаться в
дополнительном смещении текста влево или вправо и/или в
использовании наклонного шрифта. Элемент BLOCKQUOTE приводит к
разбиению текста на параграфы, а также обычно к появлению пустой
строки Строки (укр. Строки) — село в Теофипольском районе Хмельницкой области Украины. или пробелов между выделенным блоком и предшествующим/
последующим текстом.
Обработка с единым шрифтом может, к примеру, привести к появлению
в начале строки символа ">", что соответствует стилю выделения в
системе Internet почты.
Пример:
I think it ends
<BLOCKQUOTE>Soft you now, the fair Ophelia, Nymph, in thy orisons,
be all my sins remembered.
</BLOCKQUOTE>
but I am not sure.
Заголовки (Headings)
(прим.ред. 6)
Обрабатывается до шести уровней заголовков (Заметим, что узел
в гипертексте, как правило, нуждается в меньшем количестве уровней, чем
сочинение, чья структура целиком определяется применением
заголовков). Элемент заголовка несет в себе все изменения шрифтов,
разбиение на параграфы до и после, пробелы, необходимые, например,
для обработки заголовка. Язык HTML не требует применения иных средств
для выделения символов или разбивки текста на параграфы.
Заголовок H1 относится к самому верхнему уровню и рекомендуется в
качестве начального для узла в гипертексте. Предполагается, что текст
первого заголовка будет соответствовать запросам клиента, уже
производящего анализ связанной с этим узлом информации. Это отличает
заголовок (heading) от названия (title), которое должно
характеризовать данный узел в более широком плане.
Элементы заголовка: <H1>, <H2>, <H3>, <H4>, <H5>, <H6>.
Было бы отклонением от правил при переходе от заголовка к
заголовку пропускать какой-либо уровень, например, ставить после
элемента H1 сразу элемент H3. Хотя такая практика и не запрещена, но
нежелательна и может привести к странным результатам при написании
других реализаций языка HTML.
Пример
<H1>This is a heading</H1>
Here is some text
<H2>Second level heading</H2>
Here is some more text
Замечание Христианин
Крещение
Спасение · Исповедь
Благодать
Церковь · Таинства
Церковный брак
Церковные взыскания
Грех
Христианские добродетели
Благочестие
Любовь · Милосердие
Смирение · Скромность
Искренность · Кротость
Терпение · Молитва об анализаторах. Анализаторы не должны накладывать
какие-либо ограничения на порядок элементов-заголовков, даже если при
переходе с заголовка на заголовок допускается пропуск промежуточных
уровней. (прим.ред. 7)
Типовые методы обработки
| H1 | Толстый, очень крупный шрифт, текст центрирован. Между
заголовком и последующим текстом вставляется одна или две
пустых строки. При выводе на принтер Принтер(от англ.print - печать) - периферийное устройство компьютера, предназначенное для перевода текста или граффики на физический носитель, из как правило, хронящегося в электронном ввиде. заголовок печатается
на новой странице. |
| H2 | Толстый крупный шрифт. Без отступа. До и после заголовка
помещаются одна или две пустых строки. |
| H3 | Наклонный большой шрифт. До и после заголовка помещаются
одна или две пустые Пустые (яп. уро, «пустота»; с помощью фуриганы получает прочтение [хоро:], от англ.hollow— «пустой»), «минусы»— вымышленные существа, злые духи в аниме и манге «Блич». Пустые живут в альтернативной реальности Уэко Мундо, которая находится между Землей и Сообществом душ («раем»). Они иногда отправляются в реальный мир, чтобы питаться душами живых людей; особенно опасны, так как большинство людей не могут их видеть. Чтобы справляться с пустыми, земной мир патрулируют проводники душ. Как и проводники душ, пустые отличаются друг от друга по боевым способностям. Некоторые, наиболее сильные, могут пользоваться уникальными боевыми приёмами, а эволюционировавшие пустые— арранкары,— получив часть способностей проводников душ, получают и возможность владеть мечом. строки. С небольшим отступом. |
| H4 | Толстый нормальный шрифт. Отступ Отступ— отклонение от края колонки одной или нескольких строк, идущих подряд. больше, чем в H3. До и
после заголовка помещается пустая строка. |
| H5 | Наклонный нормальный шрифт. Отступ как у заголовка H4.
Пустая строка ставится перед заголовком, но не после. |
| H6 | Толстый шрифт. Отступ такой же, как у обычного текста и
больше, чем у H5. Перед заголовком ставится пустая строка. |
|---|
Эти типовые значения являются всего лишь указанием для анализатора
в программе просмотра гипертекста. Клиент может получить опции для
самостоятельной настройки стилей. Но при написании документов Вы
должны исходить из того, что где бы ни появился элемент заголовка, он
будет иметь именно тот эффект, как описано выше.
Программа обработки гипертекста обязана автоматически вставлять
пробел между элементами, так что необязательно и даже неправильно
будет ставить после элемента заголовка символ конца параграфа.
IMG: Встроенные изображения
Статус: дополнительный
Элемент IMG позволяет вставлять информацию из другого документа.
Последний обычно является иконкой, маленькой картинкой и т.д. Элемент
IMG не предназначен для вставки дополнительного HTML текста.
Те анализаторы гипертекста, которые не могут показывать встроенные
изображения, элементы IMG игнорируют. Авторам документ Документ (от лат.documentum— «образец, свидетельство, доказательство») — материальный объект, содержащий информацию в зафиксированном виде и специально предназначенный для её передачи во времени и пространстве .ов следует
взять на заметку, что некоторые анализаторы могут показывать (или
печатать на принтере) связанные с данным документом изображения, но не
встроенные. Если изображение имеет большое значение, может оказаться
более разумным создать с ним связь, нежели делать это изображение
встроенным в гипертекст. Если же изображение является в значительной
степени декоративным, более удобным будет применение элемента IMG.
Элемент IMG является пустым (не имеет заключительной метки) и
имеет два атрибута:
| SRC | Значением этого атрибута является URL документа, который
должен быть вставлен в гипертекст. Синтаксис этого атрибута
такой же, как и у атрибута HREF для метки A. Атрибут SRC
является обязательным. |
| ALIGN | Это атрибут, принимая значения TOP, MIDDLE или BOTTOM,
определяет, верхняя Верхняя— река в России, протекает по территории Онежского района Архангельской области., средняя или нижняя часть изображения
должна быть поставлена вровень с текстом. |
|---|
В тексте анкеров допускается применение элементов IMG.
Пример
Warning: < IMG SRC ="triangle.gif">
Thus must be done by a qualified
technician.
< A HREF="Go">< IMG SRC ="Button"> Press to start</A>
ISINDEX
Элемент ISINDEX информирует читателя о том, что данный документ
является индексным указателем. По его прочтении клиент может
применять поиск по ключевому слову. К узлу гипертекст Гипертекст— термин, введённый Тедом Нельсоном в 1965 году для обозначения «текста ветвящегося или выполняющего действия по запросу». Обычно гипертекст представляется набором текстов, содержащих узлы перехода между ними, которые позволяют избирать читаемые сведения или последовательность чтения. Общеизвестным и ярко выраженным примером гипертекста служат веб-страницы— документы HTML (язык разметки гипертекста), размещённые в Сети. В более широком понимании термина, гипертекстом является любая повесть, словарь или энциклопедия, где встречаются отсылки к другим частям данного текста, имеющие отношения к данному термину. В компьютерной терминологии, гипертекст— текст, сформированный с помощью языка разметки, потенциально содержащий в себе гиперссылки.а можно
обратиться при поиске по ключевому слову, сопроводив адрес узла
знаком вопроса и списком ключевых слов, разделенных символами плюса.
См. формат сетевого адреса.
Заметим, что эта метка обычно автоматически генерируется сервером.
Если метка ISINDEX добавлена в документ HTML вручную, то сделавший
это клиент предполагает, что данный сервер способен осуществлять
поиск в этом документе. Ведь очевидно, что сервер должен обладать такой
возможностью: простое добавление элементов <ISINDEX> в документ не
способствует успешному выполнению запросов на поиск, если сервер не
обладает требуемым для поиска инструментарием!
LINK
Элемент LINK появляется в границах элемента HEAD документа HTML.
Он используется для указания взаимоотношения между данным документом
и каким-либо другим объектом. Документ может иметь любое количество
элементов LINK. Элемент LINK является пустым (не содержит метки
завершения), но имеет те же атрибуты, что и элемент анкер.
Как правило, элемент используется для указания авторства,
соответствующих индексных указателей, словарей, предыдущих и
последующих версий документа и т.д. Связи могут формировать некую
статичную ветвящуюся структуру, где рассматриваемый документ
идентифицируется, например, ссылкой на "родительский", "последующий"
и "предыдущий" документы. Серверы также могут не препятствовать
установлению ссылок теми клиентами, которые не имеют прав на внесение
изменений в сам текст документа.
Формы списков в языке HTML
Словарь (или список определений, DL) - это список в виде
параграфов, каждый из которых имеет рядом с собой короткое название.
За пределами словарей этот элемент используется для предоставления
читателю набора названных элементов. В словаре допустимо применение
следующих элементов:
| DT | "Понятие Понятие— отображённое в мышлении единство существенных свойств, связей и отношений предметов или явлений; мысль или система мыслей, выделяющая и обобщающая предметы некоторого класса по определённым общим и в совокупности специфических для них признаков., термин Термин (от лат.terminus — предел, граница) — слово или словосочетание, точно и однозначно именующее понятие и его соотношение с другими понятиями в пределах специальной сферы. Термины служат специализирующими, ограничительными обозначениями характерных для этой сферы предметов, явлений, их свойств и отношений. В отличие от слов общей лексики, которые зачастую многозначны и несут эмоциональную окраску, термины в пределах сферы применения однозначны и лишены экспрессии.". Обычно помещается в текст словаря после
большого отступа слева. |
| DD | "Определение", которое может занимать много строк. |
|---|
Эти элементы должны появляться в словаре парами. Появление
элемента DT без сопровождающего DD недопустимо. Элемент DL может
иметь только один вид атрибута
|
COMPACT | предписывает применение компактного алгоритма обработки,
поскольку элементы списка по отдельности малы, либо весь
список достаточно велик, либо имеет место и то и другое. |
|---|
Типовой метод обработки
Пары элементов DT, DD в списке определений начинаются с одной и
той же строки. В каждой паре элемент DT стоит слева и занимает
примерно треть места на дисплее. Элемент DD стоит справа и занимает
оставшиеся две трети. Термин DT обычно занимает достаточно мало
места, чтобы уместиться в выделенной ему колонке. Если же термин
длиннее, то он будет продолжен на этой строке далее. В этом случае
текст элемента DD будет смещен на одну строку вниз, с тем, чтобы не
пересечься с термином DT. Либо термин DT может быть разбит на
несколько строк в левой колонке. Как правило, даже несмотря на
присутствие атрибута COMPACT, между следующими друг за другом парами
DT и DD остаются пробелы. Атрибут COMPACT применяется для списков,
имеющих большой Государственный академический Большой театр России (ГАБТ), Государственный академический театр оперы и балета России, или просто Большой театр— один из крупнейших в России и один из самых значительных в мире театров оперы и балета. Расположен в центре Москвы, на Театральной площади. размер и/или использующих пары элементов DT, DD,
которые занимают лишь одну-две строки. Конечно, программа обработки
может самостоятельно фиксировать такие случаи и принимать
соответствующие решения, что следует поощрять.
Атрибут COMPACT может также уменьшать левую колонку (колонку
терминов - DT).
Пример использования
<DL>
<DT>Term the first<DD>definition paragraph is reasonably
long but is still displayed clearly
<DT>Term2 follows<DD>Definition of term2
</DT>
<DL COMPACT>
<DT>Term<DD>definition paragraph
<DT>Term2<DD>Definition of term2
</DL>
Списки
Список Список— письменный перечень, число, состав; документ, содержащий перечень каких-либо сведений; в переносном смысле— буквальное, точное воспроизведение, копия; рукописная копия древнего памятника письменности. - это последовательность параграфов, каждому из которых
может предшествовать специальная метка или очередной номер. Синтаксис
списка:
<UL>
<LI> list element
<LI> another list element ...
</UL>
Открывающими метками для списка могут быть UL, OL, MENU или DIR.
Сразу за открывающей меткой должен следовать первый элемент списка.
Типовая обработка
Здесь мы не определяем порядок воспроизведения списков, однако
должны быть четко оговорены размеченный список для случая
неупорядоченных списков и очередь нумерованных параграфов для
упорядоченного списка. Среди других возможностей для интерактивного
показа списков - встроенные панели скроллинга для ускоренного
просмотра.
Список элементов, имеющих типовые алгоритмы обработки:
| UL | Список многострочных параграфов, обычно разделенных
несколькими пробелами и/или размеченный кружками или крупными
черными точками. |
| OL | Этот элемент похож на элемент UL, за исключением того, что
параграфы нумеруются. |
| MENU | Список параграфов меньшего размера. Обычно на одну запись
приходится лишь одна строка, а ее стиль более компактен, чем
в случае элемента UL. |
| DIR | Список элементов, чей размер, как правило, не превышает 20
символов. Элементы могут размещаться в несколько колонок Колонок, или сибирский колонок (лат.Mustela sibirica) — вид хищных млекопитающих из рода ласок и хорей. По генетическим признакам этот вид ближе всего к европейской норке, поэтому иногда их объединяют в один подрод. Некоторые ученые выделяют сахалинского колонка в самостоятельный вид, называемый итатси — Mustela itatsi. Сейчас там осталось лишь 200—300 итатси, обитающих, в основном, в поймах рек. на
странице, причем ширина Длина— физическая величина, числовая характеристика протяжённости линий. В узком смысле под длиной понимают линейный размер предмета в продольном направлении (обычно это направление наибольшего размера), то есть расстояние между его двумя наиболее удалёнными точками, измеренное горизонтально, в отличие от высоты, которая измеряется в вертикальном направлении, а также ширины или толщины, которые измеряются поперёк объекта (под прямым углом к длине). В физике термин «длина» обычно используется как синоним «расстояния» и обозначается L или l. такой колонки обычно 24 символа.
Намного лучше, если программа обработки в состоянии
оптимизировать ширину колонки в зависимости от ширины
составляющих ее элементов. |
|---|
Пример использования
<OL>
<LI> When you get to the station, leave
by the southern exit, on platform one.
<LI>Turn left to face toward the mountain
<LI>Walk for a mile or so until you reach the
"Asquith Arms" then
<LI>Wait and see ...
</OL>
< MENU >
<LI>The oranges should be pressed fresh
<LI>The nuts may come from a packet
<LI>The gin must be good quality
</MENU>
< DIR >
<LI>A-H<LI>I-M
<LI>M-R<LI>S-Z
</DIR>
P: Метка параграфа
Пустой элемент P служит разделителем параграфов. Конкретная
процедура обработки (отступы, инструкции и т.д.) здесь не
оговаривается и может зависеть от наличия иных меток, стилей и т.д.
Метка <P> ставится между двумя частями текста для их разделения.
Нет нужды применять <P> для создания пустого места вокруг
заголовка, списка, адреса или выделенных элементов, которые уже сами
по себе предполагают наличие разделителей параграфов. Создание пустых
мест вокруг перечисленных элементов - обязанность программы
обработки. Соседство метки разделителя параграфов и такого элемента,
который сам автоматически создает разделители параграфов, может
привести к непредсказуемым последствиям. Следует избегать того, чтобы
метке разделителя параграфов предшествовал или следовал за ней такой
элемент.
Типовая обработка
Обычно метка <P> создает небольшой вертикальный пропуск между
параграфами (одна строка или полстроки). Этого не происходит (как
правило) в тексте элементов ADDRESS и (даже) PRE. В некоторых версиях
в обычном тексте метка <P> может также создавать небольшой отступ
слева в первой строке открываемого ею параграфа.
Примеры использования
<h1>What to do</h1>
This is a one paragraph.<p>This is a second.
< P >
This is a third.
Примеры ошибок
<h1>P>What not to do</h1>
<p>I found that on my XYZ browser it looked prettier to
me if I put some paragraph marks
<p>
<ul><p><li>Around lists, and
<li>After headings.
</ul>
<p>
Mome of the paragraph marks in this example should
be there.
PRE: предварительно отформатированный текст
В языке HTML предварительно отформатированный текст отображается в
виде текста, использующего шрифт фиксированной ширины.
Необязательный атрибут этого элемента
| WIDTH | Этот атрибут задает максимальное количество символов, которые
может содержать строка текста. Эта информация позволяет
системе обработки выбирать соответствующие данному случаю
шрифты Шрифт (нем.Schrift schreiben — писать) — графический рисунок начертаний букв и знаков, составляющих единую стилистическую и композиционную систему, набор символов определенного размера и рисунка.
В узком типографском смысле шрифтом называется комплект типографских литер, предназначенных для набора текста. Шрифты являются неотъемлемой частью граффити, а также тэггинга и бомбинга. и отступ. В случаях, когда атрибут WIDTH не
идентифицирован, рекомендуется выбирать ширину 80 символов. В
случаях, когда атрибут WIDTH присутствует, рекомендуется
иметь фиксированный набор размеров 40, 80 и 132 символа,
остальные значения атрибута должны быть промежуточными. |
|---|
В пределах элемента PRE:
- В тексте символы конца строки обрабатываются как информация
Информация (от лат.informatio— осведомление, разъяснение, изложение, от лат.informare— придавать форму)— в широком смысле абстрактное понятие, имеющее множество значений, в зависимости от контекста. В узком смысле этого слова— сведения (сообщения, данные) независимо от формы их представления. Сведения об объектах живой или неживой природы, их свойств и взаимном влиянии друг на друга. к
переходу на начало следующей строки. Это не относится к строке
непосредственно предшествующей метке, или следующей за ней.
- Не должна применяться метка <p>. Если она все же обнаружена, то
должна интерпретироваться как команда перехода на начало
следующей строки.
- Могут применяться анкеры и элементы выделения символов.
- Не должны применяться элементы, определяющие формат
Формат— стандартизирование формы построения (и подачи) того или иного предмета (объекта), явления или процесса.ирование
параграфов (заголовки, адреса и т.д.).
- ASCII символ горизонтальной табуляции (HT) должен
интерпретироваться как наименьшее положительное количество
пробелов, остающихся до позиции, чей номер кратен 8. Однако
применение этого символа не рекомендуется.
Пример использования
<PRE WIDTH="80">
This is an example line
</PRE>
Замечание: выделение текста
В пределах предварительно отформатированного элемента
горизонтальное смещение должно осуществляться на определенное
количество позиций, чья ширина соответствует ширине символа. Это может
препятствовать или даже блокировать специальные смещения выделенных
элементов.
Замечание: границы строки
Вышеупомянутый термин "переход на начало следующей строки" не
должен восприниматься как предположение о том, что программа
обработки предварительно форматированного текста не может применять
(фиксированный) левый отступ Отступ— отклонение от края колонки одной или нескольких строк, идущих подряд.. Конечно, левый сдвиг ограничен
затребованной шириной строки.
Название документа
Название документа задается элементом TITLE. В документе элемент
TITLE должен быть частью элемента HEAD. Любой документ может иметь не
более одного названия. Название должно характеризовать содержание
элемента в более широком плане. Название не является всего лишь
частью текста в документе. Оно относится ко всему документу в целом.
Название не может содержать анкеры, разделители параграф Параграф (от греческого — написанное рядом)— мелкое подразделение текста внутри главы, раздела, обозначаемое обычно специальным знаком— § или пп.ов, выделение
символов. Название документа может использоваться при идентификации
узла в архивном списке, в качестве метки на окне, показывающем этот
узел гипертекста. Название, как правило, не появляется в текстовом
поле документа. Названия противопоставляются заголовкам. В идеале,
размер названия документа не должен превышать 64 символов. Это
необходимо, поскольку многие прикладные программы будут показывать
названия документов в качестве названий окон, в качестве опций меню и
в других полях ограниченного размера. Поскольку фактически нет
ограничений на длину названия документа (а само название может
формироваться в результате комбинирования некой дополнительной
информации), то, выбирая название создаваемому документу, следует
помнить, что оно может быть усечено другими программами, если
окажется для них слишком длинным.
Примеры использования
Примеры приемлемых названий
<TITLE>Rivest and Neuman. 1989(b)</TITLE>
или
<TITLE>A Recipe for Maple Syrup Flap-Jack</TITLE>
или
<TITLE>Introduction -- AFS user's Guide</TITLE>
Примеры неприемлемых заголовков
Заголовок, имеющий смысл лишь в случае привязки к конкретному
контексту
<TITLE>Introduction</TITLE>
или слишком длинный заголовок
<TITLE>Remarks on the Quantum-Gravity effects of "Bean
Pone"diversification in Mononucleosis patients in Developing
Countries under Economic Conditions Prevalent during
the Second half of the Twentieth Century, and Related Papers:
a Summary</TITLE>
Выделение символов
Элементы выделения позволяют форматировать отдельные части текста
особым образом, производить выделение и т.д. Метки выделения не
приводят к разбиению на параграфы и могут применяться к отдельным
кускам текста внутри параграфов. Как и все метки, не поддерживаемые
имеющимися версиями анализаторов языка HTML, эти метки будут
игнорироваться, однако размеченный ими текст будет обрабатываться как
и любой другой.
Все метки выделения имеют соответствующие им завершающие метки,
как в этом примере
This is <EM>emphasized</EM> text.
Практическая реализация одних стилей выделения более очевидна. Для
других - менее. Логические стили можно применять в любом месте, если,
к примеру, нет нужды ссылаться в тексте на процедуру форматирования
(например, "обязательно использование наклонного шрифта для отдельных
частей текста").
Замечание
Анализаторы, не способные изобразить какой-либо стиль выделения
символов, могут представить его с некоторой потерей качества
изображения Изображение— объект, образ, явление, в той или иной степени подобное (но не идентичное) изображаемому или сам процесс их создания. Подобие достигается вследствие физических законов получения изображения (например, оптическое изображение) либо результатом труда создателя изображения (например, рисунок, живопись, скульптура, сценический образ). Под изображением в узком смысле, подразумевают произведение в живописи или графике. с применением альтернативного стиля или стиля по
умолчанию. Некоторые версии анализаторов могут игнорировать все
метки, так что поставщикам информации желательно не придавать меткам
выделения большую смысловую нагрузку.
Имена для этих элементов заимствованы у макросов TeXInfo.
Физические стили
(лучше использовать термин - типографические. Прим.ред.)
| TT | Шрифт фиксированной ширины. |
| B | Толстый или еще каким-либо образом выделенный шрифт. |
| I | Наклонный шрифт (или искаженный каким-либо образом, если просто
наклон невозможен). |
| U | Подчеркивание Подчёркивание, подчерк (_)— символ ASCII, имеющий код 0x5F (hex), 95 (dec). На стандартной компьютерной клавиатуре этот символ расположен совместно со знаком дефиса на клавише, находящейся справа от клавиши 0.. |
|---|
Логические стили
| EM | Выделение символов (обычно наклон шрифта).
(смысловое усиление определенного слова или фразы. прим.ред.) |
| STRONG | Более четкое выделение (обычно применение более жирного
шрифта). (выделение, привлечение внимания. прим.ред.) |
| CODE | Пример кода. Обычно фиксированный шрифт (не путать с
элементом PRE).
(формулы, выражения. прим.ред.) |
| SAMP | Последовательность символов.
(названия команд, примеры. прим.ред.) |
| KBD | Текст, набираемый пользователем. Этот стиль применяется в описаниях. |
| VAR | Имя переменной.
(имена переменных в примерах, формулах. прим.ред.) |
| DFN | Пример определения к какому-либо термину. Обычно жирный
наклонный шрифт или просто жирный.
(Официально считается расширением в версии HTML 2.0. прим.ред.) |
| CITE | Цитата Цитата — дословная выдержка из какого-либо текста. При этом важно, что цитируемый (вставленный) текст однозначно идентифицируется как вставленный (то есть как часть другого текста). В русском языке и типографике цитаты принято оформлять в кавычках («», „“) или особым шрифтом (уменьшенным кеглем, со втяжкой, курсивом). В других языках способ оформления цитат и вид кавычек могут отличаться.. Обычно наклонный шрифт.
(названия документов, выдержки из документов, цитируемые фразы и
т.д. прим.ред.) |
|---|
Пример использования
This text contains an <em>emphasized</em> word.
<strong>Don't assume</strong> that it will be italic!
It was made using the <CODE>EM</CODE> element. A citation is
typically italic and was no formal necessary structure:
<cite>Moby Dick></cite> is a book title.
Устаревшие элементы
Следующие элементы являются устаревшими в языке HTML.
Рекомендуется, чтобы программы обслуживания клиента могли все же
обрабатывать эти устаревшие элементы с целью совместимости со старыми
серверами.
Plaintext (незакодированный текст)
Статус: устаревший
Пустая метка PLAINTEXT завершает документ на языке HTML. Позади
этой метки уже не ставятся какие-либо записи на языке SGML. Вместо
этого, по старому соглашению протокола HTTP, за меткой Plaintext
следует ASCII текст (в стандарте MIME тип данных "text/plain").
Пример использования элемента
<PLAINTEXT>
0001 This is line one of a ling listing
0002 file from <any.@host.inc.com> which is sent
Эта метка позволяет читать остаток файла более эффективно и без
какого-либо дополнительного анализа. Элемент Plaintext применяется
исключительно в целях оптимизации. Заключительная метка у данного
элемента отсутствует. Остаток файла не содержит также каких-либо
записей на языке SGML.
XMP и LISTING: поля примеров в документе
Статус Статус— абстрактный многозначный термин, в общем смысле обозначающий совокупность стабильных значений параметров объекта или субъекта. С упрощённой точки зрения статус объекта или субъекта— это его состояние.: устаревший
Данные элементы еще находят применение и должны распознаваться
применяющимися в настоящее время анализ Анализ (др.-греч. — разложение, расчленение)— операция мысленного или реального расчленения целого (вещи, свойства, процесса или отношения между предметами) на составные части, выполняемая в процессе познания или предметно-практической деятельности человека.аторами. С другой Другой — центральная категория современной философии. Актуализация данного понятия связана с такими событиями, как антропологический и лингвистический поворот. Другой — это не Я, тот, кто противостоит мне, находится по ту сторону меня, моих ценностей, моего мировоззрения. И вместе с тем, Другой такой же как Я: он мыслит, чувствует, ходит и т. д. стороны,
новые серверы должны использовать вместо этих элементов элемент
<PRE>. Стили XMP и LISTING позволяют включать в документ отдельный
кусок текста, состоящий из символов фиксированной ширины. Синтаксис Синтаксис (от др.-греч. — «построение, порядок, составление»)— раздел лингвистики, изучающий строение предложений и словосочетаний.
элементов
<LISTING>
...
</LISTING>
или
<XMP>
...
</XMP>
Текст, заключенный между начальной и конечной метками, будет
изображен с применением шрифта с фиксированной шириной символов.
Поэтому будет соблюдаться любое форматирование текста в следующих
друг за другом строках, выполненное символами пробела. Между
открывающей и закрывающей метками имеет место следующее:
- Текст может содержать любые печатные символы из набора ISO Latin,
за исключением символа открытия завершающей метки (см. Исторические
заметки).
- Имеют силу символы конца строки, за исключением следующей сразу за
открывающей меткой и непосредственно перед закрывающей меткой.
Символ конца строки следует обрабатывать как команду перехода на
начало новой строки.
- ASCII символ горизонтальной табуляции (HT) должен
интерпретироваться как наименьшее количество пробелов, остающихся
до позиции, чей номер кратен 8. Тем не менее, применять этот символ
не рекомендуется.
Элемент LISTING отображается в виде текста с количеством символов в
строке не более 132. Элемент XMP изображается с применением такого
шрифта, что в строке помещается до 80 символов, в остальном он
аналогичен элементам LISTING.
Выделение выражений HP1 и т.д.
Статус: устаревший
Как и все остальные, эти элементы могут игнорироваться, если нет
соответствующего программного обеспечения. Следует заменять их более
информативными элементами - см. Выделение символов.
Примеры использования
<HP1> ... </HP1> <HP2> ... </HP2> и т.д.
(В последних версиях спецификации HTML этот элемент устранен. прим.ред.)
Комментарии
Элемент комментария используется для заключения в скобки текста,
нужда в котором отпала. Комментарий был задействован в некоторых
анализаторах, однако в новых версиях программ он будет заменен
характерными командами языка SGML.
Исторические заметки: XMP и LISTING
Исторически элементы XMP и LISTING использовались для указания
спецификации, отличающейся от языка SGML. В этой спецификации текст
мог иметь любые печатные символы из набора ISO Latin, а также символ
начала метки, поскольку завершающая метка в этой спецификации
отсутствовала вовсе.
Такой формат текста не поддерживается языком SGML и, таким
образом, не является интерпретацией языка HTML. Поставщикам
информации следует помнить о том, что разработчики могут менять
интерпретацию завершающих меток, вероятно встречающихся в этих
элементах.
Объекты
(Entities. Прим.ред.)
В языке HTML применяются нижеуказанные имена объектов. Этим именам
всегда предшествует амперсанд (&), а за ними следует точка с запятой.
Объекты представляют конкретные графические символы, имеющие
определенное значение при разметке, или же они не относятся к
символам, которые не могут быть напечатаны иным образом.
| < | символ "меньше чем" < |
| > | символ "больше чем" > |
| & | символ амперсанда &. |
| " | символ двойных кавычек " |
Кроме этих символов допустимы обращения с применением имен из
нижеприведенной таблицы к любой из букв набора ISO Latin-1.
Данный список Список— письменный перечень, число, состав; документ, содержащий перечень каких-либо сведений; в переносном смысле— буквальное, точное воспроизведение, копия; рукописная копия древнего памятника письменности. заимствован из документа "ISO 8879:1986//ENTITIES Added
Latin 1//EN".
| Æ | заглавная AE дифтонг (наборный знак из двух
символов) |
| Á | заглавная A, сильное ударение |
| Â | заглавная A, диакритическое ударение |
| À | заглавная A, тупое ударение |
| Å | заглавная A, с символом круга |
| Ã | заглавная A, с тильдой |
| Ä | заглавная A, с символом умляута |
| Ç | заглавная C, седиль |
| Ð | заглавная "эс", исландская |
| É | заглавная E, сильное ударение |
| Ê | заглавная E, диакритическое ударение |
| È | заглавная E, тупое ударение |
| Ë | заглавная E, с символом умляута |
| Í | заглавная I, сильное ударение |
| Î | заглавная I, диакритическое ударение |
| Ì | заглавная I, тупое ударение |
| Ï | заглавная I, с символом умляута |
| Ñ | заглавная N, с тильдой |
| Ó | заглавная O, сильное ударение |
| Ô | заглавная O, диакритическое ударение |
| Ò | заглавная O, тупое ударение |
| Ø | заглавная O, со штрихом |
| Õ | заглавная O, с тильдой |
| Ö | заглавная O, с символом умляута |
| Þ | заглавная "торн", исландская |
| Ú | заглавная U, сильное ударение |
| Û | заглавная U, диакритическое ударение |
| Ù | заглавная U, тупое ударение |
| Ü | заглавная U, с символом умляута |
| Ý | заглавная Y, сильное ударение |
| á | маленькая a, сильное ударение |
| â | маленькая a, диакритическое ударение |
| æ | маленькая ae дифтонг (наборный знак из двух
символов) |
| à | маленькая a, тупое ударение |
| å | маленькая a, с символом круга |
| ã | маленькая a, с тильдой |
| ä | маленькая a, с символом умляута |
| ç | маленькая c, седиль Седиль (также седилья, исп.cedilla)— крючок, добавленный под некоторыми согласными буквами как диакритический знак для указания на изменение их произношения. Название «седиль»— уменьшительное от староиспанского названия буквы Z— исп.ceda. Устаревшее произношение «седили»— «серила», так как в испанском языке XVI века d и r были иногда взаимозаменяемыми. |
| é | маленькая e, сильное ударение |
| ê | маленькая e, диакритическое ударение |
| è | маленькая e, тупое ударение |
| ð | маленькая "эс", исландская |
| ë | маленькая e, с символом умляута |
| í | маленькая i, сильное ударение |
| î | маленькая i, диакритическое ударение |
| ì | маленькая i, тупое ударение |
| ï | маленькая i, с символом умляута |
| ñ | маленькая n, с тильдой |
| ó | маленькая o, сильное ударение |
| ô | маленькая o, диакритическое ударение |
| ò | маленькая o, тупое ударение |
| ø | маленькая o, со штрихом |
| õ | маленькая o, с тильдой |
| ö | маленькая o, с символом умляута |
| ß | маленькая sharp s, немецкая (наборный знак
из двух символов sz) |
| þ | маленькая "торн", исландская |
| ú | маленькая u, сильное ударение |
| û | маленькая u, диакритическое ударение |
| ù | маленькая u, тупое ударение |
| ü | маленькая u, с символом умляута |
| ý | маленькая y, сильное ударение |
| ÿ | маленькая y, с символом умляута |
HTML DTD
Ниже приведен текст заголовка HTML DTD. В главе "HTML и SGML" дано
описание его связи с текстом документа, написанного на языке SGML.
-
<!SGML "ISO 8879:1986"
--
Document Type Definition for the HyperText Markup Language
as used by the World Wide Web application (HTML DTD).
NOTE: This is a definition of HTML with respect to
SGML, and assumes an understanding of SGML terms.
--
CHARSET
BASESET "ISO 646:1983//CHARSET
International Reference Version (IRV)//ESC 2/5 4/0"
DESCSET 0 9 UNUSED
9 2 9
11 2 UNUSED
13 1 13
14 18 UNUSED
32 95 32
127 1 UNUSED
BASESET "ISO Registration Number 100//CHARSET
ECMA-94 Right Part of Latin Alphabet Nr. 1//ESC 2/13 4/1"
DESCSET 128 32 UNUSED
160 95 32
255 1 UNUSED
CAPACITY SGMLREF
TOTALCAP 150000
GRPCAP 150000
SCOPE DOCUMENT
SYNTAX
SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
18
19 20 21 22 23 24 25 26 27 28 29 30 31 127
255
BASESET "ISO 646:1983//CHARSET
International Reference Version (IRV)//ESC 2/5 4/0"
DESCSET 0 128 0
FUNCTION RE 13
RS 10
SPACE 32
TAB SEPCHAR 9
NAMING LCNMSTRT ""
UCNMSTRT ""
LCNMCHAR ".-"
UCNMCHAR ".-"
NAMECASE GENERAL YES
ENTITY NO
DELIM GENERAL SGMLREF
SHORTREF SGMLREF
NAMES SGMLREF
QUANTITY SGMLREF
NAMELEN 34
TAGLVL 100
LITLEN 1024
GRPGTCNT 150
GRPCNT 64
FEATURES
MINIMIZE
DATATAG NO
OMITTAG NO
RANK NO
SHORTTAG NO
LINK
SIMPLE NO
IMPLICIT NO
EXPLICIT NO
OTHER
CONCUR NO
SUBDOC NO
FORMAL YES
APPINFO NONE
>
<!DOCTYPE HTML [
<!-- Jul 1 93 -->
<!-- Regarding clause 6.1, SGML Document:
[1] SGML document = SGML document entity,
(SGML subdocument entity |
SGML text entity | non-SGML data entity)*
The role of SGML document entity is filled by this DTD,
followed by the conventional HTML data stream.
-->
<!-- DTD definitions -->
<!ENTITY % heading "H1|H2|H3|H4|H5|H6" >
<!ENTITY % list "UL|OL|DIR|MENU">
<!ENTITY % literal "XMP|LISTING">
<!ENTITY % headelement
"TITLE|NEXTID|ISINDEX" >
<!ENTITY % bodyelement
"P | %heading |
%list | DL | HEADERS | ADDRESS | PRE | BLOCKQUOTE
| %literal">
<!ENTITY % oldstyle "%headelement | %bodyelement | #PCDATA">
<!ENTITY % URL "CDATA"
-- The term URL means a CDATA attribute
whose value is a Uniform Resource Locator,
as defined. (A URN may also be usable here when defined.)
-->
<!ENTITY % linkattributes
"NAME NMTOKEN #IMPLIED
HREF %URL; #IMPLIED
REL CDATA #IMPLIED -- forward relationship type --
REV CDATA #IMPLIED -- reversed relationship type
to referent data:
PARENT CHILD, SIBLING, NEXT, TOP,
DEFINITION, UPDATE, ORIGINAL etc. --
URN CDATA #IMPLIED -- universal resource number --
TITLE CDATA #IMPLIED -- advisory only --
METHODS NAMES #IMPLIED -- supported public methods of the object:
TEXTSEARCH, GET, HEAD, ... --
">
<!-- Document Element -->
<!ELEMENT HTML O O (( HEAD | BODY | %oldstyle)*, PLAINTEXT?)>
<!ELEMENT HEAD - - (TITLE? & ISINDEX? & NEXTID? & LINK*
& BASE?)>
<!ELEMENT TITLE - - RCDATA
-- The TITLE element is not considered part of the flow of text.
It should be displayed, for example as the page header or
window title.
-->
<!ELEMENT ISINDEX - O EMPTY
-- WWW clients should offer the option to perform a search on
documents containing ISINDEX.
-->
<!ELEMENT NEXTID - O EMPTY>
<!ATTLIST NEXTID N NAME #REQUIRED
-- The number should be a name suitable for use
for the ID of a new element. When used, the value
has its numeric part incremented. EG Z67 becomes Z68
-->
<!ELEMENT LINK - O EMPTY>
<!ATTLIST LINK
%linkattributes>
<!ELEMENT BASE - O EMPTY -- Reference context for URLS -->
<!ATTLIST BASE
HREF %URL; #IMPLIED
>
<!ENTITY % inline "EM | TT | STRONG | B | I | U |
CODE | SAMP | KBD | KEY | VAR | DFN | CITE "
>
<!ELEMENT (%inline;) - - (#PCDATA)>
<!ENTITY % text "#PCDATA | IMG | %inline;">
<!ENTITY % htext "A | %text">
<!ELEMENT BODY - - (%bodyelement|%htext;)*>
<!ELEMENT A - - (%text)>
<!ATTLIST A
%linkattributes;
>
<!ELEMENT IMG - O EMPTY -- Embedded image -->
<!ATTLIST IMG
SRC %URL; #IMPLIED -- URL of document to embed --
>
<!ELEMENT P - O EMPTY -- separates paragraphs -->
<!ELEMENT ( %heading ) - - (%htext;)+>
<!ELEMENT DL - - (DT | DD | P | %htext;)*>
<!-- Content should match ((DT,(%htext;)+)+,(DD,(%htext;)+))
But mixed content is messy.
-->
<!ELEMENT DT - O EMPTY>
<!ELEMENT DD - O EMPTY>
<!ELEMENT (UL|OL) - - (%htext;|LI|P)+>
<!ELEMENT (DIR|MENU) - - (%htext;|LI)+>
<!-- Content should match ((LI,(%htext;)+)+)
But mixed content is messy.
-->
<!ATTLIST (%list)
COMPACT NAME #IMPLIED -- COMPACT, etc.--
>
<!ELEMENT LI - O EMPTY>
<!ELEMENT BLOCKQUOTE - - (%htext;|P)+
-- for quoting some other source -->
<!ELEMENT ADDRESS - - (%htext;|P)+>
<!ELEMENT PRE - - (#PCDATA|%inline|A|P)+>
<!ATTLIST PRE
WIDTH NUMBER #implied
>
<!-- Mnemonic character entities. -->
<!ENTITY AElig "Æ" -- capital AE diphthong (ligature) -->
<!ENTITY Aacute "Á" -- capital A, acute accent -->
<!ENTITY Acirc "Â" -- capital A, circumflex accent -->
<!ENTITY Agrave "À" -- capital A, grave accent -->
<!ENTITY Aring "Å" -- capital A, ring -->
<!ENTITY Atilde "Ã" -- capital A, tilde -->
<!ENTITY Auml "Ä" -- capital A, dieresis or umlaut mark -->
<!ENTITY Ccedil "Ç" -- capital C, cedilla -->
<!ENTITY ETH "Ð" -- capital Eth, Icelandic -->
<!ENTITY Eacute "É" -- capital E, acute accent -->
<!ENTITY Ecirc "Ê" -- capital E, circumflex accent -->
<!ENTITY Egrave "È" -- capital E, grave accent -->
<!ENTITY Euml "Ë" -- capital E, dieresis or umlaut mark -->
<!ENTITY Iacute "Í" -- capital I, acute accent -->
<!ENTITY Icirc "Î" -- capital I, circumflex accent -->
<!ENTITY Igrave "Ì" -- capital I, grave accent -->
<!ENTITY Iuml "Ï" -- capital I, dieresis or umlaut mark -->
<!ENTITY Ntilde "Ñ" -- capital N, tilde -->
<!ENTITY Oacute "Ó" -- capital O, acute accent -->
<!ENTITY Ocirc "Ô" -- capital O, circumflex accent -->
<!ENTITY Ograve "Ò" -- capital O, grave accent -->
<!ENTITY Oslash "Ø" -- capital O, slash -->
<!ENTITY Otilde "Õ" -- capital O, tilde -->
<!ENTITY Ouml "Ö" -- capital O, dieresis or umlaut mark -->
<!ENTITY THORN "Þ" -- capital THORN, Icelandic -->
<!ENTITY Uacute "Ú" -- capital U, acute accent -->
<!ENTITY Ucirc "Û" -- capital U, circumflex accent -->
<!ENTITY Ugrave "Ù" -- capital U, grave accent -->
<!ENTITY Uuml "Ü" -- capital U, dieresis or umlaut mark -->
<!ENTITY Yacute "Ý" -- capital Y, acute accent -->
<!ENTITY aacute "á" -- small a, acute accent -->
<!ENTITY acirc "â" -- small a, circumflex accent -->
<!ENTITY aelig "æ" -- small ae diphthong (ligature) -->
<!ENTITY agrave "à" -- small a, grave accent -->
<!ENTITY amp "&" -- ampersand -->
<!ENTITY aring "å" -- small a, ring -->
<!ENTITY atilde "ã" -- small a, tilde -->
<!ENTITY auml "ä" -- small a, dieresis or umlaut mark -->
<!ENTITY ccedil "ç" -- small c, cedilla -->
<!ENTITY eacute "é" -- small e, acute accent -->
<!ENTITY ecirc "ê" -- small e, circumflex accent -->
<!ENTITY egrave "è" -- small e, grave accent -->
<!ENTITY eth "ð" -- small eth, Icelandic -->
<!ENTITY euml "ë" -- small e, dieresis or umlaut mark -->
<!ENTITY gt ">" -- greater than -->
<!ENTITY iacute "í" -- small i, acute accent -->
<!ENTITY icirc "î" -- small i, circumflex accent -->
<!ENTITY igrave "ì" -- small i, grave accent -->
<!ENTITY iuml "ï" -- small i, dieresis or umlaut mark -->
<!ENTITY lt "<" -- less than -->
<!ENTITY ntilde "ñ" -- small n, tilde -->
<!ENTITY oacute "ó" -- small o, acute accent -->
<!ENTITY ocirc "ô" -- small o, circumflex accent -->
<!ENTITY ograve "ò" -- small o, grave accent -->
<!ENTITY oslash "ø" -- small o, slash -->
<!ENTITY otilde "õ" -- small o, tilde -->
<!ENTITY ouml "ö" -- small o, dieresis or umlaut mark -->
<!ENTITY szlig "ß" -- small sharp s, German (sz ligature) -->
<!ENTITY thorn "þ" -- small thorn, Icelandic -->
<!ENTITY uacute "ú" -- small u, acute accent -->
<!ENTITY ucirc "û" -- small u, circumflex accent -->
<!ENTITY ugrave "ù" -- small u, grave accent -->
<!ENTITY uuml "ü" -- small u, dieresis or umlaut mark -->
<!ENTITY yacute "ý" -- small y, acute accent -->
<!ENTITY yuml "ÿ" -- small y, dieresis or umlaut mark -->
<!-- deprecated elements -->
<!ELEMENT (%literal) - - CDATA>
<!ELEMENT PLAINTEXT - O EMPTY>
<!-- Local Variables: -->
<!-- mode: sgml -->
<!-- compile-command: "sgmls -s -p " -->
<!-- end: -->
]>
-
Значения для взаимоотношений
между документами или их частями
(Relationships. Прим.ред.)
Статус. Приведенный в этой главе список не является частью
стандарта. Его назначение - иллюстрация примеров использования
взаимоотношений, а также создание основы для дальнейшего
совершенствования языка. Дополнение к этому списку будет
осуществляться после регистрации в комитете по языку HTML. При
проведении исследований к списку также можно добавлять новые
значения, при условии, что их имя начинается с комбинации "X-".
Значения атрибута REL для связи в гипертексте имеют именно тот
смысл, который мы определили в данном описании, и могут быть
обработаны особым образом прикладными программа Программа - (от греч. — пред, греч. — запись) термин, в переводе означающий «предписание», т.е.ми, использующими язык
HTML.
Описываемые здесь взаимоотношения определяют связи не просто между
анкерами в документах. Они описывают связи между самими документами,
как большими независимыми блоками информации, как между объектами.
Если некое значение используется для описания взаимоотношения между
анкерами, но не между документами, предполагается, что тем не менее
указанная семантика Семантика (от др.-греч. — обозначающий)— раздел языкознания, изучающий значение единиц языка. В качестве инструмента изучения применяют семантический анализ. В конце XIX— начале XX века семантика часто называлась также семасиологией (от др.-греч. smaino— указываю, означаю). Учёные, занимающиеся семантикой, до сих пор обычно называются семасиологами. Также «семантикой» может обозначаться сам круг значений некоторого класса языковых единиц (например, «семантика глаголов движения»). применима к упомянутым документам.
В последующем описании A - это документ, инициирующий связи, а B -
это документ, на который ссылается атрибут HREF анкера.
Если взаимоотношение между документами в гипертексте называется
ациклическим, то это значит, что оно не содержит цепочек связей,
которые, начавшись на каком-либо документе, могли бы вновь на него
вернуться. Поэтому связи такого типа могут использоваться для
формирования ветвящихся структур.
Взаимоотношения между документами
Взаимоотношения формируются между документами без какого-либо учета
содержания последних.
USEINDEX (использование в качестве индекса)
В данной ситуации пользователь, читающий документ A, может вызвать
функцию поиска. B - это документ, содержащий связную индексную
информацию, используемую такой функцией. Документ A может содержать
любое количество индексных связей, что позволяет осуществлять поиск
на нескольких условиях индексации в зависимости от решения клиента.
Документ B должен поддерживать работу поиска в соответствии с
протоколом доступа.
USEGLOSSARY (использование в качестве словаря)
B - это документ, содержащий индексную информацию, которая должна
использоваться для удовлетворения запросов о переводе, сделанных в
основном документе (как правило, запрос делается при двойном щелчке
над словом, которое не находится в пределах анкера).
Документ может иметь любое количество связей со словарем.
ANNOTATION (аннотация)
Информация в документе B является дополнением к документу A и
носит вспомогательный характер. Например, аннотация используется
клиентом для написания своего рода сносок или иных критических
замечаний к документам других людей.
Пример: взаимосвязь между блоком новостей и составляющими его
статьями.
Ациклическая взаимосвязь.
REPLY (ответ)
Подобна аннотации, однако условия, чтобы документ B служил
дополнением к документу A, не ставится. Документы A и B равноправны.
Пример: связь между почтовым сообщение Сообщение— наименьший элемент языка, имеющий идею или смысл, пригодный для общения. В информатике— форма представления информации, имеющая признаки начала и конца, предназначенная для передачи через среду связи. Также форма предоставления информации, совокупность знаков или первичных сигналов, содержащих информацию. В объектно-ориентированном программировании — средство взаимодействия объектов, где передача сообщения объекту — процесс вызова метода этого объекта с содержимым сообщения (необходимыми параметрами) или без такового (параметры по умолчанию) при условии, что он готов его принять (вызываемый метод является открытым).м и ответом на него, между
заметкой с новостями и откликом на нее.
Ациклическая взаимосвязь.
EMBED (вставка)
Если появилась связь такого типа, то информация с узла на ее конце
вставляется в исходный документ при его просмотре.
Ациклическая взаимосвязь.
PRECEDES (предшествование)
В упорядоченной структуре, сформированной авторами, документу A
предшествует документ B, а за документом B всегда следует документ A.
Ациклическая взаимосвязь.
Документ может иметь не более одной связи для такого
взаимоотношения и/или на него может быть сделана только одна такая
ссылка.
Замечание: Такое взаимоотношение может управлять вспомогательными
средствами навигации, формировать материал для печати и т.д.
Совместно с понятием "поддокумент" оно может использоваться для
создания ветвящейся структуры, такой как книжка для печати,
формирующая гипертекстовой документ. Такой документ может содержать
только одну такую ветвящуюся структуру.
SUBDOCUMENT (поддокумент)
Согласно иерархии, определенной автором, документ B является
составной частью документа A. Ациклическое взаимоотношение.
PRESENT (присутствие)
Если в системе присутствует документ A, то должен присутствовать и
документ B. Это подразумевает, что если программа обнаружила документ
A, то она должна обязательно найти и документ B.
SEARCH (поиск)
Когда обнаружена связь такого типа, а документ B в системе
отсутствует, последний должен быть найден. Иными словами, когда
программа клиента обнаруживает связь, клиенту немедленно
предоставляется панель поиска, а на ней искомый текст. Затем
осуществляется поиск без промежуточного восстановления и презентации
узла B.
SUPERSEDES (обновление)
Документ B является старой версией документа A.
Ациклическое взаимоотношение.
HISTORY (история)
Документ B представляет собой список версий документа A. Навстречу
этой связи из документа A должна существовать связь документа B с
документом A и всеми известными его версиями.
Взаимоотношения с тематикой документов
Эти взаимоотношения выражают семантику не для самих документов, а
для затронутых ими тем.
INCLUDES (составная часть)
Документ Документ (от лат.documentum— образец, свидетельство, доказательство) — материальный объект, содержащий информацию в зафиксированном виде и специально предназначенный для её передачи во времени и пространстве .
В узком смысле Документ — облеченный в письменную форму акт, удостоверяющий наличие фактов определенного значения. В широком смысле и книга, и скульптура - документы. A включает документ B, документ B является составной
частью документа A. Например, личность, чье описание дано в документе
A, состоит в группе, описываемой документом B.
Ациклическое взаимоотношение
MADE (создание)
Например, личность, чье описание дано в узле A, является автором
документа B или отвечает за его содержание. Сведения такого типа
могут применяться для целей защиты информации, для посылки сообщений
авторам и т.д.
INTERESTED (заинтересованность)
Например, личность, чье описание дано в документе A, выражает
заинтересованность в информации из узла B. Данная информация может
применяться также для осведомления читателей о произведенных
изменениях.
Авторское право
Авторское право для протокол Протокол (от др.-греч. protos— «первый» и kolla— «клей»)— первый лист, приклеенный к свитку. На нем фиксировались титульная информация (например, дата написания, имя писателя) и краткое основное содержание свитка.а HTTP определяет списки названий для
связей и элементов анкеров. Предлагается, что эту обязанность будет
выполнять комитет по присвоению номеров Internet или его приемники.
Допускается применение незарегистрированных значений в опытном порядке,
при условии, что они начинаются с сочетания "X-".
Ссылки
| SGML | ISO 8879:1986, Текст с обработкой информации и обобщенный
стандартный язык разметки (SGML) для служебных систем. |
| sgmls | анализатор SGML Джонса Кларка (James Clark)
<jjc@clark.com>, созданный по материалам анализатора
ARCSGML, написанным Чарльзом Голдфабом (Charles F.
Goldfarb). Исходный текст программы доступен на FTP сервере
ifi.uio.no в каталоге /pub/SGML/SGMLS. |
| WWW | Универсальный локатор Локатор (от англ.locate— расположение)— искусственное устройство или живой орган, предназначенный для определения наличия, расстояния, азимута (направления) или скорости объекта (объектов) бесконтактным способом. ресурсов. RFCxxx. Доступен в
настоящее Настоящее— часть линии времени, состоящая из событий, которые происходят в настоящий момент, то есть определенная область пространства-времени. время посредством FTP на компьютере info.cern.ch
в каталоге /pub/ietf. |
|---|
Адреса авторов
Данный документ был подготовлен при участии и с помощью многих
людей, пользующихся данной сетью. Дэн Коннолли (Dan Connolly)
приготовил дескриптор DTD, а также часть языков HTML и SGML во время
работы в корпорации Convex Computer по адресу 3000 Waterview Parkway
Richardson, TX 75083. В настоящее время он работает в Atrium
Technology Inc. и не является последним редактором документа.
Tim Berners-Lee
Address: CERN
1211 Geneva 23
Switzerland
Telephone: +41(22)767 3755
Fax: +41(22)767 7155
email: timbl@info.cern.ch
|
Daniel Connolly
Address: Atrium Technologies, Inc.
5000 Plaza on the Lake, Suite 275
Austin, TX 78746
USA
email: connolly@atrium.com
|
- 1.
-
Разработка рекоммендаций языка HTML проводится рабочей группой
IETF - HTML-WG. E-Mail: html-wg@oclc.org.
Новое местонахождение документов:
http://www.acl.lanl.gov/HTML_WG/archives.html
- 2.
- В литературе по языку SGML термин "
TAG" часто
переводится как "индикатор".
В данном перевод Перевод— деятельность по интерпретации смысла текста на одном языке (исходном языке [ИЯ]) и созданию нового, эквивалентного текста на другом языке (переводящем языке [ПЯ]).е используется слово "метка".
Слово "метка" используется
также и для именования открытия и закрытия элементов.
- 3.
- В данном переводе для термина "anchor" выбрано слово "анкер".
Анкеры применяются в HTML в двух случаях:
- Когда нужно сослаться на какой-либо документ или место в
текущем документе, т.е. являются "отправной" точкой в связи.
- Когда нужно указать, что на данное место (элемент) в документе
можно сослаться. Другими словами - место назначения
(для гипертекстовой связи).
- 4.
- В данном переводе под словом "объект" подразумевается
"entity" в языке SGML,
а выражение "обращение к объекту", соответствует - "Entity reference".
В языке HTML все объекты и их имена заранее определены и не существует
средств для определения пользователем своих собственных объектов.
- 5.
- В современной спецификации HTML, в элемент
HEAD введен еще один
элемент - META, который
служит для указания какой-либо дополнительной информации
(meta information) для документа в целом. Это могут быть: дата последней
модификации документа, версия, автор и другая подобная информация.
Спецификация HTML указывает на то, что содержимое элемента META
может обрабатываться WWW сервером, например, быть выведено по запросу
HEAD (протокол HTTP). Точное определение элемента META смотрите в текущей
версии спецификации языка HTML.
- 6.
- Под "узлом" в данном контексте подразумевается "документ".
Автор спецификации
имел в виду, что каждому гипертекстовому узлу в системе WWW соответствует
отдельный документ.
- 7.
- Хотя в спецификации и не требуется строгого соблюдения очередности
уровней заголовков, но многие производители программного обеспечения для
обработки HTML-документов используют уровни заголовков для разделения
документа на отдельные части. Кроме этого, многие авторы статей о HTML
рекомендуют соблюдать порядок в уровнях заголовков.
Мы рекомендуем еще посмотреть:
|