=> Главная База Знаний HTML 3.3. Структурирование текста


3.3. Структурирование текста

Все, что рассматривалось ранее, – это простое физическое форматирование текста. Теперь пришло время заняться разбиением текста HTML‑документа на логически цельные, но различные между собой части, – сформировать структуру документа. В этом разделе будут рассмотрены основные возможности структурирования документа с использованием соответствующих HTML‑элементов, а также то, как роль текста в структуре документа влияет на его отображение.

Разбиение на абзацы

В предыдущих примерах весь текст HTML‑документов даже при наличии в нем элементов BR воспринимался браузером как один абзац. Чтобы действительно отделить абзацы текста друг от друга, используется специальный элемент P.

Элемент P задается при помощи парных тегов

и

. При этом следует отметить, что использование закрывающего тега

считается не просто необязательным, но даже нежелательным. При отсутствии закрывающего тега концом элемента P считается начало следующего абзаца (следующий тег

) или тег конца документа, если абзац последний.

Для элемента P можно задать несколько атрибутов. Список наиболее используемых атрибутов:

• align – задает горизонтальное выравнивание содержимого абзаца, может принимать значения: left (используется по умолчанию), right, center, justify;

• title – задает текст подсказки.

К тексту абзаца может применяться любое форматирование, однако оно не должно нарушать восприятие абзаца как единого целого. Обычно сами абзацы браузерами визуально отделяются друг от друга. Далее приведен небольшой пример, в котором используется разбиение текста на абзацы (пример 3.8).

Пример 3.8. Использование абзацевРазбиение текста на абзацы

Неформатированный текст

Текст с изменением начертания

Текст с измененным шрифтом

Текст этого абзаца автоматически выравнивается по ширине справа и слева при переносе слов

При обработке приведенного HTML‑кода получится документ, показанный на рис. 3.7.

Рис. 3.7. Использование различного оформления абзацев

При наведении указателя мыши на текст абзаца появляется подсказка, заданная атрибутом title.

Заголовки

Следующим важным этапом в структурировании HTML‑документа является использование заголовков (в их обычном понимании) для обозначения начала больших фрагментов текста.

В HTML поддерживаются шесть видов заголовков. Им соответствуют элементы H1, H2, H3, H4, H5 и H6. Номера определяют уровни заголовков от наиболее важного (1) до наименее важного (6). Элементы H1–H6 задаются при помощи соответствующих парных тегов. Например, для задания заголовка третьего уровня можно применить следующий код:

Текст заголовка третьего уровня

Для заголовков можно задать свойства:

• align – выравнивание текста заголовка (по умолчанию используется выравнивание по левому краю);

• title – текст подсказки.

Заголовки различных уровней обычно отображаются браузерами различными шрифтами и различного размера. При этом размер шрифта более важных заголовков обычно больше, чем размер шрифта менее важных.

На рис. 3.8 приведен пример того, как отображаются заголовки различного уровня (HTML‑код не приводится ввиду его чрезвычайной простоты).

Рис. 3.8. Вид заголовков в Internet Explorer

В тексте, который заключен между тегами начала и конца заголовка, можно использовать рассмотренные ранее элементы форматирования (например, изменить шрифт). Однако это крайне не рекомендуется. Ведь стандартные заголовки придуманы именно для того, чтобы сделать похожими друг на друга HTML‑документы различных авторов, чтобы пользователь при просмотре документа браузером не терялся в догадках относительно роли того или иного текста.

Задание типов фраз

Даже в разбитом на отдельные абзацы тексте смешаны различные по важности и смыслу участки текста. Чтобы их можно было отделить друг от друга, при написании HTML‑документа можно пользоваться специальными элементами, задающими типы фраз в тексте (или, как еще говорят, элементами логического форматирования текста). Описания этих HTML‑элементов приведены в табл. 3.3.

Таблица 3.3. Элементы задания типов фраз

Первые два элемента используются для подчеркивания важности какого‑либо отрезка текста. Остальные элементы используются в основном в технических текстах. Все приведенные элементы задаются при помощи соответствующих парных тегов. Текст подсказки к каждому из этих элементов задается при помощи атрибута title. Наиболее часто этот атрибут используют с элементами ABBR и ACRONYM для отображения в подсказке полной расшифровки сокращения или аббревиатуры.

Естественно, что логическое разделение текста при помощи элементов из табл. 3.3 отражается на его представлении браузером (правда, разные браузеры могут отображать одинаковый по значению текст различным образом). В примере 3.9 приведен текст HTML‑документа, использующий все доступные типы фраз.

Пример 3.9. Использование различных типов фразИспользование различных типов фразОбычный текст
Выделение: Важный текст
Сильное выделение: Это очень важный текст
Цитата, ссылка: см. стандарт ISO 3273
Определение: WWW – это...
Пользователь должен ввести:Пример ввода пользователя
Переменная: strText
Аббревиатуры: HTTP, WWW, FTP
Сокращения: Внешпосылторг, UNIBEL
Фрагмент программы в тексте:CALL main
Пример программы:void main(){return;}

На рис. 3.9 приведен внешний вид страницы, сгенерированной при обработке текста примера 3.9.

Рис. 3.9. Внешний вид фраз различного типа

Как можно видеть из рисунка, большинство фраз различного типа отображаются браузером Internet Explorer совершенно одинаково. Не стоит полагать, что это отображение нельзя изменить. Можно использовать, например, рассмотренные ранее способы форматирования. Однако при этом польза от элементов, задающих типы фраз, становится весьма сомнительной. Для изменения внешнего текста HTML‑элементов настоятельно рекомендуется использовать таблицы стилей, которые будут рассмотрены позже.

Стоит также отметить, что сохранить оригинальное форматирование примера программы или прочего текста внутри элемента SAMP весьма проблематично, в отличие от того же элемента PRE. Именно поэтому в примере 3.9 текст программы выбран таким образом, чтобы он мог быть помещен в одну строку без потери его читабельности.

Цитаты

Кроме элемента CITE, для оформления цитат могут также использоваться элементы BLOCKQUOTE и Q. Для их задания используются соответствующие парные теги.

Элемент BLOCKQUTE используется для задания длинных цитат и представляет собой элемент уровня блока. При этом текст цитаты обычно оформляется браузерами как текст с дополнительным отступом.

Элемент Q является элементом уровня текста и используется для создания небольших цитат. Текст, помещенный между тегами и , оформляется различными браузерами по‑разному (например, может быть помещен в кавычки).

Атрибуту cite элементов BLOCKQUOTE и Q можно присвоить URI источника информации для цитаты.

Указание изменений в документе

В ряде случаев возникает необходимость изменять важное содержимое HTML‑документа уже после того, как он опубликован (например, если речь идет о разрабатываемом законопроекте). В таких случаях практически незаменимыми являются HTML‑элементы INS и DEL, применяемые для выделения участков текста, которые были добавлены или удалены в новой версии документа.

Элемент INS задается при помощи парных тегов и , между которыми помещается добавленный текст. Элемент DEL задается парными тегами и . В эти теги заключается текст, удаленный из новой версии документа.

Естественно, что содержимое элементов INS и DEL отображается браузерами совершенно поразному. Содержимое элемента DEL может быть, например, зачеркнутым или вообще не показываться браузером.

Элементы INS и DEL могут содержать как небольшие участки текста, так и целые разделы документа. Однако недопустимым является вложенность этих элементов друг в друга.

Никогда так не делайте

Наиболее часто используемыми атрибутами элементов INS и DEL являются следующие:

• cite – задает URI HTML‑документа с пояснениями сделанных изменений;

• datetime – время, когда в документ были внесены изменения.

Здесь вы впервые встретились с заданием атрибуту значения даты и времени. Это значение в HTML задается в следующей форме:

ГГГГ–ММ–ДДTчч:мм:cc

Здесь ГГГГ обозначает год, ММ – месяц, ДД – день, чч – значение от 0 до 23 (час), мм и сс – значения от 0 до 59 (минуты и секунды). Кроме того, в конец значения даты и времени добавляется одна из следующих записей:

• Z – обозначает, что используется UTC‑время (общее скоординированное время, или время по Гринвичу);

• +чч:мм или –чч:мм – обозначает, что местное время опережает или отстает от UTC на заданное количество часов и минут.

Ниже приведен пример различных вариантов задания московского времени 14 часов 5 минут 31 декабря 1997 года (с использованием местного времени и времени UTC):

1997–12–31T14:05+03:001997–12–31T11:05Z

Контактная информация

В HTML предусмотрен специальный элемент ADDRESS, в который может заключаться различная контактная информация. Он задается при помощи парных тегов

и
.

Текст внутри элемента ADDRESS может иметь произвольную структуру, однако чаще всего в него помещаются имена сотрудников организаций, ссылки на другие HTML‑документы, телефон или адрес электронной почты контактного лица.