Расширяемый язык разметки (eXtensible Markup Language) — текстовый формат файла, разработанный Консорциумом Всемирной паутины (W3C) для хранения, обмена и структурирования данных. Он удобен как для чтения человеком, так и для обработки машиной.
Отличается гибкостью и расширяемостью, позволяя определять собственные теги и структуру документа.
Принципы XML:
- Самоописание: Данные содержат информацию о своей структуре.
- Иерархическая структура: Данные представлены в виде дерева элементов.
- Разделение данных и представления: XML описывает данные, а стили (например, XSLT) определяют их отображение.
- Текстовый формат: XML-документы являются обычным текстом.
Основные компоненты XML:
- Элементы: Основные структурные блоки, содержащие данные или другие элементы. Имеют начальный и конечный тег (например,
<имя>... </имя>).
- Атрибуты: Пары имя-значение, предоставляющие дополнительную информацию об элементе (например,
<пользователь id="123">).
- Пролог: Необязательная часть в начале документа, содержащая объявление XML и, возможно, ссылку на DTD или XML Schema.
- Комментарии: Неинтерпретируемый текст для пояснений (например,
<!-- Это комментарий -->).
xml
Использование XML в Java:
- Парсинг: ЧБИ
javax.xml.parsers (SAX, DOM) для чтения XML-документов.
- Генерация: Создание XML-документов программно.
- Преобразование: XSLT для трансформации XML в другие форматы.
- Биндинг данных: JAXB (Java Architecture for XML Binding) для маппинга между XML и Java-объектами.
Пример DOM-парсинга в Java:
java