Инструменты обработки структурированной разметки¶
Python поддерживает множество модулей для работы с различными формами разметки структурированных данных. Сюда входят модули для работы со стандартным обобщенным языком разметки (SGML) и языком разметки гипертекста (HTML), а также несколько интерфейсов для работы с расширяемым языком разметки (XML).
html
— Поддержка языка разметки гипертекстаhtml.parser
— Простой парсер HTML и XHTMLhtml.entities
— Определения общих сущностей HTML- Модули обработки XML
xml.etree.ElementTree
— API ElementTree XMLxml.dom
— API объектной модели документаxml.dom.minidom
— Минимальная реализация DOMxml.dom.pulldom
— Поддержка построения частичных деревьев DOMxml.sax
— Поддержка парсеров SAX2xml.sax.handler
— Базовые классы для обработчиков SAXxml.sax.saxutils
— Утилиты SAXxml.sax.xmlreader
— Интерфейс для анализаторов XMLxml.parsers.expat
— Быстрый разбор XML с помощью Expat