Инструменты обработки структурированной разметки¶
Python поддерживает множество модулей для работы с различными формами разметки структурированных данных. Сюда входят модули для работы со стандартным языком обобщенной разметки (SGML) и языком гипертекстовой разметки (HTML), а также несколько интерфейсов для работы с расширяемым языком разметки (XML).
html— Поддержка языка гипертекстовой разметкиhtml.parser— Простой синтаксический анализатор HTML и XHTMLhtml.entities— Определения общих сущностей HTML- Модули обработки XML
xml.etree.ElementTree— XML-API ElementTreexml.dom— API объектной модели документаxml.dom.minidom— Минимальная реализация DOMxml.dom.pulldom— Поддержка построения частичных деревьев DOMxml.sax— Поддержка синтаксических анализаторов SAX2xml.sax.handler— Базовые классы для обработчиков SAXxml.sax.saxutils— Утилиты для SAXxml.sax.xmlreader— Интерфейс для синтаксических анализаторов XMLxml.parsers.expat— Быстрый синтаксический анализ XML с помощью Expat