Name: Sobes.tech
Rating: 4.9 (250 reviews)

В Python для разбора и обработки данных часто используются следующие типы парсеров:

DOM-парсер — загружает весь документ в память и строит дерево элементов. Удобен для небольших XML/HTML файлов, когда нужно произвольное перемещение по структуре. Пример: xml.dom.minidom.
SAX-парсер — событийный парсер, который последовательно читает документ и вызывает обработчики событий. Подходит для больших файлов, так как не требует загрузки всего документа в память.
ElementTree — более простой и удобный API для работы с XML, сочетает удобство и эффективность.
BeautifulSoup — популярная библиотека для парсинга HTML и XML, удобна для извлечения данных из плохо структурированных документов.

Пример использования BeautifulSoup для парсинга HTML:

from bs4 import BeautifulSoup
html_doc = "<html><head><title>Пример</title></head><body><p>Текст</p></body></html>"
soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.title.string)  # Выведет: Пример

Выбор парсера зависит от задачи: размер данных, формат, требования к производительности и удобству.

Какие типы парсеров вам известны и используете в своих проектах?