Python имеет несколько способов анализа XML...
Я понимаю самые основы синтаксического анализа SAX. Он функционирует как парсер потока, с управляемым событиями API.
Я понимаю синтаксический анализатор DOM. Он читает XML в памяти и закрывает его для объектов, к которым можно получить доступ с помощью Python.
Вообще говоря, было легко выбирать между 2 в зависимости от того, что вам нужно было делать, ограничений памяти, производительности и т.д.
(надеюсь, я до сих пор прав).
С Python 2.5 у нас также есть ElementTree. Как это соотносится с DOM и SAX? Что это больше похоже на? Почему это лучше, чем предыдущие парсеры?