Я ищу анализатор HTML или XML, который позволяет получить доступ к смещению/позиции текущего элемента в строке ввода .
Например, если пройти через эту строку:
<div>
    <p>Lorem ipsum dolor sit amet, consectetur adipisicing elit</p>
    <p>sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.</p>
</div>
Я ищу способ получить начальную позицию (включая пробелы) каждого тега <p>, здесь: 7 и 72.
Было бы здорово, если бы PHP-парсер поддерживал это изначально (я смотрел DOM, XMLReader и другие библиотеки, упомянутые в этом вопросе SO, но не нашли способ сделать это), но в противном случае любой язык/структура будет в порядке.
Примечание. Связано с этим вопросом, но менее локализовано.
