Я ищу анализатор HTML или XML, который позволяет получить доступ к смещению/позиции текущего элемента в строке ввода .
Например, если пройти через эту строку:
<div>
<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit</p>
<p>sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.</p>
</div>
Я ищу способ получить начальную позицию (включая пробелы) каждого тега <p>
, здесь: 7
и 72
.
Было бы здорово, если бы PHP-парсер поддерживал это изначально (я смотрел DOM, XMLReader и другие библиотеки, упомянутые в этом вопросе SO, но не нашли способ сделать это), но в противном случае любой язык/структура будет в порядке.
Примечание. Связано с этим вопросом, но менее локализовано.