Я пытаюсь получить содержимое таблицы с wepage. Мне нужно содержимое, но не теги <tr></tr>. Мне даже не нужно "tr" или "td" только содержимое. например:
<td> I want only this </td>
<tr> and also this </tr>
<TABLE> only texts/numbers in between tags and not the tags. </TABLE>
Также я хотел бы поместить первый вывод столбца, как это, в новый файл csv column1, info1, info2, info3 coumn2, info1, info2, info3
Я попробовал sed удалять патчи <tr> <td>, но когда я получаю таблицу, есть и другие теги, такие как <color> <span> и т.д., поэтому я хочу удалить все теги; вкратце все, и > .