Я пытаюсь получить содержимое таблицы с wepage. Мне нужно содержимое, но не теги <tr></tr>
. Мне даже не нужно "tr" или "td" только содержимое. например:
<td> I want only this </td>
<tr> and also this </tr>
<TABLE> only texts/numbers in between tags and not the tags. </TABLE>
Также я хотел бы поместить первый вывод столбца, как это, в новый файл csv column1, info1, info2, info3 coumn2, info1, info2, info3
Я попробовал sed удалять патчи <tr>
<td>
, но когда я получаю таблицу, есть и другие теги, такие как <color>
<span>
и т.д., поэтому я хочу удалить все теги; вкратце все, и > .