Я должен написать программу, которая периодически читает веб-страницу и копирует определенные данные из таблицы на этой странице в электронную таблицу Excel. Я не знаю, с чего начать или какой язык программирования подходит для этого проекта. Я знаю немного программирования на С++ и Matlab. Может ли кто-нибудь предложить совет указать мне в правильном направлении или предложить проекты с открытым исходным кодом, которые делают что-то подобное?
Сохранить таблицу html в excel
Ответ 1
Чтобы расширить точку Оливера, если вы можете получить данные таблицы в XML файле, чтобы начать с нее, Excel позволяет вам создать "шаблон" для себя, который отображает узлы XML файла в различные ячейки. Затем вы просто обновите данные XML.
Конечно, мы предполагаем, что ваши данные поступают из внешнего источника данных.
Ответ 2
Возможно, это сработает.
<html>
<head>
<script type="text/javascript">
function CreateExcelSheet() {
var x = myTable.rows;
var xls = new ActiveXObject("Excel.Application");
xls.visible = true;
xls.Workbooks.Add;
for (i = 0; i < x.length; i++) {
var y = x[i].cells;
for (j = 0; j < y.length; j++) {
xls.Cells( i+1, j+1).Value = y[j].innerText;
}
}
}
</script>
</head>
<body>
<form>
<input type="button" onclick="CreateExcelSheet()" value="Create Excel Sheet">
</form>
<table id="myTable" border="1">
<tr>
<td>Name</td>
<td>Age</td>
</tr>
<tr>
<td>Shivani</td>
<td>25</td>
</tr>
<tr>
<td>Naren </td>
<td>28</td>
</tr>
<tr>
<td>Logs</td>
<td>57</td>
</tr>
<tr>
<td>Kas</td>
<td>54</td>
</tr>
<tr>
<td>Sent</td>
<td>26</td>
</tr>
<tr>
<td>Bruce</td>
<td>7</td>
</tr>
</table>
</body>
</html>
Ответ 3
Я, вероятно, сделаю это, прочитав веб-страницу, как если бы это был документ XML, и преобразовал соответствующие разделы в формат .csv. Вы можете сделать это на разных языках, а .csv - очень простой и удобный формат для работы.
Я не знаю, насколько хорош Matlab для работы с XML и веб-материалами, но C/С++, как правило, действительно громоздки и громоздки для такого рода вещей. Если вы хотите научиться другому языку программирования, попробуйте Python - его простое использование очень интуитивно понятное для работы с XML и веб-материалами. Вы можете использовать его HTML Parser, чтобы найти нужные элементы страницы, и сделать некоторые простые записи файлов, чтобы поместить их в формат .csv.