Сохранить таблицу html в excel

Я должен написать программу, которая периодически читает веб-страницу и копирует определенные данные из таблицы на этой странице в электронную таблицу Excel. Я не знаю, с чего начать или какой язык программирования подходит для этого проекта. Я знаю немного программирования на С++ и Matlab. Может ли кто-нибудь предложить совет указать мне в правильном направлении или предложить проекты с открытым исходным кодом, которые делают что-то подобное?

Ответ 1

Чтобы расширить точку Оливера, если вы можете получить данные таблицы в XML файле, чтобы начать с нее, Excel позволяет вам создать "шаблон" для себя, который отображает узлы XML файла в различные ячейки. Затем вы просто обновите данные XML.

Конечно, мы предполагаем, что ваши данные поступают из внешнего источника данных.

Ответ 2

Возможно, это сработает.

<html>
<head>
<script type="text/javascript">
    function CreateExcelSheet() {
        var x = myTable.rows;

        var xls = new ActiveXObject("Excel.Application");
            xls.visible = true;
            xls.Workbooks.Add;
        for (i = 0; i < x.length; i++) {
            var y = x[i].cells;
            for (j = 0; j < y.length; j++) {
                xls.Cells( i+1, j+1).Value = y[j].innerText;
            }
        }
    }
</script>
</head>
<body>

<form>
    <input type="button" onclick="CreateExcelSheet()" value="Create Excel Sheet">
</form>

<table id="myTable" border="1">
    <tr>
        <td>Name</td>
        <td>Age</td>
    </tr>
    <tr>
        <td>Shivani</td>
        <td>25</td>
    </tr>
    <tr>
        <td>Naren </td>
        <td>28</td>
    </tr>
    <tr>
        <td>Logs</td>
        <td>57</td>
    </tr>
    <tr>
        <td>Kas</td>
        <td>54</td>
    </tr>
    <tr>
        <td>Sent</td>
        <td>26</td>
    </tr>
    <tr>
        <td>Bruce</td>
        <td>7</td>
    </tr>
</table>

</body>
</html>

Ответ 3

Я, вероятно, сделаю это, прочитав веб-страницу, как если бы это был документ XML, и преобразовал соответствующие разделы в формат .csv. Вы можете сделать это на разных языках, а .csv - очень простой и удобный формат для работы.

Я не знаю, насколько хорош Matlab для работы с XML и веб-материалами, но C/С++, как правило, действительно громоздки и громоздки для такого рода вещей. Если вы хотите научиться другому языку программирования, попробуйте Python - его простое использование очень интуитивно понятное для работы с XML и веб-материалами. Вы можете использовать его HTML Parser, чтобы найти нужные элементы страницы, и сделать некоторые простые записи файлов, чтобы поместить их в формат .csv.