Я использую SQL Server 2005 как хранилище данных для большого количества данных, над которыми я работаю. Это не транзакционная база данных, так как я не попадаю ей в обновления или не фиксирую данные в реальном времени. Я получаю несколько концертов от моих клиентов, загружаю их в SQL Server и делаю серию манипуляций. Затем я захватываю кусочки этих данных и вытаскиваю их в R, где большую часть своего анализа я делаю. Затем я помещаю небольшие данные в таблицы на SQL Server и, возможно, присоединяюсь или два.
У меня есть время, когда журналы SQL Server становятся большими, и я предполагаю, что для их создания требуется определенный объем накладных расходов. Как настроить SQL Server так, чтобы он работал с небольшим или отсутствием регистрации? Если что-то испортится, я с радостью начну с самого начала. Любые идеи, как сделать это все быстрее?
Кстати, мне не нужно рассказывать, как сжимать журналы, я уже это делаю. Но мне жаль, что мне не нужно было делать журналы в первую очередь. Я использую только DB для размещения данных, потому что он слишком велик, чтобы вписываться в память в R.
Должен ли я использовать более простой DB, чем Sql Server? Не стесняйтесь сказать мне, что я убиваю ant кувалдой. Но, пожалуйста, рекомендуйте молот более подходящего размера.:)