Крупномасштабный интеллектуальный анализ данных с помощью clojure

Я ищу хорошую ссылку на

крупномасштабный интеллектуальный анализ данных с помощью Clojure

Я знаю много хороших книг программирования clojure (Программирование Clojure, Радость Clojure,...) и множество хороших текстовых книг для интеллектуального анализа данных (разработка массивных наборов данных, управление гигабайтами,...). Однако я не знаю никакой ссылки, которая специально адресована

крупномасштабный интеллектуальный анализ данных с помощью Clojure

Часть "с clojure" для меня важна по следующим причинам:

* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)

В частности, я думаю, что существует много взаимодействий между JVM, clojure Data Structures, независимо от того, хранятся ли данные в памяти или лениво читаются с диска, - которые могут иметь "тот же самый" алгоритм, существенно отличающийся от времени выполнения "немного" различных реализаций.

Таким образом, мой вопрос (все вышесказанное заключалось в том, чтобы не закрывать "Проверить Google" ):

что такое хороший ресурс для массивного интеллектуального анализа данных с помощью Clojure?

Спасибо!

Ответ 1

Я не думаю, что кто-то еще написал хорошую всеобъемлющую ссылку. Но в этом пространстве, безусловно, много работы (включая мою собственную компанию!)

Некоторые интересные ссылки для наблюдения:

  • Storm - распределенное вычисление в реальном времени с использованием Clojure. Может использоваться для крупномасштабного интеллектуального анализа данных.
  • http://www.infoq.com/presentations/Why-Prismatic-Goes-Faster-With-Clojure - интересное видео о производительности и оптимизации Clojure для приложений машинного обучения
  • Incanter - вероятно, ведущая библиотека Clojure для статистики и визуализации данных
  • Weka - очень обширная библиотека интеллектуального анализа данных/машинного обучения для Java (и, следовательно, очень проста в использовании непосредственно из Clojure)

Ответ 2

В мае 2013 года появилась замечательная книга: Clojure Поваренная книга по анализу данных. Вероятно, я куплю его.

http://www.amazon.co.uk/Clojure-Data-Analysis-Cookbook-ebook/dp/B00BECVV9C/ref=sr_1_1?s=books&ie=UTF8&qid=1360697819&sr=1-1

Подробнее

Данные повсюду, и все более важно иметь возможность получить которые мы можем действовать. Использование Clojure для анализа данных и коллекции, эта книга покажет вам, как получить свежие идеи и перспективы из ваших данных с существенной коллекцией практических, структурированные рецепты.

"Clojure Поваренная книга по анализу данных" представляет рецепты для каждого этапа процесса анализа данных. Независимо от того, очищают ли данные данные с веб-страницы, выполняя интеллектуальный анализ данных или создавая графики для Интернета, эта книга имеет что-то для этой задачи.

Вы узнаете, как получить данные, очистить их и преобразовать в полезные графики, которые затем могут быть проанализированы и опубликованы Интернет. Покрытие включает в себя такие расширенные темы, как обработка данных одновременно применяя мощные статистические методы, такие как байесовский моделирования и даже алгоритмов интеллектуального анализа данных, таких как кластеризация K-средств, нейронных сетей и правил ассоциации.

подход

Полные практические советы, "Clojure Cookbook по анализу данных" помогут вы полностью используете свои данные с помощью серии пошаговых, реальных мировые рецепты, охватывающие все аспекты анализа данных.

Кто эта книга для

Опыт работы с Clojure и методами анализа данных и рабочие процессы будут полезными, но не важными.