Стоит ли покупать Mahout в действии, чтобы ускориться с Mahout, или есть другие лучшие источники?

Я в настоящее время очень случайный пользователь Apache Mahout, и я рассматриваю покупку книги Mahout в действии. К сожалению, мне очень сложно получить представление о том, насколько это стоит эта книга - и видеть, как это Программа раннего доступа Manning (и, следовательно, только в настоящее время доступна в виде бета-версии электронной книги), я не могу взглянуть на себя в книжном магазине.

Может ли кто-нибудь рекомендовать это как хорошее (или менее хорошее) руководство для достижения скорости с помощью Mahout и/или других источников, которые могут дополнить веб-сайт Mahout?

Ответ 1

Говоря как коммиттер Маху и соавтор книги, я думаю, что это того стоит.; -)

Но серьезно, над чем вы работаете? Возможно, мы можем указать вам на некоторые ресурсы.

Некоторые аспекты Mahout просто трудно понять самостоятельно. Мы много работаем над тем, чтобы отвечать на вопросы в списке рассылки, но это может действительно помочь составить образец кода и дорожную карту. Без некоторых из них трудно даже задать хороший вопрос.

Ответ 2

Также соавтор здесь. Будучи "из уст лошади", это, вероятно, самая полная запись для самого Маху. Есть несколько хороших сообщений в блоге, и, конечно же, много хороших книг в более общем компьютерном обучении (мне нравится "Коллективный интеллект в действии" как широкое легкое введение). [email protected] имеет несколько человек, которые говорят, что им нравится книга FWIW, так же как и на книжных форумах (http://www.manning-sandbox.com/forum.jspa?forumID=623). Я думаю, что вы можете вернуться электронная книга, если это не совсем то, что вы хотели. Он определенно имеет 6 глав кластеризации.

Ответ 3

есть много частей книги, которые устарели, версия или две позади того, что является текущим. Кроме того, в тексте есть несколько ошибок, особенно в примерах. это может сделать вещи немного сложными при попытке воспроизвести обсуждаемые результаты.

Кроме того, вы должны знать, что самая зрелая часть mahout, система рекомендаций, вкус, не распространяется. Я не совсем уверен, почему это упаковано вместе с остальными махаутами. это скорее жалоба на пакет программного обеспечения, чем сам махот.

Ответ 4

В настоящее время лучше всего там. Возможно, такой же зрелый, как и продукт. Некоторые аспекты лучше других, понимание базовой реализации - это хорошие, практические методы для запуска и работы на Linux, mac osx и т.д. Для новичков не так много. Определение четкой стратегии о том, как обновлять рекомендацию, является iffy. Примеры производства довольно тонкие. Хорошая отправная точка, но вам нужно намного больше. Авторы делают наилучшую попытку помочь, но это довольно новый продукт. В общем, да, купите.

Ответ 5

Я получил книгу несколько недель назад. Настоятельно рекомендуется. Авторы также очень активны в списке рассылки, и в этом проекте много прохладной энергии.

Ответ 6

Вы также можете рассмотреть возможность чтения с помощью рабочих процессов Paco Nathan Enterprise Data Workflow в Cascading. Вы можете запустить PMML в своем кластере, экспортированном из R или SAS. Это не значит сказать ничего плохого о Маху в действии, авторы проделали большую работу и четко поставили время и силы, чтобы сделать его поучительным и интересным. Это скорее предложение выйти за рамки Махута. В настоящее время он не получил такого рода тяги, если бы он был более удобным для пользователя.

В его нынешнем виде пользовательский интерфейс Mahout является немного изменчивым и на самом деле не дает вам четкого представления о том, как разрабатывать и обновлять интеллектуальные системы и их жизненные циклы, IMO. Махут тоже не приемлем для академиков, они, скорее всего, будут использовать Matlab или R. В документах Mahout случайная реализация леса едва работает, а документы имеют ошибочные примеры и т.д. Это расстраивает, а parallelism и масштабируемость подпрограмм Mahout зависит от алгоритма. В настоящее время я не вижу, чтобы Махут оставался твердым, когда он стоял, снова ИМО. Надеюсь, я ошибаюсь!

http://shop.oreilly.com/product/0636920028536.do