Я много слышал об Apache Hadoop как о потрясающем способе обработки интенсивных таков. Ищете действительно базовое введение в Hadoop. Как и эквивалент helloworld
, а затем, возможно, пример использования.
Пример использования Hadoop Hello World
Ответ 1
Пример кода WordCount настолько прост, что любой новый может понять его. Он есть
https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html#Example:+WordCount+v2.0
Просто скомпилируйте его, добавив все hasdop Api ex: hadoop-core.jar Создайте файл .jar netbin и удивляйтесь, когда он работает с hasoop в cmd.
Если вы хотите другой, я сделал sudo indexer... как
Cow 2.txt 3.txt 4.txt
Cat 1.txt
etc.
Просто спросите меня, я дам вам код, который так прост. Но я рекомендую вам сначала запустить этот пример.
Теперь я думал, что вы выполнили предыдущую задачу, так вот ссылка для использования → http://matrixsust.blogspot.com/2011/11/hadoop-simple-indexer-in-map-reduce.html
Надеюсь, что это поможет.
Ответ 2
Перед прыжком в Hadoop требуется знание MapReduce (Hadoop основан на MapReduce). Вот несколько хороших видео на MapReduce. Также проверьте Google Бумага на MapReduce.
Кроме того, если вы действительно заинтересованы в Hadoop, Hadoop: The Definitive Guide является обязательным для книги.