Я подумываю об использовании hadoop для обработки больших текстовых файлов на моих существующих серверах Windows 2003 (около 10 четырехъядерных процессоров с 16 ГБ ОЗУ)
Вопросы:
-
Есть ли хорошее руководство по настройке кластера hadoop на окнах?
-
Каковы требования? java + cygwin + sshd? Что-нибудь еще?
-
HDFS, он хорошо играет в окнах?
-
Я хотел бы использовать hasoop в потоковом режиме. Любой совет, инструмент или трюк для разработки моего собственного картографа/редуктора в С#?
-
Что вы используете для отправки и мониторинга заданий?
Спасибо