Я ищу некоторую общую информацию о том, как другие люди используют Hadoop или другие технологии, подобные MapReduce. В общем, мне любопытно, записываете ли вы MR-приложения для обработки существующих наборов данных (например, файлы журналов веб-сервера) или пишите приложения, которые генерируют и обрабатывают новые наборы данных?
Edit: Последующие вопросы
(1) Выполняете ли вы когда-либо программу MR против данных, сгенерированных другими программами MR?
(2) Вам нужно изменить существующие наборы данных с помощью MR?
(3) Вы когда-нибудь делили свои наборы данных с другими разработчиками?