Я работаю над этой проблемой в течение двух дней и до сих пор не нашел пути.
Проблема. Наш Spark, установленный через новейший CDH 5, всегда жалуется на потерянный класс LzoCodec даже после установки HADOOP_LZO через Parcels в диспетчере cloudera. Мы запускаем MR1 на CDH 5.0.0-1.cdh5.0.0.p0.47.
Попробуйте исправить: Также добавлены конфигурации в официальной документации CDH об использовании LZO Parcel, но проблема все еще существует.
Большинство сообщений в googled дают аналогичные рекомендации выше. Я также подозреваю, что искра пытается работать против YARN, которая не активируется там; но я не могу найти конфигурацию в CMF или других сообщениях по этой теме.
Пожалуйста, помогите мне, если вы знаете, как с этим бороться.