У меня возникают некоторые проблемы с regexp_extract:
Я запрашиваю файл с разделителями табуляции, столбец, который я проверяю, имеет строки, которые выглядят следующим образом:
abc.def.ghi
Теперь, если я это сделаю:
select distinct regexp_extract(name, '[^.]+', 0) from dummy;
Выполняется MR-задание, оно работает, и я получаю "abc" из индекса 0.
Но теперь, если я хочу получить "def" из индекса 1:
select distinct regexp_extract(name, '[^.]+', 1) from dummy;
Сбой с помощью:
2011-12-13 23:17:08,132 Stage-1 map = 0%, reduce = 0%
2011-12-13 23:17:28,265 Stage-1 map = 100%, reduce = 100%
Ended Job = job_201112071152_0071 with errors
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
Файл журнала говорит:
java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row
Я делаю что-то принципиально неправильное здесь?
Спасибо, Марио