У меня есть текстовый файл, и первая строка содержит заголовок. Теперь я хочу выполнить некоторую операцию над данными, но при загрузке файла с помощью PigStorage он также принимает HEADER. Я просто хочу пропустить HEADER. Можно ли это сделать (напрямую или через UDF)?
Это команда, которую я использую для загрузки данных:
input_file = load '/home/hadoop/smdb_tracedata.csv'
USING PigStorage(',')
as (trans:chararray, carrier:chararray,aainday:chararray);