Я пытаюсь загрузить данные из файла csv, в котором значения заключены в двойные кавычки "и вкладка" \ t". Но когда я пытаюсь загрузить это в куст, он не бросает никаких ошибок, и данные загружаются без какой-либо ошибки, но я думаю, что все данные загружаются в один столбец и большинство значений, отображаемых как NULL. ниже приводится инструкция create table.
CREATE TABLE example
(
organization STRING,
order BIGINT,
created_on TIMESTAMP,
issue_date TIMESTAMP,
qty INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
ESCAPED BY '"'
STORED AS TEXTFILE;
Пример входного файла -
"Organization" "Order" "Created on" "issue_date" "qty"
"GB" "111223" "2015/02/06 00:00:00" "2015/05/15 00:00:00" "5"
"UK" "1110" "2015/05/06 00:00:00" "2015/06/1 00:00:00" "51"
и оператор Load для ввода данных в таблицу hive.
LOAD DATA INPATH '/user/example.csv' OVERWRITE INTO TABLE example
В чем может быть проблема и как я могу игнорировать заголовок файла. и если я удалю ESCAPED BY '' 'из инструкции create, ее загрузку в соответствующие столбцы, но все значения заключаются в двойные кавычки. Как удалить двойные кавычки из значений и игнорировать заголовок файла?