Определить кортежи в сценарии свиньи

В настоящее время я отлаживаю скрипт свиньи. Я бы хотел определить кортеж в файле Pig напрямую (вместо базовой функции "Загрузить").

Есть ли способ сделать это?

Я ищу что-то вроде этого:

A= ('name#bob'','age#29';'name#paul','age#12')

Свалка вернется:

('bob',29)
('paul',12)

Ответ 1

На самом деле это невозможно сделать в свинье, как оно сейчас стоит. Если вы просто хотите отлаживать создание файла в hadoop и загрузить его. Напишите данные, которые вы хотите в файл (независимо от того, что вы создали вручную, если бы это было возможно) и загрузите его. Затем загрузите его с помощью свиньи.

Ответ 2

Следующий (грязный) трюк выполняет задание: - создайте файл. С одной пустой строкой и сохраните ее в HDFS. - загрузить его: Line = load/user/toto/onelinefile USING.. - создать собственные данные: foreach line сгенерировать "bob" как имя, 22 по возрасту;