Я хотел бы выполнить операцию DISTINCT для подмножества столбцов. В документации говорится, что это возможно с помощью вложенного foreach:
Вы не можете использовать DISTINCT для подмножества полей; для этого используйте FOREACH и вложенный блок, чтобы сначала выбрать поля, а затем применить DISTINCT (см. Пример: Вложенный блок).
Проще всего выполнить операцию DISTINCT для всех столбцов:
A = LOAD 'data' AS (a1,a2,a3,a4);
A_unique = DISTINCT A;
Давайте скажем, что меня интересует выполнение отдельных элементов через a1, a2 и a3. Может ли кто-нибудь представить пример, показывающий, как выполнить эту операцию с вложенным foreach, как это предлагается в документации?
Здесь приведен пример ввода и ожидаемого вывода:
A = LOAD 'data' AS(a1,a2,a3,a4);
DUMP A;
(1 2 3 4)
(1 2 3 4)
(1 2 3 5)
(1 2 4 4)
-- insert DISTINCT operation on a1,a2,a3 here:
-- ...
DUMP A_unique;
(1 2 3 4)
(1 2 4 4)