Мы планируем перенести код Apache Pig на новую платформу Spark.
Pig имеет концепцию "Bag/Tuple/Field" и ведет себя аналогично реляционной базе данных. Pig обеспечивает поддержку соединений CROSS/INNER/OUTER.
Для CROSS JOIN мы можем использовать alias = CROSS alias, alias [, alias...] [PARTITION BY parter] [PARALLEL n];
Но когда мы переходим на платформу Spark, я не мог найти аналога в Spark API. У вас есть идеи?