Как бы вы выполняли базовые объединения в Spark с помощью python? В R вы можете использовать merg() для этого. Что такое синтаксис с использованием python для искры для:
- Внутренняя регистрация
- Левая внешняя связь
- Cross Join
С двумя таблицами (RDD) с одним столбцом в каждом, у которого есть общий ключ.
RDD(1):(key,U)
RDD(2):(key,V)
Я думаю, что внутреннее соединение выглядит примерно так:
rdd1.join(rdd2).map(case (key, u, v) => (key, ls ++ rs));
Это правильно? Я искал в Интернете и не могу найти хороший пример объединений. Спасибо заранее.