Мне нужно объединить два обычных RDDs
в одном столбце. Логически эта операция эквивалентна операции объединения базы данных из двух таблиц. Интересно, возможно ли это только через Spark SQL
или есть другие способы сделать это.
В качестве конкретного примера рассмотрим
RDD r1
с первичным ключом ITEM_ID
:
(ITEM_ID, ITEM_NAME, ITEM_UNIT, COMPANY_ID)
и RDD r2
с первичным ключом COMPANY_ID
:
(COMPANY_ID, COMPANY_NAME, COMPANY_CITY)
Я хочу присоединиться к r1
и r2
.
Как это можно сделать?