Мне нужно объединить два обычных RDDs в одном столбце. Логически эта операция эквивалентна операции объединения базы данных из двух таблиц. Интересно, возможно ли это только через Spark SQL или есть другие способы сделать это.
В качестве конкретного примера рассмотрим
RDD r1 с первичным ключом ITEM_ID:
(ITEM_ID, ITEM_NAME, ITEM_UNIT, COMPANY_ID)
и RDD r2 с первичным ключом COMPANY_ID:
(COMPANY_ID, COMPANY_NAME, COMPANY_CITY)
Я хочу присоединиться к r1 и r2.
Как это можно сделать?