Я пытаюсь использовать API-интерфейс Spark Dataset, но у меня возникают некоторые проблемы, связанные с простым объединением.
Скажем, у меня есть два набора данных с полями: date | value
date | value
, то в случае DataFrame
мое соединение будет выглядеть так:
val dfA : DataFrame
val dfB : DataFrame
dfA.join(dfB, dfB("date") === dfA("date") )
Однако для Dataset
существует метод .joinWith
, но такой же подход не работает:
val dfA : Dataset
val dfB : Dataset
dfA.joinWith(dfB, ? )
Каков аргумент, требуемый .joinWith
?