Я пытаюсь использовать API-интерфейс Spark Dataset, но у меня возникают некоторые проблемы, связанные с простым объединением.
Скажем, у меня есть два набора данных с полями: date | value date | value, то в случае DataFrame мое соединение будет выглядеть так:
val dfA : DataFrame
val dfB : DataFrame
dfA.join(dfB, dfB("date") === dfA("date") )
Однако для Dataset существует метод .joinWith, но такой же подход не работает:
val dfA : Dataset
val dfB : Dataset
dfA.joinWith(dfB, ? )
Каков аргумент, требуемый .joinWith?