начиная с искры 2.0.1 У меня возникли некоторые вопросы. Я прочитал много документации, но пока не нашел достаточных ответов:
- В чем разница между
-
df.select("foo")
-
df.select($"foo")
-
- Правильно ли я понимаю, что
-
myDataSet.map(foo.someVal)
является typeafe и не будет преобразовываться вRDD
, но оставаться в представлении DataSet/без дополнительных накладных расходов (производительность для 2.0.0)
-
- все другие команды, например. выберите,.. просто синтаксический сахар. Они не являются типичными, и вместо них можно использовать карту. Как я мог
df.select("foo")
безопасный тип без оператора карты?- Почему я должен использовать UDF/UADF вместо карты (предполагая, что карта остается в представлении набора данных)?