Я не могу понять это, но думаю, это просто. У меня есть световой блок данных df. Этот df имеет столбцы "A", "B" и "C". Теперь предположим, что у меня есть массив, содержащий имя столбцов этого df:
column_names = Array("A","B","C")
Я хотел бы сделать df.select()
таким образом, чтобы указать, какие столбцы выбрать.
Пример: скажем, я не хочу выбирать столбцы "B". Я попробовал
df.select(column_names.filter(_!="B"))
но это не работает, поскольку
org.apache.spark.sql.DataFrame не может быть применено к (Array [String])
Итак, здесь говорится, что он должен работать с Seq вместо этого. Однако, пытаясь
df.select(column_names.filter(_!="B").toSeq)
приводит к
org.apache.spark.sql.DataFrame не может применяться к (Seq [String]).
Что я делаю неправильно?