У меня есть Dataframe, который я читал из файла CSV со многими столбцами, такими как: timestamp, steps, heartrate и т.д.
Я хочу суммировать значения каждого столбца, например, общее количество шагов в столбце "шаги".
Насколько я вижу, я хочу использовать такие функции: http://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.functions$
Но я могу понять, как использовать сумму функций.
Когда я пишу следующее:
val df = CSV.load(args(0))
val sumSteps = df.sum("steps")
сумма функции не может быть решена.
Я неправильно использую сумму функции? Нужно ли сначала использовать карту функций? и если да, то как?
Простой пример был бы очень полезен! Недавно я начал писать "Scala".