Я играл с конвертированием RDD в DataFrames и обратно. Во-первых, у меня был RDD типа (Int, Int), называемый dataPair. Затем я создал объект DataFrame с заголовками столбцов, используя:
val dataFrame = dataPair.toDF(header(0), header(1))
Затем я преобразовал его из DataFrame обратно в RDD, используя:
val testRDD = dataFrame.rdd
который возвращает RDD типа org.apache.spark.sql.Row(not (Int, Int)). Затем я хотел бы преобразовать его обратно в RDD с использованием .toDF, но я получаю сообщение об ошибке:
error: value toDF is not a member of org.apache.spark.rdd.RDD[org.apache.spark.sql.Row]
Я попытался определить схему типа Data (Int, Int) для testRDD, но я получаю исключения типа несоответствия:
error: type mismatch;
found : org.apache.spark.rdd.RDD[org.apache.spark.sql.Row]
required: org.apache.spark.rdd.RDD[Data]
val testRDD: RDD[Data] = dataFrame.rdd
^
Я уже импортировал
import sqlContext.implicits._