Как вы можете писать на несколько выходов в зависимости от ключа, используя Spark в одном задании.
Связано: пишите на несколько выходов с помощью ключа Scalding Hadoop, один MapReduce Job
Например
sc.makeRDD(Seq((1, "a"), (1, "b"), (2, "c")))
.writeAsMultiple(prefix, compressionCodecOption)
  будет гарантировать, что cat prefix/1
a
b
  и cat prefix/2 будут
c
 Ответ
Для точного ответа с полным импортом, сутенером и кодеком сжатия, см. qaru.site/info/112819/...