Я хочу перезаписать конкретные разделы, а не все в искровом режиме. Я пытаюсь выполнить следующую команду:
df.write.orc('maprfs:///hdfs-base-path','overwrite',partitionBy='col4')
где df - это dataframe, содержащий инкрементные данные, которые должны быть перезаписаны.
hdfs-base-path содержит основные данные.
Когда я пытаюсь выполнить приведенную выше команду, она удаляет все разделы и вставляет те, которые присутствуют в df по пути hdfs.
Какое мое требование состоит в том, чтобы перезаписать только те разделы, которые присутствуют в df по указанному пути hdfs. Может кто-нибудь, пожалуйста, помогите мне в этом?