Я потратил немало времени на чтение некоторых вопросов с pyspark и spark-dataframe, и очень часто я нахожу, что плакаты не предоставляют достаточной информации, чтобы действительно понять их вопрос. Обычно я комментирую просить их опубликовать MCVE, но иногда получение их для отображения некоторых данных ввода/вывода образца похоже на вытягивание зубов. Например: см. Комментарии к этому вопросу.
Возможно, часть проблемы заключается в том, что люди просто не знают, как легко создавать MCVE для блоков с искробезопасными данными. Я думаю, что было бы полезно иметь версию этого pandas вопроса об искровых кадрах > в качестве руководства, которое может быть связано.
Итак, как же создать хороший, воспроизводимый пример?