У меня есть IntelliJ IDEA с Apache Spark 1.4.
Я хочу иметь возможность добавлять точки отладки в мои скрипты Spark Python, чтобы я мог легко их отлаживать.
В настоящее время я запускаю этот бит Python для инициализации искрового процесса
proc = subprocess.Popen([SPARK_SUBMIT_PATH, scriptFile, inputFile], shell=SHELL_OUTPUT, stdout=subprocess.PIPE)
if VERBOSE:
print proc.stdout.read()
print proc.stderr.read()
Когда spark-submit
в конечном итоге вызывает myFirstSparkScript.py
, режим отладки не задействован и выполняется как обычно. К сожалению, редактирование исходного кода Apache Spark и запуск персонализированной копии не являются приемлемым решением.
Кто-нибудь знает, возможно ли исправить-отправить вызов Apache Spark script в режиме отладки? Если да, то как?