Есть ли способ получить результаты заданий Dataproc Spark, отправленных в Google Cloud? Как объясняется в Dataproc docs, выход из драйвера задания (мастер для задания Spark) доступен в Dataproc- > Jobs в консоли. Есть две причины, по которым я хотел бы иметь журналы в Cloud Logging:
- Я хотел бы видеть журналы от исполнителей. Часто главный журнал говорит "потерянный исполнитель" без дальнейших подробностей, и было бы очень полезно получить дополнительную информацию о том, что делает исполнитель.
- Облачный журнал имеет хорошую фильтрацию и поиск
В настоящее время единственным выходом из Dataproc, который отображается в Cloud Logging, является запись элементов из нити-ниндманера- * и контейнера _ *. stderr. Вывод из моего кода приложения показан в Dataproc- > Jobs, но не в Cloud Logging, и это только вывод от мастера Spark, а не исполнителей.