Я заинтересован в развертывании модели машинного обучения в python, поэтому прогнозы могут быть сделаны с помощью запросов к серверу.
Я создам кластер Cloudera и воспользуюсь Spark для разработки моделей с помощью библиотеки pyspark. Я хотел бы знать, как модель может быть сохранена, чтобы использовать ее на сервере.
Я видел, что разные алгоритмы имеют .save-функции (например, ответ на этот пост Как сохранить и загрузить модель MLLib в Apache Spark), но поскольку сервер будет находиться на другой машине без Spark, а не в кластере Cloudera, я не знаю, можно ли использовать их .load и .predict функции.
Можно ли это сделать, используя функции библиотеки pyspark для прогнозирования без Spark? Или мне придется делать какие-либо преобразования, чтобы сохранить модель и использовать ее в другом месте?