Мне дали файл PMML, содержащий модель наивного байесовского классификатора.
Можно ли импортировать файл PMML в MLlib и реконструировать модель с помощью языка программирования Python?
Мне дали файл PMML, содержащий модель наивного байесовского классификатора.
Можно ли импортировать файл PMML в MLlib и реконструировать модель с помощью языка программирования Python?
Можно ли импортировать файл PMML в MLlib..
Нет, это невозможно, потому что представления моделей PMML и MLlib несовместимы друг с другом.
Если у вас есть модель PMML, вы должны выполнить ее в Apache Spark, используя специальную библиотеку оценки PMML, такую как JPMML-Spark.
.. и реконструировать модель с помощью языка программирования Python?
Вы имеете в виду доступ к функциям оценки PMML с помощью PySpark? Вы можете выполнять функции JPMML-Spark с помощью PySpark, для этого не нужно реконструировать объект модели внутри Python.
Вы можете использовать PyPMML-Spark для импорта PMML в PySpark, например:
from pypmml_spark import ScoreModel
model = ScoreModel.fromFile('the/pmml/model/path')
score_df = model.transform(df)