В данный момент я знакомлюсь с Pyspark
и SparkML
. Для этого я использую титанический набор данных, чтобы обучить GLM предсказывать «стоимость проезда» в этом наборе данных.
Я внимательно слежу за документацией Spark. У меня есть рабочая модель (которую я называю glm_fare
), но когда я пытаюсь оценить обученную модель с помощью summary
, я получаю следующее сообщение об ошибке:
RuntimeError: для этой GeneralizedLinearRegressionModel нет сводки по обучению
Почему это?
Код для обучения был таким:
glm_fare = GeneralizedLinearRegression(
labelCol="Fare",
featuresCol="features",
predictionCol='prediction',
family='gamma',
link='log',
weightCol='wght',
maxIter=20
)
glm_fit = glm_fare.fit(training_df)
glm_fit.summary