Я обсуждал, что такое простая линейная регрессия и множественная регрессия в своих предыдущих статьях. Итак, что такое полиномиальная регрессия?
Что такое полиномиальная регрессия?
Это форма регрессионного анализа, в которой взаимосвязь между зависимой (y) и независимой переменной (x) моделируется как полином n-й степени от x. Когда данные нанесены на график, если они образуют кривую, мы можем применить полиномиальную регрессию.
Уравнение полиномиальной регрессии:
Пример:
Здесь точки данных имеют нелинейную зависимость. Красная линия представляет собой полиномиальную регрессию, а зеленая линия представляет собой простую или множественную линейную регрессию. Мы можем четко сказать, что зеленая линия имеет больше MSE по сравнению с красной линией.
Давайте рассмотрим следующие данные:
здесь зависимой переменной является заработная плата, а затем независимой переменной является уровень. Создаются матрица признаков и вектор зависимой переменной.
Затем мы сначала нанесем данные на график, чтобы увидеть взаимосвязь между зависимыми и независимыми переменными.
Здесь мы получили нелинейную зависимость. Он увеличивается экспоненциально, поэтому мы можем применить полиномиальную регрессию. Давайте обучим данные как с линейной регрессией, так и с полиномиальной регрессией.
Степень используется для преобразования независимой переменной в полиномиальное выражение, как в уравнении полиномиальной регрессии.
Здесь первый столбец равен x⁰, второй столбец равен x¹ и так далее. мы можем видеть, что оно преобразуется в полиномиальное уравнение. Сейчас мы тренируемся с обеими моделями. При визуализации:
Линейная регрессия:
Полиномиальная регрессия:
Понятно, что у линейной регрессии больше MSE. Так что полиномиальная регрессия подходит лучше.