Как восстановить (спрогнозировать) данные на основе корреляции / регрессии в Excel?

У меня есть данные, в которых объект (высота) соотносится с выходной переменной (ценой). Как восстановить отсутствующие данные (нули) в функции высоты на основе существующей зависимости (корреляции) между этими переменными?

Для большей ясности:  введите описание изображения здесь

Входные и выходные переменные имеют четкую корреляцию. Я предполагаю, что прогнозирование недостающих значений для Excel - не сложная процедура. Но мне нужны указания, как это реализовать.


person Erba Aitbayev    schedule 05.12.2015    source источник
comment
На самом деле это интересно. Вам нужно принять высоту как известное значение y, а цену - как известное значение x, и это дает несколько другие результаты, если делать это наоборот.   -  person Tom Sharpe    schedule 05.12.2015


Ответы (2)


Если у вас есть наклон (m) и точка пересечения (c) линии регрессии в E2 и E3 (скажем): -

=SLOPE(C2:C9,B2:B9)

=INTERCEPT(C2:C9,B2:B9)

вы можете переупорядочить простое уравнение регрессии y = mx + c, чтобы предсказать значения x

x=(y-c)/m

Итак, ваши прогнозируемые высоты будут: -

=IF(ISBLANK(B2),(C2-E$3)/E$2,B2)

начиная с D2.

введите здесь описание изображения

person Tom Sharpe    schedule 05.12.2015

Вы можете попробовать функцию ПРОГНОЗ¹ . Первый бланк не имеет достаточного количества предшествующих данных для создания результата прогноза, поэтому будет достаточно простого отношения, но можно сгенерировать оставшиеся значения и учесть ранее сгенерированные результаты ПРОГНОЗА для их собственных результатов.

FORECAST_Height

Формула в E2:

=IF(ISBLANK(B2), FORECAST(C2, B$2:B$9, C$2:C$9), B2)

¹ См. Функции прогнозирования для альтернативных алгоритмов прогнозирования данных.

person Community    schedule 05.12.2015
comment
@pnuts - Я поиграл с ним, чтобы попытаться получить лучший результат для 3.13 / 14000, но безуспешно. Если используется =IF(ISBLANK(B2), FORECAST(C2, B$2:B$9, C$2:C$9), B2), 3,13 становится 2,95 (лучше), а 2,75 становится 2,64 (хуже). - person ; 05.12.2015
comment
Что ж, я наконец увидел, что 2.64 / 11000 вполне уместен, как я думал изначально. Я убрал прогрессию в пользу более традиционного ПРОГНОЗА «на всю колонку». Спасибо, что заставили меня взглянуть еще раз. - person ; 05.12.2015