У меня было пару вопросов по поводу выхода из простого пробега VW. Я читал в Интернете и на вики-сайтах, но все еще не уверен в паре основных вещей.
Я выполнил следующее на данных о жилье в Бостоне:
vw -d housing.vm --progress 1
где файл Housing.vm настроен как (частично):
и вывод (частично):
Вопрос 1:
1) Правильно ли думать о столбце средних потерь как о следующих шагах:
а) предсказать ноль, поэтому первая средняя потеря - это квадрат ошибки первого примера (с прогнозом равным нулю)
б) построить модель на примере 1 и предсказать пример 2. Усреднить теперь 2 квадрата потерь
c) построить модель на примере 1-2 и предсказать пример 3. Усреднить теперь 3 квадрата потерь
d) ...
Делайте это, пока не дойдете до конца данных (при условии одного прохода)
2) Каковы текущие функции столбцов? Похоже, это количество ненулевых признаков + перехват. То, что показано в примере, говорит о том, что признак не засчитывается, если он равен нулю — так ли это? Например, вторая запись имеет нулевое значение для «ZN». Действительно ли VW считает, что эта числовая функция отсутствует??