Как преобразовать действие Dependent Feature (ADF) из категориального в непрерывное/дискретное?

Я следую учебнику Vowpalwabbit по контекстным MAB с использованием cb_explore_adf, и мне было интересно, как преобразовать действия namespace в числовое, чтобы его можно было лучше обобщить для новой руки.

В этом уроке они представляют проблему рейтинга кликов (CTR), где действия представляют собой статьи, которые нужно показывать:

shared |User user=Tom time_of_day=morning
|Action article=politics
|Action article=sports
|Action article=music
|Action article=food

Как мы видим, функция статьи в пространстве имен Action имеет категориальное значение (политика, еда и т. д.).

Можно ли преобразовать его в числовое? Допустим, в моей задаче я показываю потребителям цену:

shared |User user=Tom time_of_day=morning
|Action price=2.99
|Action price=10.99

если я хочу протестировать новую цену, скажем, 6,99 доллара... принесет ли предыдущее обучение некоторую информацию?

Насколько я понимаю, VowpalWabbit использует : для числовых функций... это правда?

shared |User user=Tom time_of_day=morning
|Action price:2.99
|Action price:10.99

Я попробовал это, но это не сработало... на самом деле это сделало модель неспособной совмещаться.

Что я пропустил?

Благодарность


person Raphael Ottoni    schedule 09.02.2021    source источник


Ответы (1)


То, как вы используете числовые функции, правильно. Вы все еще пытаетесь играть с симулятором, представленным в руководстве? Если да, изменили ли вы логику вознаграждения (функция get_cost) — прямо сейчас она назначает вознаграждения на основе человека и time_of_day. Если вы хотите поиграть с новыми функциями, вам, вероятно, потребуется изменить логику, чтобы награды соответствовали вашей новой функции.

person Alexey Taymanov    schedule 18.02.2021