Основные моменты RecSys 2019

Системы рекомендаций, глубокое обучение, ориентированность на пользователя, воспроизводимость и многозадачность

Авторы: Ромен Бомонт, Амин Бенхаллум, Флориан Курсьяль, Уго Таниелян, Марина Виньес, Пранжул Ядав

Recsys 2019 проходил в Копенгагене и собрал 909 участников со всего мира, что на сегодняшний день является крупнейшим мероприятием. RecSys охватывает широкий спектр тем, касающихся рекомендательных систем, от их социального воздействия до алгоритмов, на которых они основаны. Criteo AI Lab представила два доклада для основной конференции, а также является одним из соорганизаторов семинара REVEAL.

В этом году мы увидели, что эта область созревает не только с точки зрения алгоритмов и методов, но, что более важно, путем рассмотрения и признания некоторых из ее проблем. Присутствие социологов среди докладчиков и участников - это мягкое напоминание о том, что мы влияем на жизнь людей, как они взаимодействуют с информацией, как они потребляют и как их развлекают, и, как однажды сказал известный философ: С большим власть - большая ответственность . Мы несем ответственность за это не только перед нашими пользователями, но и перед коллегами, и мы обязаны им быть более строгими. В следующих нескольких разделах эти вопросы будут рассмотрены более подробно.

Да, еще было несколько довольно крутых алгоритмов и приложений ^^.

Социальное влияние

В этом году особое внимание было уделено целостности и социальному влиянию рекомендательных систем. Основной докладчик Мирей Хильдебрандт рассказала о том, как GDPR может изменить стимулы контролеров, то есть тех, кто определяет цель и средства обработки, такие как рекламодатели или издатели, от простой оптимизации для получения прибыли, чтобы также учитывать прозрачность и лучшее методика (см. слайды). Во втором выступлении, Эстер Харгиттай, говорилось о поведении людей в Интернете, о том, как оно различается на разных платформах и как оно может приводить к предвзятости в алгоритмах. Наконец, группа рассмотрела проблему создания рекомендательных систем социальной ответственности.

Воспроизводимость и прогресс

Неудивительно, что воспроизводимость - важная тема, которая сейчас волнует эту область. Но проблема выходит за рамки простого предоставления кода любому желающему и подчеркивает фундаментальную проблему в том, как проводятся эксперименты и измеряется прогресс: базовые показатели часто не настраиваются должным образом, наборы наборов данных и задач не обязательно тщательно выбираются, а меры по улучшению требуются. не всегда проверяется на значимость. Действительно ли мы добиваемся большого прогресса? Тревожный анализ недавних подходов к нейронным рекомендациям поставил действительно важный вопрос, поскольку он сравнивал несколько недавних «сложных» методов (также известных как варианты нейронного CF), чтобы не только воспроизвести полученные результаты, но и превзойти хорошо настроенные более простые базовые уровни. Им это удалось? Что ж, давайте просто скажем, что слово «тревожный» в названии есть не просто так.

Эта работа была отмечена как лучшая работа, посылая сигнал о том, что в этой области в целом следует приложить больше усилий.

Многоцелевая / многозадачная оптимизация

Использование систем рекомендаций часто связано с несколькими задачами, чтобы решить эту проблему, можно выразить проблему в многозадачной постановке.

Оптимизация

Все больше и больше рекомендательных систем стремятся оптимизировать более чем для одной цели. Например, вы хотите оптимизировать просмотр видео, но при этом отметьте лайки и комментарии к нему. Для этого в системе будет несколько функций потерь, по одной на цель. В какой-то момент вы должны объединить эти потери в одну, для этого вы назначаете вес для каждой из них. Например, просмотр видео может быть вдвое важнее, чем вероятность взаимодействия с ним. Ручная установка этих весов может быть неоптимальной или обременительной при работе с большим количеством целей. Номинант на лучшую работу, Эффективный по Парето алгоритм для множественной целевой оптимизации в электронной коммерции, представляет способ автоматического вычисления этих весов для достижения состояния, при котором изменение одного из весов может быть выполнено только в стоимость одной из целей (состояние, эффективное по Парето, когда ни одна цель не может быть улучшена без ущерба для других). Чтобы получить оптимумы, эффективные по Парето, часто используются следующие методы:

  • эволюционная эвристика, которая не может гарантировать эффективность по Парето
  • методы скаляризации, объединяющие все цели в одну, которая представляет собой взвешенную сумму потерь. Обычно веса скаляризации определяются вручную.
  • В этой статье авторы рассматривают скаляризационный подход и предлагают двухэтапный алгоритм для изучения весов скаляризации с теоретическими гарантиями. Шаг обновления весов сводится к решению квадратичной задачи с ограничениями.

Архитектура

Google представил два документа, демонстрирующих многоцелевую архитектуру поиска и ранжирования видео. Один из них: Рекомендовать, какое видео смотреть дальше: многозадачная система ранжирования. Он предлагает обрабатывать сложные взаимодействия со сложной структурой, чтобы научиться рекомендовать видео:

  • несколько целей: вовлеченность, удовлетворение
  • несколько видов вложений: изображения и тексты
  • для достижения этих целей использует смесь экспертных моделей с несколькими воротами.

Два урока также были посвящены этой теме, не хватило места для всех участников, что свидетельствовало о возрастающем интересе.

Учимся на неявной обратной связи

Рекомендательные системы часто основаны на неявных сигналах обратной связи (например, клики, просмотры…), которые напрямую не измеряют удовлетворенность пользователя. Во многих статьях представлены методы, позволяющие лучше использовать неявную обратную связь.

Relaxed Softmax for PU Learning предлагает новый способ подхода к отрицательной выборке, который является вездесущим шагом в положительном немаркированном обучении (обучение на основе неявной обратной связи тесно связано с этой задачей), большинство методов предполагают отрицательные выборки из фиксированного распределения ( популярность, униформа,…). В этой статье (которая является бумагой Criteo - ура!) Предлагается новая схема отрицательной выборки, основанная на распределении Больцмана, где отрицательные выборки выбираются ближе к границе решения используемого алгоритма, чтобы быть более информативным.

Использование обратной связи после щелчка для рекомендаций по содержанию решает проблему информации после щелчка. Они сосредоточены на реальных наборах музыкальных и видеоданных с информацией после щелчка (то есть, прослушивается ли песня или пропускается) и показывают улучшения в AUC по точечной и попарной моделям (18,3% и 2,5% соответственно). Авторы предлагают общую вероятностную структуру для объединения трех непересекающихся наборов наблюдений: щелчок завершен, щелчок, затем пропуск или отсутствие щелчка. Уровни уверенности каждого типа обратной связи моделируются с помощью дисперсии гауссовых распределений. Затем они проводят оценку максимального правдоподобия.

В медийной рекламе распределение функций может быть нестационарным, и модель, прогнозирующая клики, должна регулярно обновляться. Одна из проблем заключается в том, что недавние отзывы пользователей недоступны сразу. В статье Обращение к отложенной обратной связи для непрерывного обучения с помощью нейронных сетей при прогнозировании CTR они обращаются к проблеме отложенной обратной связи.

В связанной работе используются потери отложенной обратной связи (которая предполагает отдельную модель для задержки обратной связи) и потеря PU (которая рассматривает все отрицательные выборки в смещенных данных как немаркированные). Авторы предлагают две функции потерь, которые приводят к наилучшей офлайн-производительности и переводят на онлайн-прибыль на широкой и глубокой модели:

  • FN weighted на основе выборки по важности. Образцы сначала помечаются как отрицательные, а затем дублируются с помощью
    положительной метки, как только происходит взаимодействие с пользователем.
  • откалиброванная версия потери калибровки FN

Даже если отзыв кажется явным, например, как покупка, товар мог быть куплен даже без рекомендации. Повышение (также называемое инкрементальностью) определяется как увеличение количества действий пользователя, вызванных рекомендациями. Оценка на основе повышения и оптимизация рекомендателей предлагает новый протокол автономной оценки и метод оптимизации для рекомендаций на основе повышения.

Вместо того, чтобы рассматривать каждый элемент отдельно и каждое действие независимо, От предпочтений к принятию решений: моделирование взаимодействий с пользователем в рекомендательных системах рассматривается вопрос о том, что несколько элементов влияют друг на друга на странице с несколькими действиями и типами действий. Для этого они вводят RNN на уровне страницы.

Дополнительная информация: рекомендации, основанные на содержании

Контентные методы особенно полезны для решения проблемы холодного запуска: некоторые элементы имеют мало просмотров, некоторые партнеры новые.

CB2CF: Neural Multiview Content-to-Collaborative Filtering Model для полностью холодных рекомендаций по элементам решает эту проблему путем создания CF-встраивания только с контентом в форме:

  • категориальные особенности
  • непрерывные функции
  • вложения слов

Затем они сопоставляют их с вложениями CF с помощью простой CNN. Их результаты показывают, что CB2CF не так хорош, как CF, но лучше, чем только CB, и решает проблему холодного запуска.

HybridSVD: Когда совместной информации недостаточно предлагает метод совместного использования совместной информации и сходства на основе контента для создания продуктов и пользовательских встраиваний путем расширения традиционного подхода на основе SVD (который мы создали очень эффективную и масштабируемую реализацию , как отметил автор во время презентации). Ключевая идея состоит в том, чтобы заменить элементы скалярного произведения в матрице Грама таблицы взаимодействия билинейной формой, параметризованной вспомогательной матрицей сходства пользователей или элементов, построенной на основе контента. Нам также особенно понравился очень четкий и подробный процесс воспроизведения результатов, найденных на github).

Масштабирование глубокого обучения для рекомендаций

Для создания крупномасштабных рекомендательных систем необходимо предложить эффективные конструкции, снижающие затраты на инфраструктуру.

Для этого Нейронное моделирование с коррекцией смещения выборки для рекомендаций по элементам большого корпуса предлагает создавать вложения элементов и пользователей с использованием архитектуры нейронной сети. Чтобы иметь возможность получать множество продуктов, они используют эффективную реализацию KNN и модель ранжирования. Самыми новыми элементами являются метод отрицательной выборки, в котором используется смесь популярных и непопулярных негативов. А оценка частоты потоковой передачи позволяет эффективно вычислять элементы и пользовательские функции.

В крупномасштабных рекомендательных системах с глубоким обучением количество внедрений элементов очень велико, и ими сложно манипулировать.

В частности, это вызывает трудности с эффективным выполнением KNN для всего каталога, сохраняя при этом низкую задержку и низкое использование памяти. Для решения этой проблемы PQ-VAE: эффективные рекомендации с использованием квантованных вложений предлагает квантовать элементы с использованием экспоненциального скользящего среднего k-средних. Они интегрируют эту кодировку непосредственно в архитектуру NN, непосредственно изучая нетрансформированные вложения.

Это позволяет уменьшить размер вложений элементов на 1-2 порядка.

Подходы, специфичные для предметной области

Хотя многие методы рекомендаций являются достаточно общими для использования во многих доменах, часто бывает полезно рассмотреть конкретные подходы для точной настройки производительности для конкретного домена.

Адаптация домена в медийной рекламе: приложение для холодного запуска партнера (статья Criteo) предлагает решить проблему адаптации домена, когда история взаимодействия пользователя с одним партнером (целевой домен) недоступна, но у нас есть история взаимодействие пользователя с другими партнерами (исходный домен). Основная проблема для достижения этого заключается в том, что распределение данных в исходном и целевом доменах различается. Чтобы решить эту проблему, они предлагают включить сходство партнеров (информацию на уровне категории продукта). Они также предлагают подход к адаптации домена с учителем, называемый SDA-Ranking, путем использования потери ранжирования для задачи адаптации домена. Доказано, что это эффективно на наборе реальных данных, полученных от Criteo.

Рекомендации с учетом стиля решают проблему пузыря фильтра, предлагая рекомендации с учетом стиля. Он использует модель VAE для интеграции стилей в рекомендации. Для этого он использует встраивание как текста, так и изображений и создает интерпретируемую кодировку профиля пользователя. Главный результат - увеличение присутствия продуктов с требуемым стилем.

Еще одна интересная идея представлена ​​в статье Пользователи в цикле: психологически обоснованный подход к поиску похожих предметов о том, как измерить сходство предметов в моде. Они предлагают использовать психологически обоснованную функцию подобия, называемую сходством Тверски, на основе асимметричной психологии (сходные характеристики имеют большее значение, чем отличительные). Исследования показывают, что модели, основанные на сходстве Тверски, превосходят обычную психологически-наивную функцию подобия Жаккара в прогнозировании суждений пользователей о сходстве в контексте моды.

REVEAL Мастерская

Семинар REVEAL в этом году имел ошеломляющий успех, с докладами представителей промышленности и ученых на самые разные темы, от обучения с подкреплением и бандитских подходов до более общих тем, таких как оценка вовлеченности пользователей и влияние рекомендательных систем.

Мы также сделали неожиданное объявление о нашем RecoGym Challenge, который начнется 1 октября. Так что, если вы думаете, что у вас есть все необходимое, чтобы реализовать выигрышный алгоритм для Среды моделирования рекомендаций и получить призовые деньги, участвуйте! Мы обещаем, что это будет весело.

В этом году RecSys было очень весело, конференция растет и набирает обороты. Благодарим организаторов основных конференций и семинаров за отличную работу!

(Кстати, в Копенгагене тоже было много веселья).

Увидимся в следующем году!

Авторы: Ромен Бомонт, Амин Бенхаллум, Флориан Курсьяль, Уго Таниелян, Марина Виньес, Пранджул Ядав