Как Spotify использует машинное обучение?

TLDR:

Используя различные режимы машинного обучения, Spotify произвел революцию в том, как их подписчики находят и потребляют музыку.

Контур:

вступление
Совместная фильтрация
Обучение с подкреплением
Обработка естественного языка
Заключение

вступление

Spotify содержит растущую библиотеку из более чем 82 миллионов песен. В то время как музыкальные энтузиасты могут рассматривать это как возможность для бесконечного открытия музыки, случайные слушатели, вероятно, будут ошеломлены выбором и будут придерживаться знакомых им каталогов. Видя, как подписчики, которые использовали Spotify для поиска музыки, больше наслаждались платформой, Spotify начал развертывать алгоритмы машинного обучения (ML), чтобы рекомендовать новые названия для всех своих пользователей.

Совместная фильтрация

Совместная фильтрация — это тип алгоритма рекомендаций, который делает прогнозы о предпочтениях одного пользователя на основе сбора данных от многих пользователей. Среди 406 миллионов подписчиков Spotify обнаруживаются многочисленные сходства между типами музыки, которую слушают определенные группы людей.

По состоянию на октябрь 2021 года у Spotify было 82 миллиона песен и 4 миллиарда плейлистов. Spotify рассматривает миллиарды плейлистов, созданных подписчиками, как пути получения полезных данных для оптимизации взаимодействия с пользователем. Директор по исследованиям и разработкам Густав Сёдерстёрм сказал в подкасте Лекс Фридман об искусственном интеллекте, что Spotify использует плейлисты или плейлисты в качестве языка программирования.

Подписчики Spotify, которые добавили больше плейлистов, сообщили, что их опыт намного лучше, чем у тех, кто этого не сделал. Приобретя компанию по поиску музыки Tungio, Spotify начал использовать человеческий интеллект и статистические методы для создания групповых списков воспроизведения и ручной настройки их для достижения максимальной производительности. Благодаря успеху этих групповых плейлистов Spotify увидел еще одну возможность; использовать ML для перехода от групповой к индивидуальной персонализации плейлиста.

Наряду с вовлечением пользователей растущее число создаваемых личных списков воспроизведения дало Spotify огромную базу данных для работы. Пользователи создавали плейлисты, группируя и маркируя песни, имеющие семантическое значение. Spotify смог использовать эти плейлисты, чтобы рекомендовать названия подписчикам со схожими музыкальными вкусами.

Алгоритм Spotify искал подписчиков, у которых были схожие плейлисты и история прослушивания (пользователи A и B добавили All Too Well Тейлора Свифта в плейлист). Алгоритм машинного обучения Spotify затем будет предлагать песни пользователям с похожей историей прослушивания, чтобы помочь в удержании и открытии новой музыки (пользователь А, добавляющий песню Bon Iver в свой плейлист, увеличивает шансы того, что пользователь B получит песню Bon Iver).

Обработка естественного языка

Обработка естественного языка (NLP) — это алгоритм, который дает компьютерам возможность понимать текст и речь. Чтобы классифицировать свою музыку, Spotify использует NLP, собирая в Интернете любой текст, который может найти о конкретной песне.

Затем НЛП Spotify классифицировал песни на основе языка, используемого для их описания. Ключевые слова будут выбраны и им будет присвоен вес, который может измерить, насколько песня демонстрирует определенную эмоцию. Это помогает алгоритмам Spotify определять, какие песни и исполнители входят в плейлисты вместе, что затем может быть более легко развернуто в системе рекомендаций.

Обучение с подкреплением

Обучение с подкреплением (Rl) — это тип рекомендательной системы на основе машинного обучения, которая учится и реагирует на данные путем интерактивных проб и ошибок. Spotify использует RL, чтобы размещать точные и содержательные песни и исполнителей на домашних страницах своих подписчиков.

Новый контент сначала предоставляется подписчикам с использованием совместной фильтрации или NLP. Затем подписчик будет взаимодействовать с песней на разных уровнях (прослушать песню один раз, на повторе, прослушать больше песен исполнителя) или отключиться, пропустив песню. В любом случае пользователь отправляет алгоритму информацию о том, насколько успешным был его прогноз.

RL используется для максимизации долгосрочного вознаграждения. В случае Spotify это вовлеченность и удовлетворенность пользователей. Объясняя, как RL используется для достижения бизнес-целей, вице-президент Spotify по персонализации Оскар Стол сказал, что «вместо того, чтобы давать пользователям пустые калории контент-диеты, которая удовлетворит их только в движении, RL стремится подтолкнуть их к более устойчивому , разнообразная и полноценная диета».

RL подталкивает пользователей к открытию музыки, которая отличается от их типичных вкусов и истории прослушивания. Расширение круга музыки, которую слушают подписчики, расширяет круг музыки, потребляемой в каталоге Spotify, что приносит пользу как исполнителю, так и платформе.

Заключение

Благодаря способности Spotify использовать машинное обучение они стали одним из самых популярных методов поиска и потребления музыки. Растущее число курируемых плейлистов и растущее число активных подписчиков говорит нам о том, что Spotify будет продолжать оставаться лидером по потреблению музыки в ближайшие годы.