Это люди плюс машины

Машинное обучение в журналистике

Интересуясь вспомогательными алгоритмами в журналистике, Neiman Lab и Knight Lab освещали подходы New York Times и Washington Post к рекомендации контента соответственно. У них разные подходы, но они решают одну и ту же проблему.

Когда вы пытаетесь обработать огромное количество информации, вы сталкиваетесь с проблемой масштабирования. Люди лучше разбираются в отдельных фрагментах контента, чем об алгоритмах, но когда вы пытаетесь просмотреть тысячи фрагментов контента в режиме реального времени и внести предложения о том, что читать, это становится проблемой . - Эван Хансен

Газета "Нью-Йорк Таймс

Команда специалистов по анализу данных в NYT создала слабого бота под названием Blossom. Он предлагает несколько статей, которые, по его мнению, станут вирусными для редакторов социальных сетей и редакторов, занимающихся вопросами роста. Они немного скупы на технические детали.

Как превратить все эти данные в алгоритм? Как правильно представить все эти данные, какие атрибуты поведения истории могут иметь значение? - Крис Виггинс, главные специалисты по обработке данных, NYTimes

Я предполагаю, что это следует за их другой работой по созданию микротегов и созданию значимых метаданных из большого количества контента, который они публикуют ежедневно. Такой подход кажется людям сосредоточенным на том, что редакторы запрашивают информацию о материалах, прежде чем решить, стоит ли делать репост в Facebook или Twitter.

«Технологии, конечно же, не заменяют старые добрые новостные суждения, и есть большая разница между основанными на данных и полностью управляемыми данными».

Вашингтон Пост

Гораздо более глубоким и интересным является исследование Райаном Граффом системы рекомендаций Clavis от WaPo. Это глубокая персонализация с использованием подробно описанных методов.

Вкратце, Clavis - это технология, которая определяет, о чем рассказывают истории, классифицирует их по темам и присваивает каждой серии ключевых слов. Он запускает тот же процесс в отношении читателей Post и определяет их предполагаемые интересы на основе рассказов, которые они прочитали. Затем Клавис объединяет читателей с историями, которые соответствуют их истории чтения . - Райан Графф

Процесс начался с разговоров с редакторами, в результате чего был составлен список тем из 130 общих пунктов. Он различает важные и неважные слова и дает индивидуальные рекомендации, которые также учитывают общую популярность.

Интуитивная прозорливость

Учитывая гиперперсонализацию услуг от сбора данных, мне интересно, что происходит со случайностью. Лиам Эндрю в своем репортаже немного говорит: Мне повезет.

Внедрение случайности и игры в рекомендательные системы может быть ценным само по себе, но кажется особенно своевременным, учитывая, что в настоящий момент мы уделяем большое внимание персонализации контента. Нам всем нужна актуальная информация, но, возможно, вы хотите увидеть что-то, что пользователям непохоже на вас понравилось, или то, на что никто никогда раньше не наталкивался . - Лиам Эндрю

Заключаемся ли мы в старые шаблоны с индивидуализацией? Стоит задуматься о том, как мы уравновешиваем полярности.

Я думаю, что в конечном итоге это комбинация людей и машин. Однако то, что делают алгоритмы, в основном реагирует на то, что люди делают с контентом . - Эван Хансен