Как мы находим сценарии использования машинного обучения

Наш процесс: мы помогаем ›50 компаниям решить, что им делать с машинным обучением.

Машинное обучение - чрезвычайно универсальный инструмент. Некоторые приложения являются общедоступными, например Discover Weekly Spotify, Movie Recommender от Netflix или Google Translate. Многие другие скрыты и созданы за кулисами командами, которые использовали ИИ для решения уникальных задач своего бизнеса.

Если у вашего бизнеса большой объем данных, и вы спрашиваете себя: «Как я могу использовать ИИ, чтобы создать что-то умное из наших данных?» - продолжайте читать. Мы помогли многим компаниям ответить на этот вопрос. Это наш процесс:

1. Назначьте встречу с нужными людьми

2. Познакомьте всех с машинным обучением

3. Все впитывай, мало предполагай

4. Составьте список процессов, подходящих для машинного обучения

5. Проверить осуществимость

«6. Расставлять приоритеты"

«7. Исследовательская работа"

«8. Принимать решение"

1. Назначьте встречу с нужными людьми.

Независимо от того, какой вариант использования вы обнаружите, он должен основываться на целях и данных компании. Ни менеджмент, ни инженерное дело не могут дать вам все ответы. Вам нужна междисциплинарная встреча. Проведите встречу с провидцем продукта (генеральным директором, вице-президентом по продукту) и кем-то, кто знает каждый набор данных (технический директор, руководитель отдела разработки данных). Вы должны запланировать для этого как минимум полдня.

Вам нужна междисциплинарная встреча.

2. Познакомьте всех с машинным обучением.

Машинное обучение - это такой же инструмент, как и любой другой: чем больше вы его понимаете, тем лучше вы можете его использовать. Если люди думают, что это волшебный черный ящик, они не смогут помочь вам с поиском.

Так что сделайте это практичным, опустите математику и рассмотрите эти три основы машинного обучения:

Что такое машинное обучение?
Когда его можно использовать?
Каковы распространенные заблуждения?

Я написал сообщение, чтобы ответить на эти вопросы: 3 основы машинного обучения

Когда все поймут, что такое машинное обучение, пора вам поучиться у них:

3. Поглощать все, мало предполагать

Каждая фирма уникальна. Даже в пределах узких вертикалей перекрытие в том, что нужно двум разным компаниям, меньше, чем вы думаете. Не пытайтесь вместить свой бизнес в коробку.

Составьте карту деловой местности.

Цели. Какие цели движут компанией прямо сейчас? Какие проблемы стоят за этими целями?

История. Какие проекты были реализованы в прошлом? Каковы были результаты, проблемы и уроки?

Данные. Какие данные существуют? Где он генерируется и где сохраняется? Насколько последовательна история в каждой базе данных? Как именно выглядит каждая таблица? Можно ли объединить разные наборы данных по уникальным идентификаторам?

Инфраструктура. Какая инфраструктура предпочтительнее? Существуют ли соответствующие политики или ограничения в отношении того, какого поставщика использовать (локальный, AWS или Google Cloud)?

Стратегия науки о данных. Каково ваше видение науки о данных? Вы хотите создать свою собственную команду экспертов или хотите найти опытную команду, которая создаст для вас решение? Или сочетание того и другого?

После того, как вы узнаете, что движет вашим бизнесом в данный момент, вы можете перейти к конкретным вопросам. Пришло время собрать все возможные варианты использования.

4. Составьте список процессов, подходящих для машинного обучения.

Где используется много данных для автоматизации принятия решений?

Машинное обучение - это просто инструмент для автоматизации обнаружения закономерностей и последующего умного прогнозирования на их основе. В большинстве случаев речь идет об улучшении существующего процесса, сделав его немного умнее. Процессы, которые являются хорошими кандидатами для машинного обучения, обычно:

На основе данных: процесс принятия решений уже полностью основан на данных.
Масштабность: принятие решений происходит снова и снова, тысячи или миллионы раз.
Автоматизировано. В этом процессе в некоторой степени уже используется программное обеспечение.

Уже автоматизированные крупномасштабные процессы принятия решений на основе данных - идеальные потенциальные кандидаты для систем машинного обучения.

Хорошие примеры:

Рекомендации по продукту
Кредитный скоринг
Персонализированный маркетинг
Обнаружение мошенничества
Распознавание изображений

Так что подумайте о том, где много данных используется для автоматизации принятия решений и есть ли возможности для улучшения.

Следующее лучшее место для использования машинного обучения - поддержка процесса, которым в настоящее время занимаются люди. Если он полностью основан на данных, часто повторяется, утомителен и, следовательно, медленен, его, возможно, нужно улучшить. Можете ли вы сделать это быстрее, обучив машину принимать некоторые из этих решений?

5. Проверить осуществимость

Для каждого варианта использования выясните, собираются ли необходимые данные. В частности, проверьте, можно ли объединить разные нужные вам наборы данных.

Чем больше проектов машинного обучения вы уже реализовали, тем точнее вы сможете найти нужные вопросы. Развивайте свой предыдущий опыт:

Каковы общие подводные камни в подобных проектах?
Какие наборы данных наиболее важны, а какие необязательны?
Какого разумного уровня улучшения можно ожидать в этой ситуации?

Если вы еще не реализовали подобный вариант использования, поговорите с командой, которая уже реализовала.

6. Расставьте приоритеты

Заблаговременно отбрасывайте идеи, если они не помогают в достижении самых важных приоритетов компании. Перефокусируйте обсуждение: «Это скорее приятное занятие, так что пока оставим это».

Задайте критические вопросы: «Если бы нам удалось автоматизировать и повысить точность или скорость этого процесса на 20%, что бы это значило для годового дохода?»

Чтобы сравнить оставшиеся случаи, составьте лист Excel со следующими столбцами:

Доступность данных. Насколько легко получить доступ к нужным данным для этого приложения? Если у вас еще нет данных, дайте ему очень низкую оценку.

Возможная выгода. Если все пойдет хорошо, насколько велико потенциальное влияние на критически важный бизнес-приоритет?

Риск. Есть ли много неизвестных факторов, которые могут сорвать проект? Что вам говорит ваш опыт?

Пора внедрять. Ставьте в приоритет быстрые победы. Имея за плечами один солидный успех, вы можете переходить к более сложным проектам.

7. Исследования

Определив 1–3 наиболее часто встречающихся случая, выполните широкий поиск в Google:

Кто раньше внедрял подобные системы?
Какие подходы они пробовали? На какие они остановились и почему?
Каковы были выводы и окончательные результаты?

В машинном обучении вы можете объединить часть этой информации из опубликованных академических исследований. Однако не копируйте их подход. Скорее всего, это было хорошо для их конкретного набора данных. Вдохновляйтесь и крадите лучшие идеи. Используйте их, чтобы направлять свои дальнейшие расследования.

Еще один хороший источник - Kaggle соревнования. Если вы найдете конкурентов для аналогичного варианта использования, посмотрите ядра и обсуждения на форуме. Они дадут очень конкретную информацию о том, как реализовать и настроить алгоритм, и в большинстве случаев вы даже можете найти полный пример кода.

8. Примите решение

Обновите свой рейтинг вариантов использования, добавив дополнительную информацию, которую вы узнали. Затем, основываясь на своих исследованиях и опыте, составьте примерный план проекта для каждой идеи.

Вместе с таблицей приоритетов и планами проекта представьте свои выводы своей команде.

Если вы сделали это, всегда помня о более крупных целях, вашей команде будет легко выбрать лучший проект.

Пора запачкать руки и приступить к работе.

Развлекайся!

Хотите узнать больше? Мы, Data Revenue, команда инженеров по машинному обучению из Берлина, Германия. Мы создаем индивидуальные системы машинного обучения для некоторых крупнейших компаний, занимающихся Интернетом, телевидением и биоинформатикой.

Спросите меня о чем угодно: m.schmitt [at] datarevenue.de

Как мы находим сценарии использования машинного обучения