Что я узнал до сих пор

В наши дни машинное обучение и искусственный интеллект — это больше, чем модные словечки, которые мы, менеджеры по продуктам, можем игнорировать. Наши продукты уже используют какой-то ИИ или скоро будут использовать его для использования данных и опыта, которым обладает ваш продукт.

Меня зовут Даниэль Араниас, я любопытный менеджер по продукту с большим опытом разработки ПО. В последние месяцы я пытался ответить на несколько вопросов, таких как:
Должен ли менеджер проекта знать, как работают алгоритмы ML?
Отличается ли процесс разработки продуктов на основе ML?

Ответы на эти вопросы заставили меня углубиться и понять некоторые основные концепции машинного обучения, пройдя соответствующие курсы и фактически создав несколько базовых программ машинного обучения.
Я опубликовал свое путешествие в серии чтений здесьподчеркнуть основные этапы создания программы машинного обучения. Эти чтения могли быть немного техническими.
На мой взгляд, знание деталей может помочь вам как менеджеру по продукту лучше понять, почему процесс управления продуктом может быть скорректирован при использовании инструментов машинного обучения.

НО В этом чтении я суммирую предыдущие чтения, выделяя жирным шрифтом основные модные словечки (так что в следующий раз, когда вы услышите, как кто-то говорит об машинном обучении, вы, возможно, даже поймете их..) и я попытаюсь ответить на один из вопросов, заданных в первом посте:
Нужно ли менеджеру продукта корректировать методы управления продуктом при использовании инструментов машинного обучения?

Программа прогнозирования акций Google, которую я создал, является распространенным вариантом использования алгоритма линейной регрессии, который является частью типа обучения, называемого обучение с учителем. В этом типе обучения машина смотрит на заданный набор входных и выходных данных, а затем пытается найти корреляцию между входными параметрами (также известными как Функции) и выходным параметром, который мы хотели бы предсказать. (он же Ярлык).
В нашем примере некоторые из функций были: "Скорректированная цена открытия" и "Скорректированный объем", а ярлыком была "Цена закрытия".
> После того, как машина обучена и нашла шаблон корреляции (он же классификатор/модель), она готова к получению новых наборов данных. входов, чтобы предсказать результат.

Хотя мой опыт создания продуктов на основе машинного обучения находится на начальном этапе, я могу сказать, что встраивание инструментов машинного обучения требует дополнительного внимания и небольшой корректировки данных. Это внимание является этапом предварительной обработки, который должен предшествовать этапу разработки в классическом процессе управления продуктом.

Как я показал ранее, большие данные не обязательно означают лучшее. вы должны стремиться к MVD(минимально жизнеспособным данным), чтобы подтвердить свою гипотезу.
То же самое касается MVP (минимально жизнеспособного продукта), который, как и MVD, подталкивает вас к тому, чтобы столкнуться с большими данными и принять минимальные данные, на которые, по вашему мнению, опирается ваш ярлык. Это означает, среди прочего, получение нового необработанного набора данных, манипулирование и удаление ненужных данных.

Для этого этапа предварительной обработки требуется эксперт в предметной области, который знает рынок, продукт и, конечно же, пользователей. Это может быть внешний консультант или, в идеале, вы, менеджер по продукту.

Однако на следующем этапе в основном руководит специалист по данным; это требует знания битов и байтов алгоритмов машинного обучения и понимания бесконечных параметров, влияющих на поведение модели.
Этот шаг включает в себя очистку, заполнение, масштабирование данных и, конечно же, поиск лучшего алгоритма, который получает наилучшая точность для соответствия вашим показателям/КПЭ.

Ответив на вступительный вопрос, я понял, что у меня есть много других новых вопросов, которые я собрал во время своего путешествия по изучению машинного обучения. Такие вопросы, как: Существуют ли какие-либо сторонние инструменты для упрощения или автоматизации этапа предварительной обработки?

Верны ли мои предположения на данный момент и для других типов моделей машинного обучения?
Каков наилучший размер данных для обучения выбранной нами модели?

Мое путешествие не остановилось, и я постараюсь ответить хотя бы на несколько из этих вопросов. Если у вас есть какие-либо отзывы или другие вопросы, пожалуйста, добавьте комментарий ниже или свяжитесь со мной. Обещаю уделять им должное внимание.