Компромисс дисперсии смещения (от машинного обучения до принятия решений)

В машинном обучении говорят, что модель сильно предвзята, если она не соответствует обучающим данным без каких-либо ценных результатов. В других случаях говорят, что модель имеет высокую дисперсию. что приводит к возможному переоснащению тренировочного набора, что делает его бесполезным для невидимых данных. Идеальная ситуация — это низкая дисперсия и смещение как с точки зрения машинного обучения (см. рисунок ниже).

В связи с этим было замечено, что уменьшение дисперсии часто вызывается увеличением систематической ошибки и наоборот. Часто ищут правильную комбинацию обоих, чтобы свести к минимуму оба (это опять же зависит от решаемой проблемы). Это также известно как проблема предвзятости или компромисса на обычном жаргоне ML.

На первый взгляд, эту концепцию можно распространить и на процесс принятия решений человеком. Например,

Высокая предвзятость = это единственный способ! (в сторону недообучения кривой)

Это как бы само собой разумеющееся. Сильно предвзятый человек из-за недостатка знаний (или, может быть, по другим причинам — черты характера, прошлый опыт и т. д.) может слепо использовать одно и то же решение для всех ситуаций. Контекст для них не имеет значения, и они не очень склонны к отклонению от привычных подходов. Преимущество этого заключается в получении слишком быстрых результатов каждый раз (определенно быстрый начальный запуск), но, как указано в предыдущем посте, некоторые ситуации требуют разных решений. Не существует универсального решения.

В идеале мы бы хотели, чтобы такой человек осознал свое невежество, был достаточно непредубежденным и без предрассудков изучил несколько новых техник. Вместо того, чтобы полностью игнорировать учебный материал, они могут коснуться основ и подумать об альтернативных подходах.

Высокая дисперсия = все по-другому! (к переоснащению кривой)

Внимательный человек очень хорошо усваивает материал от основ до всех возможных номенклатур или производных. Они относятся к каждой ситуации или концепции по-разному. Но, вероятно, делает это настолько сильно, что влияет на время выполнения. Для предприятий, где прибыль обратно пропорциональна затраченному времени, решения должны приниматься на каждом этапе, о том, какого кандидата нанять, предполагаемую цену продукта или какой дизайн следует принять. А базовые комбинации разных событий практически бесконечны, не все можно смоделировать грубым перебором.

Такие люди должны научиться выносить суждения, удалять шумные детали и придерживаться только фундаментальных основ.

Подводить итоги,

Как и в случае с моделями машинного обучения, мы часто сталкиваемся с дилеммой, какое поведение мы должны обменять на другое в конкретной ситуации. И нет определенного решения, кроме оценки частного случая. Есть несколько советов о том, как поддерживать и то, и другое, но я позволю читателям решить.

Опубликовано

Первоначально опубликовано на http://amartyac.wordpress.com 31 августа 2022 г.

Компромисс дисперсии смещения (от машинного обучения до принятия решений)

Высокая предвзятость = это единственный способ! (в сторону недообучения кривой)

Высокая дисперсия = все по-другому! (к переоснащению кривой)

Подводить итоги,

Вопросы по теме