Мы живем в мире неопределенности и несовершенной информации

В свободное время я часто люблю играть в шахматы и в сапер (да, не смейтесь).

Из этих двух игр мне всегда было труднее понять сапера, а правила игры всегда казались очень непонятными.

Однако последняя игра больше похожа на то, как ситуации часто разворачиваются в реальном мире. Вот почему это актуально для науки о данных.

Идеальная и несовершенная информация

Сравните это с шахматами, где, несмотря на свои игровые способности, все игроки всегда имеют точную информацию.

Всегда можно увидеть каждую фигуру на доске, и ни один из оппонентов не обладает каким-либо информационным преимуществом над другим (ожидайте потенциальных знаний, полученных из опыта игры).

По этой причине ИИ широко используется для обучения компьютеров выигрышу в шахматы. Это оказалось успешным еще в 1997 году, когда суперкомпьютер IBM был обучен победить гроссмейстера Гарри Каспарова.

Из этого примера легко экстраполировать, что модели искусственного интеллекта можно обучить потенциально решать любую заданную проблему, которая ставится перед нами в этом мире. Однако это не так - поскольку человек всегда работает в мире с несовершенной информацией.

Когда кто-то думает об игре в сапера, нас всегда окружает несовершенная информация. В определенных квадратах по всей доске есть несколько мин. Нажатие на мину означает, что игрок автоматически проигрывает игру. При запуске игры невозможно узнать, какие клетки подозрительны, а какие нет. Надо просто щелкнуть мышью по заданному квадрату и надеяться на лучшее.

Если предположить, что игрок продолжит игру, определенные квадраты укажут, где может быть мина. Например, квадрат с номером 1 будет указывать на наличие квадрата с миной вокруг набора квадратов вокруг исходного. Однако невозможно узнать, какой это квадрат.

В этом отношении тральщик - это игра, которая в большей степени отражает реальные сценарии по сравнению с такой игрой, как шахматы.

Независимо от того, сколько данных собрано, никто никогда не сможет собрать 100% данных, которые объясняют вариации в переменной результата.

Даже если бы это было возможно, параметры, объясняющие такое изменение, в будущем неизменно изменились бы. В этом отношении модель, которая хорошо работала вчера, может не сработать и завтра.

Итак, когда мы сталкиваемся с несовершенной информацией, каждое решение сводится к вероятности. Мы не можем точно знать, что произойдет при принятии решения о конкретном исходе, но мы можем присвоить этому вероятность.

Например, квадраты, окружающие цифру 1, менее опасны, чем квадраты, окружающие цифру 3 - теперь есть три мины, окружающие последний квадрат. Вероятно, лучше не нажимать на эти квадраты!

Обучение с подкреплением

Интересно, что в прошлом обучение с подкреплением использовалось для обучения искусственного интеллекта. победить у тральщика. Пример от sdlee94 доступен здесь.

Хотя я не слишком хорошо знаком со спецификой работы алгоритма, автор отмечает, что любой ход, который классифицируется как предположение, получает отрицательное вознаграждение, поскольку цель состоит в том, чтобы научить компьютер обнаруживать безопасные квадраты с помощью логики и вероятность.

Тем не менее, согласно результатам, нейронной сети по-прежнему потребовалось более 60000 игр для обучения, чтобы достичь коэффициента выигрыша более 10%.

Когда присутствует неопределенность, кажется, что даже глубокие нейронные сети ограничены в своей способности делать правильные прогнозы. Даже если отрицательный исход (в данном случае приземление на квадрат) имеет низкую вероятность возникновения - он все равно произойдет, если будет достаточно испытаний.

Важность вероятности

В связи с этим я подозреваю, что наука о данных будет постепенно развиваться, чтобы меньше полагаться на точность и больше на вероятности.

Например, классический метод обучения модели включает разделение «поезд-тест», при котором модель сначала обучается и проверяется с использованием обучающих данных, а затем измеряется точность по набору тестов.

Однако высокие результаты проверки и тестирования указывают только на то, что модель демонстрирует высокую точность прогнозов для этих двух наборов данных. Даже если используется перекрестная проверка, модель все еще ограничена в возможности указать, насколько хорошо она будет работать с новой информацией.

Анализ моделирования

По этой причине я предполагаю, что больше внимания будет уделяться имитационному анализу. Например, предположим, что кто-то пытается спрогнозировать доходы компании с течением времени. Рассматриваемый временной ряд имеет установленное среднее значение и стандартное отклонение.

Как насчет того, чтобы произвести 10 000 симуляций этого временного ряда, искусственно увеличивая стандартное отклонение? Насколько точной будет предыдущая модель в этом сценарии?

С этой точки зрения можно было бы гораздо лучше понять ситуации, в которых можно ожидать, что модель будет работать хорошо, и ситуации, в которых этого не произойдет.

Фактически, можно развить эту идею и обучить несколько моделей на смоделированных данных с разными параметрами. В зависимости от потенциальных сценариев, с которыми может столкнуться бизнес, различные модели могут быть настроены на основе вероятности для составления прогнозов в разных средах.

В самом деле, это сама основа байесовского анализа, и я подозреваю, что популярность этой области будет расти в будущем.

Вывод

Несмотря на доступ к большему количеству данных, чем когда-либо прежде, важно помнить, что реальный мир неопределен, изменчив и несовершенен.

Столкнувшись с несовершенной информацией, единственное, что мы можем сделать, - это использовать ту небольшую информацию, которая у нас есть, для определения вероятностей различных результатов.

Это верно не только в игре «Сапер», но и практически во всех сложных сценариях реального мира, с которыми мы сталкиваемся.