Бабушка, какие у тебя большие глаза!

Моей бабушке 84 года. Она родилась в 1935 году и пережила, возможно, самые интересные изменения в нашей человеческой цивилизации. В некотором смысле люди ее поколения — путешественники во времени.

Бабушка — умная женщина, но я сильно сомневаюсь, что она знает, что такое машинное обучение, и в этой статье я попытаюсь объяснить это так, чтобы кто-то из ее поколения и опыта мог понять это и понять, почему это цель и область изучения. в нашем современном мире.

Моя бабушка любит читать и, вероятно, по крайней мере читала об искусственном интеллекте в новостях или в научно-фантастическом романе. Мое собственное понимание ИИ исходит из такого: концепция компьютерных существ умнее нас или, по крайней мере, так же умна. Может быть, машины, которые могут чувствовать или эмулировать эмоции. Возможно, Терминатор. Но машинное обучение перешло из фантастики в реальность еще при моей жизни.

Термин машинное обучение был придуман в 1959 году Артуром Сэмюэлем, американским пионером в области компьютерных игр и искусственного интеллекта. (Машинное обучение) Вопрос был и остается: «Могут ли машины думать?» Сначала мы должны договориться о том, что мы подразумеваем под мышлением. Компьютеры все время «принимают решения», но мышление — и обучение — отличаются друг от друга. Если мы скажем компьютерной программе, как складывать числа, она сможет сложить их за нас. Но может ли компьютер учиться на информации, которую мы ему даем, чтобы он мог принимать новые решения или «думать» об информации и выдвигать новые идеи? Это часть концепции машинного обучения.

Г-н Сэмюэл развил свои идеи в программной игре в шашки. Когда люди играют в такую ​​игру, мы делаем выбор в отношении своих ходов, основываясь на предположениях о выборе нашего противника и состоянии доски. Программа Сэмюэля эмулировала это с помощью дерева решений, присваивая ценность ходам в зависимости от того, как они покинули состояние доски. Но люди не всегда делают лучший или самый предсказуемый выбор, и это не так просто запрограммировать в игре.

На изображении выше показаны 4 хода шашек и значение их преимущества. Вы или я можем этого не осознавать, но мы делаем то же самое, когда играем в игру. Мы думаем о возможных ходах и положении, в которое они нас поставят в дальнейшем. Но каким бы впечатляющим ни был компьютер, выигравший игру в шашки, это «механическое» заучивание — в нем нет ничего «творческого» или «интеллектуального».

Обучение с подкреплением — это еще один способ «обучить» концепции программам. Это очень похоже на обучение языку, например, с помощью программы обучения языку Rosetta Stone. Если бы вы были машиной, и я хотел бы укрепить вашу способность принимать решения, я мог бы показать вам изображение яблока и сказать, что это яблоко. Поначалу у вас может быть недостаточно информации на одной картинке, чтобы всегда отличить яблоко от других изображений, но если бы я дал вам больше изображений, контекста и информации, вы могли бы довольно хорошо в этом разобраться.

Компьютерная программа не совершает скачков веры, как вы или я. Она по-прежнему оценивает сделанные ею «догадки» и полагается на проценты и вероятность, которые мы в нее запрограммировали. В конце концов, программа может узнать, что когда мы показываем ей картинку выше, это яблоко. Если мы дадим программе больше изображений яблок, а также изображений предметов, не являющихся яблоками, мы сможем «научить» ее различать. (Могут ли машины думать?)

Программа Rosetta Stone делает это и для вас, когда вы используете ее для изучения языка. Сначала он мог полагаться только на одну узнаваемую картинку яблока. В конце концов, он переключается на контролируемые методы обучения и предлагает яблоко другого сорта. Вы можете сделать вывод, что это все еще яблоко. Компьютерные программы могут обучаться таким же образом.

Алгоритмы, обычно используемые в машинном обучении, часто группируются по стилю обучения. (Экскурсия по алгоритмам машинного обучения) Мы говорили об обучении с учителем, но совсем недавно обучение без учителя с успехом использовалось на очень больших наборах данных. В общих чертах, программам предоставляется много четкой информации без особого руководства. Ранние решения, которые программа принимает, например, как сортировать эти данные, определяют ее будущие действия. Но обычно для хороших результатов требуется некоторая комбинация супервизии или частичной супервизии.

Еще одним захватывающим примером машинного обучения являются нейронные сети, или нейронные сети. Это старая идея, которая недавно снова набрала обороты. Эта концепция примерно смоделирована по образцу человеческого мозга и опирается на уровни принятия решений. Нейронная сеть может состоять из тысяч или даже миллионов узлов обработки, соединенных между собой. Чаще всего они представляют собой так называемую упреждающую связь, означающую, что данные проходят через них только в одном направлении. Сложные уровни принятия решений позволяют принимать более качественные и быстрые решения. Наряду с обратным распространением, методом, с помощью которого эти системы исправляют ошибки, нейронные сети могут стать мощными и надежными. Вы можете поиграть с одним прямо здесь. Поскольку эта область обучения и роста сейчас очень популярна, существует множество ресурсов, предназначенных для того, чтобы помочь непрофессионалам понять ее. (и, надеюсь, принять это?) Примеры нейронных сетей можно использовать для создания произведений искусства, музыки и даже письменных работ, часто с юмористическими и интересными результатами.

В наш информационный век у нас есть как мощные компьютеры, так и *много* данных для них. Области искусственного интеллекта, машинного обучения и интеллектуального анализа данных исследуют возможности, которые предлагают: решение проблем, принятие решений и «осмысление» огромного количества информации, которую мы можем собрать. Если это звучит пугающе, так и должно быть: информационная предвзятость — настоящая проблема, как и для людей. А сбор данных — скажем, о ваших покупательских тенденциях — всегда актуальная тема.

Если вы когда-нибудь позже видели рекламу чего-то, что вы искали в Google, или если у вас есть смартфон, который предложил вам маршрут, потому что вы обычно едете на работу в определенное время, это машинное обучение. Но он используется не только для рекламы и удобства.

Машинное обучение все больше играет роль в области медицины. (Восхождение машинного обучения в медицине. Nat. Mater. 18,407 (2019). https://doi.org/10.1038/s41563-019-0360-1 ) Алгоритмы могут обнаруживать аномалии в медицинских изображениях и наборах диагностических данных, а также в разработке лекарств.

Другое распространенное использование машинного обучения более неоднозначно с этической точки зрения. Распознавание изображений — мало чем отличающееся от предыдущего примера с яблоком — используется для всего: от пометки друзей на фотографиях в Facebook до правоохранительных органов и наблюдения. Распознавание голоса также разрабатывалось и использовалось годами. И это уже не «высокотехнологичные» концепты из шпионских фильмов. Вы получаете распознавание голоса при использовании Siri, Alexa или других персональных помощников. Сознательно или неосознанно вы участвуете в развитии этих областей, когда участвуете в забавных приложениях для социальных сетей или викторинах.

Несомненно, эти области развиваются быстрее, чем мы успеваем за ними, особенно когда речь идет об этике. У нас не всегда были законы, контролирующие использование данных, а теперь их можно использовать невообразимыми ранее способами. Этических опасений предостаточно. (Этика искусственного интеллекта) Ярким примером являются беспилотные автомобили: должен ли автомобиль щадить водителя или пешехода? Кто принимает это решение? То, как мировые правительства используют машинное обучение, вызывает серьезную озабоченность, даже если вы обычно не делитесь своими личными данными в Интернете. По мере того, как мы расширяем эти области исследований, и особенно по мере того, как мы сосредотачиваемся на встраивании в машины все более и более человеческого интеллекта, мы не должны пренебрегать тем, что на самом деле делает нас людьми. Спасибо за чтение!

Последнее примечание

Потому что моя бабушка любит научную фантастику: выделите сегодня 40 минут, чтобы послушать рассказ Кори Доктороу Войны автомобилей. Он находится в свободном доступе в формате mp3 (прочитано автором) здесь. История исследует некоторые проблемы, связанные с машинным обучением, и то, как его можно использовать, чтобы улучшить нашу жизнь. А если хотите еще (надеюсь, что захотите), рекомендую Radicalized, тоже Doctorow. Хотя этот сборник новелл не столько о машинном обучении, сколько о человеческих свободах, я думаю, вы обнаружите, как и я, что эти две вещи все более взаимосвязаны. Если вы хотите услышать мнение автора об искусственном интеллекте и машинном обучении в реальном мире, ознакомьтесь с Наши неофобные, консервативные повелители искусственного интеллекта хотят, чтобы все оставалось по-прежнему.

В конечном счете, машинное обучение заключается в поиске вещей, похожих на вещи, которые система машинного обучения уже может моделировать. Системы машинного обучения хорошо распознают автомобили, похожие на автомобили, о которых они уже знают. Они также хорошо распознают лица, похожие на лица, о которых они знают, поэтому белые и мужские лица распознаются этими системами более надежно — системы обучаются людьми, которые их создали, и людьми в их среде. круги.

Вот что делает машинное обучение таким токсичным. Если вы попросите систему ОД предсказать, кого должна арестовать полиция, она предложит пойти и арестовать людей, похожих на тех, кого она арестовывала все это время. Как выразился Патрик Болл из Группы анализа данных по правам человека: «Прогнозирующая полицейская система не предсказывает преступность, она предсказывает работу полиции». — Кори Доктороу