Чему Facebook может научиться у новозеландских грязевых улиток

Я соврал в своем предыдущем посте — точнее, упростил. Вам действительно не нужен творческий подход, чтобы сломать модель машинного обучения. На самом деле любая адаптивная система способна сломать модель своего поведения. Я проиллюстрирую это на примере рака, который избегает лечения.

Я также ранее говорил, что творческое поведение, разрушающее модель, скорее всего, связано с определенным набором стимулов. Тоже немного лжи. В случае адаптивных систем быстрые эволюционные изменения, скорее всего, происходят при определенных сочетаниях селективного давления, таких как отношения паразит-хозяин. Новозеландские грязевые улитки демонстрируют этот принцип, эволюционируя быстрее, когда присутствуют паразиты.

Урок для заинтересованных сторон машинного обучения: когда выходные данные модели оказывают избирательное давление на адаптивную систему, успех модели будет недолгим. Чтобы не отставать, владельцам моделей придется менять модель — и менять ее снова и снова.

Врачи преследуют эволюцию рака

Начну с рака. Рак отличается от большинства других болезней, таких как диабет или сердечная недостаточность. Рак может развиваться, чтобы избежать лечения.

Пример может пояснить. При хроническом миелоидном лейкозе (ХМЛ) у пациентов развивается генетическая мутация, называемая филадельфийской мутацией. Исследователи искали лекарство, которое ингибировало бы белок в мутации Philadelphia, и нашли иматиниб, позже получивший название Gleevec в США и Glivec на международном уровне [1]. Этот препарат был настолько эффективен в блокировании распространения филадельфийской мутации, что онколог Брайан Друкер сказал: «Эти когда-то умирающие пациенты вставали с постели, танцевали, ходили в походы, занимались йогой. Препарат был потрясающим» [2].

К сожалению, с течением времени у некоторых пациентов с мутацией Philadelphia могут развиться различные вторичные мутации, в которых отсутствует щель, в которой связывается гливек, но которые все же стимулируют раковый рост [3]. Таким образом, рак рецидивирует.

Гливек был открыт традиционным путем, но даже если бы он был открыт с помощью машинного обучения [4], рак может развиться, чтобы избежать его воздействия. До Гливека пациенты почти всегда умирали до того, как могли произойти вторичные мутации, поэтому не было данных об этих вторичных мутациях для обучения модели машинного обучения. Использование гливека создало давление отбора, которое сделало вторичные мутации более распространенными. Раковые клетки, у которых была вторичная мутация, могли размножаться, в то время как те, у которых была только мутация Philadelphia, подавлялись гливеком.

Но онкологи не сдаются. Вместо этого они готовы изменить лечение, чтобы не отставать. Подход, описанный Сиддхартхой Мукерджи, заключается в «переходе на другой препарат при рецидиве опухоли и повторном переключении при повторном рецидиве опухоли…». Это может показаться неудачей, поскольку врачи не излечили рак навсегда. Но подход эффективен: «Игра в кошки-мышки с раком увеличила выживаемость больных миеломой — в некоторых случаях поразительно» [3].

Каково значение методов машинного обучения для открытия лекарств? Когда вы обнаружите лекарства для лечения диабета или сердечной недостаточности, вы можете рассчитывать на стабильный успех. Но если вы обнаружите лекарство для лечения рака, будьте готовы открыть следующее лекарство и еще одно. Будьте готовы продолжать переобучение алгоритма, чтобы люди оставались здоровыми.

В более общем плане заинтересованные стороны, заинтересованные в машинном обучении, должны задать себе вопрос: могут ли результаты этой модели оказывать избирательное давление на область, которую она моделирует? Например, видите ли вы какой-либо риск случайного селективного давления в моделях для выявления сельскохозяйственных вредителей [5]? Я бы сказал, что если бы модели использовались для определения применения пестицидов, то вредители в конечном итоге эволюционировали бы в ответ. Например, если модель идентифицирует тлю частично по ее цвету, а пестициды используются только на полях, где модель идентифицирует тлю, то будет размножаться мутантная тля с другим цветом. В конце концов, модель идентификации вредителей станет бесполезной — по крайней мере, до тех пор, пока новую модель не удастся обучить с данными о мутантах.

Конечно, не все модели адаптивных систем нужно будет изменить. В конце концов, только потому, что адаптивная система может меняться, не означает, что она будет меняться. Чтобы понять условия, которые делают изменения вероятными, позвольте мне привести другой пример.

Коэволюционные очаги ускоряют эволюцию

Коэволюционные отношения могут научить нас естественным побуждениям к изменениям. В частности, место, где два вида осуществляют взаимный отбор друг друга, называется «горячей точкой коэволюции», и это приводит к быстрой эволюции обоих видов [6]. Например, паразит может подстегнуть хозяина к более быстрой эволюции, что, в свою очередь, заставит паразита развиваться быстрее.

Поучительным примером является новозеландская грязевая улитка (Potamopyrgus antipodarum), поскольку она имеет две формы размножения. Эта улитка обычно размножается бесполым путем, что приводит к медленной эволюции, потому что каждое потомство такое же, как и его родитель — никаких генетических изменений. Однако при наличии паразитической двуустки у мелководных берегов водоемов Новой Зеландии улитка переходит на половое размножение. Почему? Половое размножение производит новые комбинации генов в каждом поколении, что приводит к быстрой эволюции, потенциально помогая иммунной системе улитки перехитрить трематод [7]. Всякий раз, когда популяция улиток вырабатывает более сильный иммунитет, они (случайно) создают давление отбора на паразитических сосальщиков, чтобы они развивали лучшую атаку. И когда паразиты действительно развивают лучшую атаку, они (случайно) создают давление отбора на улиток, чтобы улучшить их иммунную защиту.

Новозеландская грязевая улитка, находящаяся в горячей точке коэволюции, должна быстро эволюционировать с половым размножением. Во всех других местах он может развиваться медленнее при бесполом размножении (также известном как клонирование).

Какой урок для владельцев моделей? То, что ваша модель была стабильной какое-то время, не означает, что она может оставаться стабильной вечно. Если появится коэволюционная горячая точка, вам нужно будет изменить свою модель.

Например, рассмотрим изменение контекста Facebook с течением времени. Алгоритм новостной ленты Facebook решает, какие сообщения видит пользователь, и алгоритм мог оставаться стабильным, когда Facebook был сайтом для обмена фотографиями студентов колледжей. Но когда паразиты начали распространять фейковые новости и дезинформацию, Facebook пришлось переключиться на режим быстро развивающейся новозеландской грязевой улитки — или исследователя рака, который продолжает бороться с каждым новым мутантом.

Креативность и адаптивность

Итак, если я не лгу — и не упрощаю — каков общий вывод? Любая область с вариациями и успехом, отличающимся от использования модели, может привести к ее разрушению. В случае с людьми вариации могут быть преднамеренными творческими изменениями и, скорее всего, будут стимулироваться большими стимулами. В случае биологических организмов вариации в результате мутаций могут распространяться под давлением случайного отбора со стороны модели. В обоих случаях владельцы моделей должны быть готовы быстро изменить свою модель, чтобы не отставать.

Отступая назад и размышляя, я испытываю благоговение. Мы, люди, — продукт удивительной способности эволюции создавать сложные, адаптивные, новые формы. Если эволюция может породить строителей моделей, то почему бы ей не породить и разрушителей моделей?

Библиография

[1] Как Гливек изменил лечение лейкемии — Национальный институт рака, 2 февраля 2015 г. https://www.cancer.gov/research/progress/discovery/gleevec (по состоянию на 3 октября 2021 г.).

[2] К. Дрейфус, Исследователь, стоящий за препаратом Гливек, The New York Times, 2 ноября 2009 г. По состоянию на 3 октября 2021 г. [Онлайн]. Доступно: https://www.nytimes.com/2009/11/03/science/03conv.html

[3] С. Мукерджи, Император всех болезней. Лондон, Англия: Fourth Estate, 2011. По состоянию на 3 октября 2021 г. [Онлайн]. Доступно: https://www.simonandschuster.com/books/The-Emperor-of-All-Maladies/Siddhartha-Mukherjee/9781439170915

[4] Дж. Ваматеван et al., «Применения машинного обучения в поиске и разработке лекарств», Nat. Rev. Drug Discov., vol. 18, нет. 6, стр. 463–477, июнь 2019 г., doi: 10.1038/s41573–019–0024–5.

[5] Дж. Лю и К. Ван, «Обнаружение болезней и вредителей растений на основе глубокого обучения: обзор», Plant Methods, vol. 17 февраля 2021 г., doi: 10.1186/s13007–021–00722–9.

[6] Т. П. Крейг, «Географическая мозаика коэволюции», в Энциклопедии эволюционной биологии, Р. М. Климан, изд. Оксфорд: Academic Press, 2016, стр. 201–207. doi: 10.1016/B978–0–12–800049–6.00194–3.

[7] К. К. Кинг, Л. Ф. Делф, Дж. Джокела и К. М. Лайвли, «Географическая мозаика пола и Красная королева», Curr. биол. CB, том. 19, нет. 17, стр. 1438–1441, сентябрь 2009 г., doi: 10.1016/j.cub.2009.06.062.