Мысли о пересечении сомнений и машинного обучения

Творчество расплывчато и шатко, почему нет инструментов для творчества?

Креативщики постоянно ищут новые источники вдохновения и инструменты, чтобы раздвинуть границы того, что можно сделать с их цифровыми инструментами. Функции машинного обучения могут способствовать расширению границ, используя роль сомнения и неуверенности в творческом процессе.

Машинное обучение использует нечеткую логику, которая похожа на человеческую логику, и включает в себя оценки достоверности, числа, которые определяют степень уверенности машины в своих результатах на основе их вероятности. В то время как высокий показатель достоверности важен во многих обстоятельствах - вы бы не выпустили функцию автоматической транскрипции, которая неправильно интерпретирует 50 процентов слов, - когда дело доходит до творческого процесса, концепция того, что является правильным и неправильным субъективно.

Ограничения, экспериментирование и мышление в потоке сознания - все это ценные части творческого процесса. Это может быть необъяснимая слабая связь, культурная значимость или какой-то неясный сбой функции машинного обучения, которая вдохновляет пользователя. Нам не нужно стремиться к недостижимой безупречной точности, прежде чем внедрять функции машинного обучения в повседневные творческие инструменты.

В конце концов, нейронные сети были вдохновлены нейронными связями в человеческом мозгу, впервые задуманными в отчете Алана Тьюринга 1948 года о концепции, которую он назвал Неорганизованная машина.

Ниже представлены изображения, созданные DeepMind's BigGAN. Первое изображение - это нейтральное состояние алгоритма без присвоения какой-либо категории, а каждому последующему изображению присваивается повышенное понимание золотой рыбки (0,0–1,0). Изображение посередине поэтически представлено в виде светящегося подводного пузыря. Мы не знаем, почему это так, но результаты обнадеживают.

Что, если бы творческие инструменты опирались на нечеткую и часто необъяснимую природу нашего творчества и намерений?

Как бы это было, если бы творческие инструменты были больше похожи на наш мозг и учитывали наши сомнения, эмоции и подвижность?

Ошибки и неудачи как вдохновение

Использование ограничений для создания искусства, ориентированного на процесс, имеет долгую историю до компьютеров (например, Джексон Поллок и Джон Кейдж). С момента изобретения компьютеров и телевизоров возникли целые жанры, такие как глитч-арт и пиксель-арт, превратившие технологические ограничения в эстетические игровые площадки.

В «Магнитном ТВ» (1965) художник Нам Джун Пайк использовал магнитную интерференцию, чтобы создать абстрактную пиксельную скульптуру внутри телевизора, изменив его прием. Художники-вычислители были вдохновлены ошибками компьютерных программ и десятилетиями занимались ими. Как и Пайк, они делают это, наблюдая за технологией с ее ограничениями, часто оторванными от ее предполагаемого назначения - они играют с вычислениями как с непосредственной средой.

В живом представлении дискретных фигур (2018) Rhizomatiks Research и танцевальной компании ELEVENPLAY художник Кайл Макдональд использовал seq2seq-модель с данными танцевальной позы для обучения генеративного танцора, но предпочел сократить обучение и сохранить генерируемый танец глючным и глючным. жутко ». В мощный момент в середине выступления танцор-человек начинает имитировать полуученного танцора, представленного в танцевальном дуэте AR. Художники описывают проект как поиск новой палитры движений для развития неизведанных способов выразительного танца, выходящих за пределы традиционной человеческой субъективности и эмоционального выражения. Опираясь на плохо обученную модель, они сделали это довольно успешно.

По мере демократизации творческого машинного обучения пользователи могут исследовать алгоритмы и анализировать их непрозрачность и неточность, взаимодействуя с алгоритмом на более глубоком уровне и открывая новые каналы для экспериментов и творчества.

Сомнения и пользовательский опыт

Итак, как же превратить сомнения в машинном обучении в творческие инструменты?

Сегодня пользователи часто приходят к своим компьютерам с неуверенностью, и пользовательский опыт эволюционировал, чтобы приспособиться к этому. Мы используем Google «Мне повезет», чтобы узнать о чем-то, что мы, возможно, никогда не искали, генераторы случайных имен, которые помогают нам придумывать уникальные имена пользователей, и более разумные генераторы сопоставления шрифтов или цветовой палитры, чтобы быстро изучить варианты дизайна. Нет уверенности, но поскольку мы ожидаем потенциально неожиданного или случайного результата, опыт приятен и полезен.

Мы можем создавать креативные функции машинного обучения, устанавливая правильные ожидания и создавая надежные инструменты, которые выражают сомнения и ценят исследования и развлечения.

Мы должны учитывать, как интерфейс влияет на ожидания пользователей и направляет действия. Например, размер панели поиска влияет на тип вводимых условий поиска, фиксированный размер и прямоугольная форма оконных рамок могут указывать на то, что инструмент является статическим и содержащимся в нем программным обеспечением, а стандартная кнопка «подтвердить» на изученная контекстно-зависимая функция может заставить пользователей ожидать надежного персонализированного результата.

Вместо того, чтобы ожидать, что и инструмент, и пользователь будут уверены в своих способностях и намерениях, прежде чем предпринять действия, что, если мы выразим сомнения через язык и эстетику интерфейса, чтобы создать обогащающую и взаимную творческую среду?

  1. Выразите сомнение языком

Представьте себе функцию, которая генерирует семантические кисти на основе того, что изображено на фотографии. Эта функция использует семантическое понимание изображения, чтобы увидеть, что оно включает осенние деревья, и предлагает фотореалистичную кисть с деревом для рисования. Кисть может иметь ползунок уточнения, который позволяет пользователю перемещаться между несвязанными кистями (например, небоскребы и реактивные самолеты) и совершенно связанными кистями (например, больше осенних деревьев). Эта функция будет использовать показатель достоверности 0–100 процентов, чтобы указать на уверенность в том, что предлагаемый результат связан с существующим изображением, но использование технического термина «уверенность» предполагает, что пользователю нужны реалистичные предложения. Использование более открытых, нейтральных формулировок, таких как «связанные» и «несвязанные» или даже визуальное представление рекомендаций, расширяет пространство для исследования.

Помимо получения неуверенности от машины, мы могли бы также рассмотреть, как пользователи могут сообщить о своих сомнениях машине. Предоставление пользователям возможности выражать свои сомнения в творческом процессе в целом может сделать инструмент более доступным. Представьте себе, если бы пользователь мог запрограммировать инструмент, чтобы понять, что когда он говорит «бех», это означает, что он не уверен в текущих результатах, побуждая машину делать более широкие или более неожиданные предложения. Они также могут определять, насколько точными должны быть результаты для конкретной цели.

Более взаимным и коммуникативным отношениям можно способствовать, используя машинное обучение и сомнения пользователей.

2. Выразите сомнение через интерфейс

Инструменты Kai's Power Tools 1992 года имели нетрадиционный вид и названия (Explorer, Goo, Photo Soap, Power Show), которые переносили пользователей в сюрреалистический мир редактирования изображений. Он предоставил экспериментальное и игровое пространство, где ваш ум может быть беспорядочным, а ваше цифровое творческое рабочее пространство усеяно цветами и текстурами.

Стиль пользовательского интерфейса помогает пользователям создать мысленную модель инструмента и понять его назначение. Наши ментальные модели эволюционировали по мере развития стилей интерфейса на протяжении многих лет, от скевоморфных кнопок и теней до современного плоского, геометрического и гипер-продуктивного пользовательского интерфейса. Не то чтобы пришло время вернуть скевоморфные интерфейсы, но визуальная эстетика интерфейса должна быть тщательно рассмотрена, когда дело доходит до встраивания интеллектуальной функциональности в творческие инструменты.

Представьте себе шатающуюся кнопку, указывающую на неопределенность, или окно не прямоугольной формы. Что, если бы пользователи могли указывать формы своих инструментов так же, как они могут выбирать темный режим и разные цветовые схемы?

Что, если бы пользователи не были уверены в своих намерениях на этапе исследования проекта, вместо подтверждения или отмены действия? Вместо того, чтобы использовать обходные пути, такие как ручная вставка вариантов, выполнение циклов отмены-повтора или сохранение каждой итерации по отдельности, с самого начала можно было бы разработать интеллектуальный творческий инструмент, охватывающий как машинную, так и пользовательскую неопределенность, расширяя границы цифрового творческого инструмента.

3. Выражать сомнение по умолчанию

Пионер искусственного интеллекта Стюарт Рассел работает над переопределением того, что он называет ИИ, совместимый с людьми, или ИИ, который охватывает человеческую неопределенность. Он работает специально с роботами, но его идеи воплощаются в творческих алгоритмах машинного обучения.

Его совместимый с людьми ИИ следует трем правилам:

1. Задача робота - максимально реализовать человеческие ценности.
2. Робот не знает, что это за ценности.
3. Человеческое поведение дает информацию о человеческих ценностях.

Рассел предполагает, что ИИ, совместимый с человеком, должен быть неопределенным, потому что люди не уверены. Его ценности определяются тем, что человек и машина стремятся лучше понять друг друга. Представьте себе творческий инструмент, делающий то же самое.

Недавний всплеск творческого машинного обучения дает разработчикам инструментов множество возможностей для исследований и инноваций. Признавая инструмент как продолжение пользователя, «неорганизованная машина» является провоцирующим спутником нечеткого, интуитивного мышления, которое является естественной частью творческого процесса. По мере развития интеллектуальных творческих инструментов их дизайнерам следует склоняться к неопределенности, а не уклоняться от нее.

Спасибо Лизе Джамхури, Патрику Хеброну, Арчи Бэгналлу.

Machine Intelligence Design - команда Adobe Design, продвигающая ориентированный на пользователя подход к машинному обучению и искусственному интеллекту в творческих инструментах, одновременно работая над глубоким пониманием того, как эти технологии меняют способы нашего взаимодействия и творчества.

Мы набираем!