Все понимают, что данные — это новая нефть в цифровой экономике, но не все понимают, что существует критическая разница между данными в виде записей — данными в базах данных — и данными в виде сигналов — данными из файлов журналов, датчиков, сообщений в социальных сетях и как. Позволь мне объяснить.

Данные в виде записей представляют собой проверенные факты, отражающие сущность регистрируемой ими деятельности, будь то в форме таблиц, текста, графиков или изображений. Они являются основой систем записи, на которых зиждется целостность цифровой экономики и цифрового общества. Такие данные подают программные решения, которые являются детерминированными, то есть они следуют явному и прозрачному дереву решений, ведущему к единственно правильному ответу.

Данные как сигналы, наоборот, представляют собой неподтвержденные факты, свидетельствующие о выполнении действия, которое они регистрируют, будь то телефонный звонок, твит, показания температуры или переход на веб-сайт. Они лежат в основе систем взаимодействия, а также Интернета вещей, на которых основывается производительность цифровой экономики и цифрового общества. Такие данные используются для принятия алгоритмических решений, которые являются вероятностными, т. е. основанными на интенсивности сигнала в качестве косвенного показателя текущей вероятности данной ситуации или будущей вероятности успеха данного ответа.

Любой, кто научился программировать, знаком с данными как с записями, но если вы не прошли курсы по созданию алгоритмов машинного обучения, вы, вероятно, не знакомы с данными как с сигналами. Я тоже не специалист по данным, но я узнал об этих системах из книг по биологии и сложным системам (последний раз Мелани Митчелл Complexity: A Guided Tour, ). Оказывается, иммунная система, например, представляет собой основанный на сигналах алгоритм машинного обучения для обнаружения антигенов и борьбы с ними. Колонии муравьев работают как основанные на сигналах алгоритмы машинного обучения для поиска пищи и распределения задач. И сам наш метаболизм — это основанная на сигналах система машинного обучения для создания правильных белков в нужное время, чтобы каждая из наших клеток функционировала должным образом.

Общим для всех этих систем является то, что данные собираются путем выборки, а действия инициируются концентрациями сигнала, которые превышают любой порог активации. Так, например, муравьи, которые находят пищу, выделяют феромоны на обратном пути в колонию, и эти химические вещества сигнализируют другим муравьям путь, по которому нужно следовать, чтобы получить больше еды. Чем больше муравьев, тем больше феромонов, тем сильнее становится сигнал, пока вся еда не будет собрана, и в этот момент, когда муравьев немного и сигналы слабее, следующий отряд направляется в другое место.

Цифровые маркетологи используют тот же подход к кликам на веб-сайтах, когда ищут, где разместить цифровую рекламу. Алгоритмические трейдеры используют тот же подход к высокочастотной торговле. Программное обеспечение безопасности использует тот же подход к кибератакам. Профилактическое обслуживание использует тот же подход к показаниям датчиков. Все дело в том, чтобы позволить сигналам, сосредоточенным в определенном месте и во времени, работать в качестве заменителей данного состояния, которое подразумевает заданный ответ.

Одним из ключей к таким системам является то, что они не понимают. В этом большая разница между ИИ и машинным обучением. ИИ понимает или пытается понять. Машинное обучение — нет. Он просто действует и позволяет обратной связи естественного отбора направлять свое развитие. Чем больше ударов по воротам, тем лучше работает естественный отбор, поэтому алгоритмы машинного обучения жаждут большего количества данных в качестве сигналов.

По мере развития нашей цифровой экономики можно увидеть, что ИИ и машинное обучение будут все больше и больше взаимодействовать, подобно тому, как наша сознательная кора головного мозга взаимодействует с нашим мозжечком и автономной нервной системой. То есть мы начнем предпринимать попытки ИИ понять, почему алгоритмы машинного обучения успешны, и чем больше мы сможем понять, тем лучше будет наше будущее принятие стратегических решений. Сейчас лидирует машинное обучение, по крайней мере, здесь Кремниевая долина, но можно представить себе будущее, в котором одна дисциплина по очереди тянет вперед другую.

Наконец, когда дело доходит до установления государственной политики в отношении данных или когда дело доходит до оценки экономической ценности данных, очень важно различать данные как записи и данные как сигналы. Первые ценны по отдельности и, как правило, являются собственностью, поэтому их необходимо охранять, и они гарантируют защиту закона. Напротив, данные как сигналы представляют ценность только коллективно и, как правило, не являются собственностью, поэтому требуют другого обращения. По-прежнему существует некоторый уровень риска для конфиденциальности, который необходимо учитывать, но экономическая ценность на уровне отдельного события практически отсутствует, и в результате важно не навязывать режим регулирования «данные-как-записи» на «данные-как записи». -сигнальное предприятие.

В общем, обращение к сигналам как к данным просто создает путаницу, поэтому я надеюсь, что в будущем мы сможем использовать различие между данными и сигналами, чтобы наши мысли были точными, а наша политика разумной.

Я так думаю. Что вы думаете?

___________________________________________________________________

Джеффри Мур | Зона победы | Джеффри Мур Твиттер | Джеффри Мур YouTube

Первоначально опубликовано на https://www.linkedin.com 29 января 2018 г.

Хотите еще? Посетите www.wildcat.vc и следите за нами в Twitter, LinkedIn, Facebook и Instagram.

Мнения, высказанные здесь, отражают точку зрения автора и не обязательно точку зрения Wildcat Venture Partners.