Управление идентификацией с помощью AI/ML: подписи, распознавание лиц, авторство

Заметки с конференции AI Meetup #9 в Бухаресте

ИИ все больше и больше проявляется в оптимизации рабочих процессов, используемых для автоматизации предоставления идентификационных данных. По мере того, как мы находим все больше и больше возможностей погрузиться в обучение:

как мы можем предоставить автоматизированные и воспроизводимые способы управления жизненным циклом идентификации;
как соблюдать правила идентификации и конфиденциальности;
откройте для себя решения Identity as a Service (IDaaS);

мы сосредоточили полное издание встречи на сенсорном базировании с некоторыми решениями-вариантами использования.

Вы спросили, мы отвечаем. Наша попытка правильно определить основные понятия

Определение ИИ: интеллект, демонстрируемый машинами, будь то с помощью машинного обучения, обработки естественного языка или различных других исследований/подобластей ИИ. ИИ был основан как дисциплина в 1956 году и разделен на подполя, которые часто не могут общаться друг с другом. Эти подполя основаны на технических соображениях, то есть: робототехника, машинное обучение, обработка естественного языка, компьютерное зрение, обоснование знаний и т. д. [Подробнее об истории, основных целях, подходах, философии, технологиях и глоссарии читайте в Википедии].

Определение машинного обучения. Подмножество ИИ, позволяющее компьютерам обучаться на основе данных. Отличный ресурс для понимания того, почему следующие 2 десятилетия будут важнее для прогресса ИИ, чем последние 200 лет, с точки зрения непрофессионала.

У нас определенно был очень напряженный вторник, когда мы вместе с Бухарестским университетом организовали Последние достижения в области искусственного интеллекта — отраслевой трек для RAAI 2018, объединив промышленность и академические круги в области ИИ, и нашу последнюю встречу. выпуск перед летними каникулами.

Вот прямая трансляция отраслевой панели RAAAI 2018, где профессионалы в области ИИ поделились своими мыслями. Посетите нашу страницу искусственного интеллекта в Facebook в Бухаресте, чтобы увидеть больше видеопотоков.

Повестка дня последней встречи перед летними каникулами выглядела так:

Основной доклад: Обнаружение и сопоставление подписей, Андрей Маня, инженер по машинному обучению @Sparktech
Основной доклад: Стандартная спецификация совместимости Deep Vision, Богдан Боксе, основатель VisageCloud.
Основной доклад: проверка авторства/профилирование/обнаружение моста стиля, автор Стефан Думитреску, научный исследователь @RACAI и архитектор машинного обучения @Sustainalytics.

🙌🏻 Пространство Networking с гордостью спонсируется компанией Sparktech, которой мы очень благодарны за поддержку и вклад.

👌🏻 Место было предоставлено Commons, как всегда отличные хозяева, большое спасибо. Специальная скидка в размере 25 % доступна/ожидается, чтобы ее мог получить любой специалист по искусственному интеллекту в Бухаресте, желающий использовать свои коворкинг-пространства, конференц-залы и многое другое. Используйте код скидки "BUCHAREST.AI25" при оформлении заказа, если вы заинтересованы.

Хотите настроиться на видеотрансляцию встречи? Проверь это.

Обнаружение подписи ключевого слова и сопоставление

Андрей окончил факультет вычислительной техники Политехнического университета Бухареста, имеет степень магистра технических наук. получил степень бакалавра компьютерных наук в Боннском университете, Германия, со специализацией в области машинного обучения и интеллектуального анализа данных. Во время учебы он работал ассистентом студента-исследователя в отделе открытия знаний Института Фраунгофера IAIS в Санкт-Августине, Германия. С 2014 года он является ведущим инженером по машинному обучению в Sparktech Software.

Спросил Бухарест AI, Андрей ответил:

а. Выполнение машинного обучения — непростая задача. Есть ли кто-нибудь, кто мотивировал/влиял на вашу работу на протяжении многих лет?

Не могу выделить кого-то конкретного, но некоторые приходят на ум. Одним из них является Эмиль Слусански, который впервые пробудил во мне интерес к машинному обучению, когда я принимал участие в летней школе, которую он координировал во время моего третьего года обучения в Политехническом университете Бухареста. Томас Гертнер и Нильс Гёрке, два профессора моей магистерской программы в Боннском университете в Германии, помогли мне понять важность тщательного математического обоснования используемых нами понятий. Конечно, я также слежу за величайшими умами в этой области, моими фаворитами являются Эндрю Нг, Ян Гудфеллоу и Кристиан Мэннинг.

б. Есть ли у вас какие-либо рекомендации для тех, кто только начинает заниматься машинным обучением?

Я думаю, что самое главное — это сохранить баланс между интуитивным пониманием методов машинного обучения и наличием прочной математической основы для них. Сосредоточение внимания только на одном затрудняет достижение желаемых результатов. Также я бы рекомендовал не оставлять без внимания так называемые «традиционные» техники машинного обучения. Глубокие нейронные сети — это здорово, но машинное обучение — это (все еще) гораздо больше, чем глубокое обучение.

в. Есть ли личный проект, которым вы действительно гордитесь? Не могли бы вы немного рассказать нам об этом?

У нас был проект для клиента из сферы финансового аудита, которому требовался метод извлечения информации из тысяч самых разных, в основном отсканированных документов. Это потребовало значительных усилий и включало множество умных методов, как машинного, так и не машинного обучения, но конечный результат имел огромный успех. Если вам нужен «личный личный» проект: моя рок-группа Secret Society. :)

👆Click for slides deck от Андрея.

Стандартная спецификация совместимости Keynote Deep Vision

Богдан Бочсе и Космин Никула, основатели VisageCloud, получили награду Best Business Award от Innovation Labs. И Богдан, и Космин имеют опыт разработки программного обеспечения и архитектуры решений.

VisageCloud — это комплексное решение для распознавания и классификации лиц. Он может работать с фотографиями, селфи, удостоверениями личности и видеопотоками. Он полностью поддерживает API, поэтому вы можете легко интегрировать его в другие приложения или бизнес-системы.

Представлено несколько вариантов использования: помогает вам регистрировать гостей на вашем мероприятии или в отеле, узнавать, когда входит VIP-клиент, и получать уведомления, когда интересующее вас лицо появляется на одном из экранов вашей камеры; позволяет легко доказать, что вы — это вы, просто появляясь и оставаясь самим собой; работает как облачный сервис или локально.

Богдан рассказал нам о DeepVISS — стандарте спецификации совместимости Deep Vision, их инициативе с открытым исходным кодом для упрощения интеграции решений компьютерного зрения.

А.И. Бухарест спросил, Богдан ответил:
а. Работать самостоятельно над стандартом компьютерного зрения довольно смело. В чем, по вашему мнению, эта штука не работает?

Стандарты определяются сообществом и принятием, поэтому речь идет скорее об объединении концепций и отзывах от нескольких игроков на рынке, как партнеров по спросу (клиентов, интеграторов, реселлеров), так и партнеров по спросу (исследователей, поставщиков технологий). Хотя у нас была инициатива DeepVISS, и мы возглавили некоторые усилия по разработке решения, на данный момент у нас есть еще 7 партнеров, которые вносят свой вклад в этот стандарт, поэтому я бы не сказал, что мы разрабатываем его независимо.

Тем не менее, есть много возможностей для неудачи, в основном из-за того, что DeepVISS может не получить достаточного признания в сообществе компьютерного зрения. Еще один риск, связанный со стандартами, заключается в том, что отдельные игроки, столкнувшись с проектными решениями или изменениями, могут предпочесть расширить свою собственную версию формата вместо того, чтобы вносить свой вклад в стандарт. Все эти риски следует ожидать. Наше смягчение последствий заключается в том, чтобы сосредоточиться на общении с партнерами и продемонстрировать как краткосрочные, так и долгосрочные преимущества стандартизированного подхода. Лично я считаю, что заставить компьютерное зрение осознать необходимость стандартизации — это уже победа в битве. В конечном счете, наша цель состоит в том, чтобы люди пришли к единому мнению о передовом опыте интеграции компьютерного зрения, даже если это не DeepVISS. Время покажет.

Б. Я думаю, что DeepVISS — это ответ на внутреннюю потребность VisageCloud. Можете ли вы описать, с какими проблемами вы столкнулись при создании/масштабировании VisageCloud?

Я бы скорее сказал, что DeepVISS — это потребность, о которой сообщество компьютерного зрения узнает в 2019–2020 годах. Каждая область и каждая отрасль, которые находятся на пороге инноваций и прорывов, проходят через этот процесс: на пике рыночных ожиданий каждый изо всех сил пытается сделать что-то, что угодно как можно быстрее. Однако по мере того, как ажиотаж спадает и отрасль выходит на плато производительности, наступает холодная реальность: решения должны работать в условиях нужд предприятия, компоненты должны быть тщательно протестированы и повторно использованы в максимально возможной степени, безопасность должна быть повышена. принудительно, масштабируемость становится обязательной, эксплуатационная готовность является требованием. И именно тогда стандарты становятся необходимыми, чтобы обеспечить предсказуемость и эффективность рынка и позволить командам сосредоточиться на основном бизнесе (компьютерные бизнес-алгоритмы), а не на неосновных активах (таких как интеграция API).

Развитие Интернета в 80-х и 90-х годах вызвало необходимость в стандартах для коммутации пакетов (TCP/IP) и протоколов передачи (HTTP, FTP, SMTP). За шумихой вокруг доткомов в 1999 году последовали годы разработки веб-стандартов (HTTP, JavaScript), стандартов безопасности (SSL, TLS), стандартов обработки платежей (PCI DSS). Мобильный ажиотаж конца 2000-х в конечном итоге привел к необходимости платформ, фреймворков и стандартов разработки. Одна конкретная тема, с которой я знаком, — это повышение стандартов рекламы, поддерживаемых IAB (VAST, OpenRTB, DAAST), поскольку я отвечал за написание первого проекта DAAST (Шаблон стандарта цифровой аудиорекламы) еще в 2014–2015 годах.

Мы прогнозируем, что такая же потребность проявится и в области компьютерного зрения. DeepVISS — это всего лишь подготовка к удовлетворению этой потребности рынка. Поэтому я бы вряд ли охарактеризовал DeepVISS как ответ на потребность, специфичную для VisageCloud. Скорее, это просто вопрос нашего предвидения этой потребности рынка заранее и принятия превентивных мер для ее удовлетворения.

С. К кому обращается DeepVISS? Какую пользу это может принести людям?

В DeepVISS у нас есть два типа партнеров:

Партнеры по спросу: интеграторы решений и реселлеры, стремящиеся быстро, без риска и без особых технических препятствий предоставить клиентам функции и преимущества. Для них DeepVISS — это более простой и понятный способ собрать головоломки из компонентов в готовые к использованию решения.
Партнеры-поставщики: разработчики компьютерного зрения, поставщики технологий и исследователи, которые стремятся внедрить свои инновации в производство, не сталкиваясь с проблемами масштабирования баз данных, разработки API-интерфейсов, создания пользовательских интерфейсов, размышлений о безопасности и конфиденциальности. и соответствие GDPR. Для них DeepVISS — это способ сосредоточиться на инновациях внутри своего «черного ящика», позволяя кому-то другому заниматься непрофильными технологическими аспектами.

Мы все еще открываем новые возможности, с помощью которых DeepVISS может облегчить связь между коммерческими клиентами, которым необходимо решить реальные проблемы, и исследователями и разработчиками, которые скорее сосредоточатся на улучшении современного компьютерного зрения, чем на разработке баз данных. DeepVISS — это мост между этими двумя мирами.

👆Нажмите, чтобы открыть колоду слайдов от Богдана.

Keynote Проверка авторства/профилирование/обнаружение моста стиля

Стефан — научный сотрудник Исследовательского института искусственного интеллекта Румынской академии (RACAI) и ML Architect @Sustainalytics. Его определение веселья тесно связано с машинным обучением, искусственным интеллектом, глубоким обучением, НЛП, вычислительной лингвистикой, извлечением информации, визуализацией данных, машинным переводом с использованием Python, Java, C# и, при необходимости, C++.

А.И. Бухарест спросил, Стефан ответил:

а. Не могли бы вы рассказать о различиях между работой в академических кругах и в частном секторе? Плюсы/минусы для каждого?

Я хотел бы немного сузить этот ответ и поговорить только об исследованиях в академических кругах и исследованиях в частном секторе. Испытав оба, я должен сказать, что оба имеют свою привлекательность. Например, работая в академических кругах, вы, как правило, больше сосредотачиваетесь на абстрактных предметах, например, на достижении самых современных результатов в очень конкретной и нишевой подзадаче, игнорируя при этом все остальное. В частном секторе все должно работать в реальной, динамично меняющейся среде. Это означает, что вам нужно сосредоточиться не только на алгоритме, но и отвлечь часть своего времени на его развертывание где-то, обработку пограничных случаев, работу с зашумленными данными и всевозможными ошибками по пути. И с людьми тоже. Хотя с определенной точки зрения это может показаться скучным, это приносит определенное удовлетворение — вы создаете то, что люди действительно используют. Это похоже на работу только с двигателем автомобиля с единственной целью получения максимальной мощности по сравнению с работой над большей частью автомобиля, также пытаясь получить как можно больше лошадиных сил, но при этом сохраняя его экономичность.

Итак, давайте рассмотрим несколько плюсов и минусов для научных кругов:

вы обычно работаете над очень абстрактной и конкретной темой (за, если вы идете ва-банк);
если вам повезет, вы сможете выбрать конкретно то, что вам нравится/хотите изучать (про);
жесткие сроки обычно только для написания статей и для конференций (pro);
однако этот более «расслабленный»/«богемный» образ жизни вызывает привыкание и его трудно изменить (против);
Кроме того, вам нужно обладать хорошими навыками самоуправления и расстановки приоритетов, вроде того, что вам понадобится для предпринимательства (я бы посчитал это сложной задачей и, следовательно, мошенничеством), иначе вы постепенно отстанете.
Для промышленности: вы работаете над реальными проблемами и вносите изменения (не абстрактные) (профессионально),
вам нужно изучать другие технологии и взаимодействовать с разными командами (про), и последнее, но не менее важное,
в зависимости от степени автономии, которой вы обладаете, вы можете/не можете управлять проектом по-своему (за/против).

б. Как вы думаете, в какой отрасли проверка авторства будет иметь наибольшее значение в ближайшем будущем?

Крепкий орешек. Проверка авторства затрагивает многие области, обычно скрытыми способами, и это палка о двух концах. Если говорить о слежке (централизованной или нет), то возможность идентифицировать анонимных писателей, блогеров, активистов социальных сетей и т. д. напрямую приведет к снижению анонимности и свободы слова и, таким образом, к укреплению авторитарного правительства. Тем не менее, возможность идентифицировать онлайн-преследователей/преследователей, безусловно, является долгожданным инструментом в арсенале полиции. Возможно, наиболее известное использование типа проверки авторства сегодня — это инструменты, которые выполняют крупномасштабное обнаружение плагиата, что означает меньше «копирования-вставки» в научных публикациях, степенях, книгах и т. д. и больше оригинального контента. Другие реализации также существуют и хорошо работают для очень специфических задач в частном секторе, таких как защита от поддельных/вредоносных отзывов в Интернете. Думаю, в ближайшем будущем мы увидим (самых) личных помощников, которые узнают, как мы пишем, и смогут грамотно нас поправить или помочь с переформулировками или предложениями, если мы попросим о помощи. В целом, различные варианты проверки авторства, скорее всего, будут естественным образом интегрированы, и мы начнем воспринимать их как должное, почти так же, как мы сейчас полагаемся на автозамену на наших телефонах или на наших ПК. Как я делаю прямо сейчас, когда пишу этот текст.

в. Как проходит день из жизни научного исследователя? Можете ли вы рассказать о ежедневных проблемах, с которыми вы сталкиваетесь каждый день, и о том, что побуждает вас преодолевать их?

Это легко. Обычно вы не знаете, что произойдет. У вас есть общее представление, например, завтра я буду тренировать эту сеть, которую я сегодня немного модифицировал, и получу некоторые результаты тестов, которые, я *знаю*, будут лучше, чем вчера. А потом вы тратите неделю на отладку и переобучение только для того, чтобы вдруг понять, что вы делали не так, принимая душ перед сном. А потом возникли проблемы с засыпанием, потому что «как я мог это пропустить», а затем снова захотелось переобучить сеть. Затем снова провал, потому что «черт возьми, я был уверен, что это все». Иногда вы читаете и пытаетесь понять пару статей, а иногда полностью сосредоточены на написании кода для кэширования данных, потому что на машине, на которой вы работаете, никогда не хватает оперативной памяти. Это, я думаю, лучшее, что есть в исследованиях. Никогда не знаешь наверняка, что произойдет завтра, но обычно это что-то новое, что для меня является основной причиной делать то, что я делаю. Я считаю, что мне повезло, что мне платят за мое хобби.

👆Нажмите, чтобы увидеть слайды от Стефана.

Бонус: ищете библиотеку НЛП, включая румынский язык?

Знакомьтесь, NLP Cube — библиотека NLP, поддерживающая 70 языков (включая румынский) и поддерживаемая Tiberiu Boros и Stefan Dumitrescu. Посмотрите потоковое видео, чтобы узнать больше об этом проекте с открытым исходным кодом, или проверьте их прогресс на Github. Свяжитесь с ними для получения дальнейших инструкций или вопросов.

Чтобы получить доступ к румынской модели, свяжитесь с ними для получения ссылки и обязательно загрузите также RO Embeddings отсюда.

Для тех, кто знаком с НЛП, вот библиография видео из курса Эндрю Нг по RNN. А для более быстрого цикла разработки четыре блока кодирования последовательности в качестве замены RNN/LSTM, которые могут конкурировать с повторяющимися альтернативами и сэкономить вам много вычислительного времени (любезно предоставлено Хань Сяо, старший научный сотрудник III в Tencent AI) .

Что дальше @BucharestAI

🖖🏻 Увидимся этой осенью, вместе отправляясь в новые приключения и возможности ИИ. Мы обещаем захватывающие времена! :) У вас есть идеи или отзывы для нас? Не держите его, пингуйте нас, мы будем рады услышать от вас.

🎩 Вступительная часть для всех вас, за всю вашу поддержку и вклад до сих пор. Сообщество — это всегда сила его членов. Для нас большая честь иметь возможность встретиться со многими из вас, и мы с нетерпением ждем возможности дать большему количеству из вас возможность осмысленно и смиренно практиковать и развивать свои навыки, знания, сотрудничество и осведомленность в области ИИ. И не забывайте:

Важные вещи происходят, когда объединяются единомышленники.

☀️ Счастливого лета, коллеги из Бухареста по искусственному интеллекту (как практикующие, так и энтузиасты)!

Управление идентификацией с помощью AI/ML: подписи, распознавание лиц, авторство

Обнаружение подписи ключевого слова и сопоставление

Стандартная спецификация совместимости Keynote Deep Vision

Keynote Проверка авторства/профилирование/обнаружение моста стиля

Что дальше @BucharestAI

Вопросы по теме