Публикация этого старого блога от Ayasdi, День топологии 2015 г.

Автор Деви Раманан 26 июня 2015 г.

Нам нравится говорить, что у нас есть особый соус, когда дело доходит до использования геометрической формы для анализа сложных наборов данных. Наш секретный ингредиент, топологический анализ данных (TDA), использует алгоритмы машинного обучения в сочетании с топологией для получения ценных сведений.

Поскольку Topology является основой нашей компании, три года назад мы начали отмечать ежегодную традицию. «День топологии» — это день, когда мы приглашаем математиков и компьютерных ученых, которые в настоящее время используют прикладную топологию, представить, над чем они работают.

Мы начали день с презентации Дэвида Шнайдера, который специализируется на микробиологии и иммунологии в Стэнфорде. Лаборатория Дэвида пытается понять, что делает хозяина устойчивым к инфекциям, сосредоточив внимание на здоровье; под этим он подразумевает, что хозяин сталкивается с патогеном, заболевает и в значительной степени возвращается к своему исходному состоянию здоровья. Сосредоточение внимания на изучении всей хронологии болезни, от здоровья через болезнь и обратно к здоровью, может дать ценную информацию о том, как улучшить здравоохранение.

Затем мы приветствовали Роба Гриста, профессора кафедры математики Пенсильванского университета, который провел для нас очень увлекательную сессию, посвященную новым математическим инструментам, имеющим отношение к ТДА. Роб сосредоточился на функциональном анализе, гомологической алгебре и прикладной топологии в отношении функториальности для передачи информации между связанными наборами данных. Эти окна помещают в форму облака точек функции, связанные с базовой
динамикой, периодическими процессами, более независимым от модели способом по сравнению с более традиционными методами, такими как анализ Фурье.

Вслед за Робом стэнфордский профессор компьютерных наук Леонидас Гульбас объяснил, как он разрабатывает сети, способные передавать информацию между наборами данных с высокой степенью взаимной корреляции, на основе идей, вдохновленных функциональным анализом, гомологической алгеброй и алгебраической топологией. Он описал структуру, которая позволяет кодировать информацию как функции над данными и приводит к линейным операторам для отображения между наборами данных, что позволяет использовать множество мощных инструментов линейной алгебры и оптимизации. Эта комбинация позволяет Leonidas создавать сети, способные передавать информацию между наборами данных. Транспортировка и агрегация информации в таких сетях могут помочь нам очистить карты, обнаружить общую структуру, а также сделать вывод об отсутствующей информации в данных — чтобы «увидеть невидимое».

Рауль Рабадан, доцент кафедры системной биологии и биомедицинской информатики Колумбийского университета, представил математическую структуру, способную фиксировать и представлять крупномасштабные свойства эволюции. Постоянная гомология направлена ​​​​на извлечение глобальных топологических признаков из данных о последовательностях путем реконструкции симплициальных комплексов, которые в определенном масштабе генетического расстояния представляют отношения между различными геномами. Он показал, что существуют топологические препятствия для использования филогении для определенных наборов геномных данных. Это еще один пример того, как TDA видит релевантную структуру в реальных данных, невидимую для классических методов. Математическая биология смоделировала эволюцию по древу жизни Дарвина. То есть эволюционные сети являются древовидными, без каких-либо петель в базовых сетях, которые моделируют эволюцию во времени. Эта статья показывает, что такие петли существуют в реальных данных, и что для их обнаружения и понимания требуется TDA. Это первое строгое и систематическое установление существования таких структур — и теперь ясно, что это повсеместное явление.

Мы завершили мероприятие «День топологии Аясди» Хосе Переа, активным исследователем в области вычислительной топологии и топологического анализа данных. Хосе рассказал о скользящих окнах или вложениях с временной задержкой, которые широко используются в представлениях данных временных рядов. Эти окна помещают в форму облака точек функции, связанные с основной динамикой, периодическими процессами и экстремальными событиями. Он показал, как постоянная гомология может использоваться для анализа таких облаков точек, как теоретически, так и практически, и представил некоторые приложения для количественной оценки периодичности в данных временных рядов экспрессии генов.

Возвращайтесь, так как мы будем загружать несколько видео с выступлений. Некоторые докладчики все еще подают доклады и не хотят, чтобы их презентации записывались, но мы опубликуем остальных.