Наш мир представляет собой сложную сеть связей. От молекул до генов, от людей до организаций, нашу реальность можно рассматривать как соединение компонентов. Все связано, то есть все может быть представлено как компоненты, связанные с другими компонентами.

В мире машинного обучения это представление можно сделать с помощью графиков. Граф призван накапливать и выражать знания о реальном мире, используя узлы для представления интересующих объектов и ребра для представления отношений между этими объектами.

Анатомия графиков

Узлы — это элементы, создающие сеть. Они могут представлять дома, местоположения, аэропорты, порты, автобусные остановки, здания, пользователей и все, что вы можете представить как связанное с аналогичными элементами в сети.

Ребра — это соединения между узлами. Они могут представлять улицы, авиарейсы, автобусные маршруты, связь между двумя пользователями в социальной сети или что-либо, что может представлять связь между узлами в контексте, с которым вы работаете.

Узлы и ребра разнообразны, и они могут представлять физические сети, такие как электрические цепи, дороги или органические молекулы. Они также могут представлять менее осязаемые взаимодействия, такие как экосистемы, социологические отношения, базы данных или поток управления в компьютерной программе.

Графики — это простой, но мощный способ описания взаимосвязей вещей.

Тройка — это самая простая модель графа знаний, которую вы можете построить с двумя узлами и одним ребром, объясняющим их связь. Часто тройка изображается либо как субъект-сказуемое-субъект, либо как субъект-сказуемое-объект. То есть сущность (субъект) может быть связана с другой сущностью или с простым значением (объектом) через некоторое свойство (предикат). Например, тройка Колумбийский университет расположен в Нью-Йорке соединяет подлежащее Колумбийский университет и объект Нью-Йорк с помощью предиката расположен в.

Более того, узлы и отношения могут иметь метки, а узлы также могут иметь атрибуты (или свойства). Другой способ просмотра узлов, отношений и атрибутов — через грамматику. Узел — это существительное. Отношения - это глагол. Атрибуты для существительных подобны прилагательным, а атрибуты для отношений подобны наречиям.

Таким образом, узлы, представляющие сущности, могут:

  • Содержит ноль или более свойств, пары ключ-значение, представляющие данные объекта, такие как цена или дата рождения.
  • Имейте ноль или более меток, которые заявляют назначение узла на графике, например, представление клиентов или продуктов.

Ребра, показывающие взаимосвязь сущностей:

  • Иметь тип, например купил или понравился.
  • Направление от одного узла к другому (или обратно к тому же узлу).
  • Может содержать ноль или более свойств, представляющих собой пары ключ-значение, представляющие некоторые характеристики ссылки, такие как метка времени или расстояние.
  • Никогда не болтайтесь: всегда есть начальный и конечный узел (который может быть одним и тем же узлом).

Узлы, отношения, свойства и правила можно использовать для сборки сложных высокоточных графических моделей данных.

Улучшение обнаружения информации

Поиск связей между точками данных — это естественный и мощный способ открытия информации. Графики и теория графов сами по себе являются замечательными инструментами для моделирования и анализа данных.

Графические модели данных могут уникальным образом представлять сложные косвенные отношения таким образом, чтобы они были понятны как человеку, так и машине.

В отличие от реляционных баз данных, графовая база данных хранит узлы и отношения вместо таблиц или документов. Данные хранятся без ограничения их заранее определенной моделью, что позволяет очень гибко мыслить и использовать их.

Рекомендации

  • Справочник по теории графов (Гросс, Йеллен, Чжан)
  • Графики знаний (Барраса, Ходлер, Уэббер)

Заинтересованы в этих темах? Подпишитесь на меня в Linkedin или Twitter