Используйте сетевую диаграмму для выявления взаимосвязей в ваших данных

Мэтью Шройер, Front-end разработчик и журналист данных

Часто, когда мы смотрим на массу данных, мы пытаемся понять отношения в этих данных. Кто является лидером в этой социальной группе? Что общего между разными группами людей? Такие отношения могут быть представлены сотнями графических способов, но немногие из них столь же эффективны, как классическая сетевая диаграмма.

Некоторые, возможно, видели свою первую сетевую диаграмму в виде графа социальной сети — сети точек, соединенных линиями, некоторые из которых сгруппированы близко друг к другу, некоторые расходятся на периферию — что означает, что у людей есть что-то общее. На языке сетевых диаграмм точки — это «узлы», и они часто представляют людей в социальных сетях. Линии, соединяющие эти узлы, называются «ребрами», и они часто представляют дружбу или взаимодействие.

Если узел разделяет большое количество ребер с группой узлов, узлы будут сгруппированы рядом друг с другом. В этом и заключается настоящая сила сетевой диаграммы, способность с первого взгляда определять близкие отношения.

Что мы можем сделать с базовой схемой сети?

В прошлом этот скромный, но мощный инструмент помогал исследователям понимать отношения между учениками в классе и визуализировать 10 миллионов журналов действий, чтобы увидеть, как юридическая фирма использует технологии. Конечно, сетевые диаграммы не ограничиваются отображением данных социальных сетей. Сетевые диаграммы, как и платформа Exaptive, не зависят от технологии. В другом посте я использовал базовую сетевую диаграмму, чтобы показать, как связаны между собой оригинальные телесериалы Netflix и что это может означать для общей стратегии Netflix по созданию ориентированного на пользователя контента.

Сетевая диаграмма была доступна на рынке компонентов Exaptive уже несколько лет, но новая версия упрощает преобразование ваших данных в изящную графическую форму. Наша новая базовая сетевая диаграмма требует для работы всего три компонента: цель перетаскивания (для получения и анализа ваших данных), компонент конфигурации порта (для упорядочивания данных и работы с ними) и компонент базовой сетевой диаграммы (то есть данные). Ниже приведено руководство о том, как создать приложение для работы с данными с помощью визуального программирования потоков данных для создания сетевых диаграмм из собственных данных.

Если вы являетесь разработчиком с частичным стеком, исследователем, который немного знаком со сценариями или имеет какие-либо другие знания в области программирования, вы обнаружите, что это быстрый и продуктивный способ создания приложения для исследования данных. (А если вы не хотите делать это своими руками, у нас есть доступное приложение для работы с данными, которое вы можете копировать, настраивать, разрывать на части и комбинировать со своими собственными технологически независимыми компонентами.)

Получите компоненты.

Во-первых, войдите в Exaptive Studio или получите бесплатную учетную запись. Затем перейдите на страницу УЗНАТЬ БОЛЬШЕ, чтобы найти эти компоненты и добавить их в свою студию.

Цель перетаскивания файлов Excel Приложение данных не будет работать очень хорошо без данных. Цель перетаскивания файлов Excel — это удобный способ заставить ваш любимый файл Excel (XLSX) работать с другими компонентами.
Конфигурация порта
Большинству компонентов визуализации требуются какие-либо инструкции для представления данных осмысленным образом. В вашем файле Excel могут быть десятки или сотни столбцов, и было бы беспорядок просто вывести все данные сразу. Компонент конфигурации порта позволяет вам выбирать, какие атрибуты из ваших данных отображать в любой момент времени. Он просматривает все атрибуты в ваших данных и создает несколько раскрывающихся списков в предварительном просмотре в зависимости от того, как он настроен.
Базовая сетевая диаграмма Приложение данных — это больше, чем просто визуализация (и некоторым xaps визуализация не нужна), но все вышеперечисленные компоненты существуют для поддержки одной мощной, но простой в настройке визуализации. Базовая сетевая диаграмма предназначена для того, чтобы позволить пользователю выбирать визуальные шаблоны в зависимости от размера, цвета и кластеризации узлов с минимальным количеством настроек.

Теперь перейдите на страницу STUDIO, щелкните значок «плюс» и создайте новый Xap. Вы окажетесь в DATAFLOW, чистом холсте для соединения компонентов для создания приложения данных.

Откройте обозреватель компонентов и найдите компоненты, ожидающие вас.

Настройте компонент конфигурации порта.

Компонент конфигурации порта может создавать почти неограниченное количество раскрывающихся списков, но вам нужно создавать только те раскрывающиеся списки, которые полезны для вашей конкретной визуализации. В случае с сетевой диаграммой вам нужно указать, как соединяются узлы (также известные как ребра), каков их размер, как они окрашены и как они помечены. Компонент конфигурации порта имеет вход «config», где вы можете установить эти параметры.

Для каждого элемента, указанного на входе «config» компонента, компонент создает раскрывающийся список в предварительном просмотре и выходной порт с дополнительным именем. Этот компонент предназначен для работы с базовой сетевой схемой «из коробки», поэтому для этого примера не требуется дополнительная настройка. Однако вам может потребоваться изменить этот ввод для других Xap.

Соедините компоненты.

Выходные данные компонента Drop Target должны быть подключены к входным данным компонента Projection Configuration.

После добавления каждого компонента в поток данных данные, поступающие из целевого объекта перетаскивания файла Excel, необходимо отправить в компонент конфигурации порта. Чтобы это произошло, подключите выход «данные» цели перетаскивания к входу «данные» конфигурации порта. Те же данные также необходимо передать компоненту базовой сетевой диаграммы для визуализации, поэтому также отправьте вывод «данных» перетаскивания файла на вход «данных» сетевой диаграммы.

Затем вы захотите подключить компонент «Конфигурация порта», чтобы он мог направлять базовую сетевую диаграмму для отображения данных именно так, как вы хотите. Когда пользователь выбирает атрибуты из раскрывающегося списка, компонент отправляет эти атрибуты на базовую сетевую диаграмму. Чтобы это произошло, разверните вход «данные» в компоненте схемы сети, который предоставит несколько подпортов.

Компонент Network Diagram должен будет получать данные компонентов Projection Configuration и File Drop.

Открыв подпорты «данные», подключите выходные данные «color.data», «size.data» и «label.data» компонентов конфигурации Projection к «color», «size» и «label». входы компонента схемы сети соответственно.

Наконец, компонент Network Diagram соединит узлы в соответствии с вводом «атрибутов». Для этого подключите вывод «include.data» в компоненте «Конфигурация проекции» к входу «атрибуты» в компоненте «Сетевая диаграмма».

Запустите хап.

Часть XAP, посвященная программированию потока данных, завершена. В предварительном просмотре xap цель перетаскивания файла будет отображаться в виде прямоугольника с пунктирной рамкой. Пользователь может перетащить файл со своего компьютера в цель, чтобы обработать его, или он может щелкнуть цель, чтобы запустить проводник, чтобы найти и выбрать файл на своем компьютере. Вставьте свой любимый файл XLSX, поэкспериментируйте с настройками в раскрывающемся списке и изучите получившуюся сетевую диаграмму. Вот интересный пример, который вы можете использовать с данными об оригинальном контенте Netflix.

Эта визуализация не должна быть концом упрощения вашего рабочего процесса преобразования данных в аналитическую информацию. Помните, что в Studio все существует в виде компонентов, а это означает, что вы можете включить эти элементы в еще более мощное приложение для работы с данными. Платформа не зависит от технологий, то есть вы можете использовать Javascript, Python или R в своем потоке данных.