Семь месяцев, две недели и три дня назад мы «официально» выпустили Datazar версии 1.0 для широкой публики. Я поставил официально в кавычки, потому что Datazar всегда был доступен для широкой публики. Мы развиваем вместе наше сообщество, чтобы гарантировать, что то, что мы создаем, имеет важное значение для рабочего процесса, который мы всегда стремимся совершенствовать. Инновации и прозрачность - два столпа нашей сущности, поэтому мы гордимся своей способностью к открытому новаторскому подходу.

Итак, прежде чем я углублюсь в какие-либо детали, я хотел бы поблагодарить наше сообщество за то, что помогло нам добраться сюда. Это было бы невозможно без ваших постоянных отзывов и критики. Выпуск версии 2 - это огромный скачок по сравнению с версией 1. Около 80% кода является полностью новым. Итак, давайте развернем игрушки!

Рабочее пространство

Что-то совершенно новое - это Workspace. До того, как было введено рабочее пространство, единственное, что вы могли делать в Datazar, - это загружать свои данные, сопоставлять их с соответствующими файлами / анализом (вручную) и разрешать другим людям загружать их. Довольно просто. Но какой смысл иметь набор данных, если вы не можете его использовать (визуализировать / анализировать)? Этот дополнительный шаг по загрузке набора данных, его анализу и повторной загрузке, независимо от результата, просто не снижает его (на основе наших данных). Так как насчет возможности анализировать набор данных прямо сейчас, используя инструменты, с которыми вы уже знакомы? Например, R и Python.

Мы разработали интерфейс ноутбука и консоли как для R, так и для Python; два самых популярных языка анализа (открытый исходный код).

Теперь вы можете анализировать любой набор данных с помощью R и Python с помощью интерфейса записной книжки или консоли прямо в браузере. Все вычисления выполняются на серверах Datazar, поэтому вы можете делать это буквально с помощью Chromebook.

Мы не хотели изобретать колесо, поэтому решили придерживаться интерфейсов, которые всем уже нравятся. А именно консоль и ноутбук. Мы просто внесли небольшие изменения; Пример: изображения в интерфейсе консоли отображаются вместе с текстовыми результатами вместо другого окна (как это было бы в вашем терминале). Использование этих интерфейсов также обеспечивает максимальную воспроизводимость.

Вы можете установить любые пакеты / модули, создавать любые модели, диаграммы, визуализации и т. Д. Так же, как на вашем локальном компьютере с вашим любимым редактором.

В случае R вы также можете создавать файлы RMarkdown, а не только консоли и записные книжки.

Графики в один клик

Иногда вам не нужно запускать R или Python для изучения набора данных. Иногда для начала достаточно простой диаграммы. Именно по этой причине мы также ввели графики в один клик. Это очень простые исследовательские диаграммы, такие как диаграммы рассеяния, линейные диаграммы и т. Д.… Если вы обновите набор данных, диаграммы также будут обновлены соответствующим образом, чтобы их можно было использовать для отслеживания вещей как функции времени.

Обновленный интерфейс проекта

В версии 1.0 Проект был второстепенным. Вся платформа была сосредоточена вокруг файла или набора данных. Мы полностью перепроектировали целые потоки, чтобы сделать платформу ориентированной на проект. Почему? Сами по себе наборы данных не имеют такой же тяги, как наборы данных со вспомогательными документами, такими как аналитические записные книжки, заметки и файлы публикаций.

Это изменение полностью изменило то, как вы работаете на платформе. Новый интерфейс, основанный на проекте, подталкивает вас к дальнейшему сотрудничеству с быстрым доступом к таким вещам, как обсуждения проекта, показатели проекта, активность проекта и т. Д.

Издательский

В новом интерфейсе проекта вы можете публиковать свои проекты после того, как закончите анализ данных. Независимо от того, используете ли вы файл MarkDown или файл LaTeX, вы можете перенаправить своих читателей на документ публикации, чтобы они увидели его в первую очередь.

Репликация

Теперь проекты можно тиражировать. Репликация в Datazar, точно так же, как вы реплицируете проект своих коллег-исследователей, позволяет вам создать точную копию проекта. После завершения копирования вы можете повторно запустить весь анализ и просмотреть наборы данных и методы, не затрагивая / не изменяя исходные документы. Мы полностью встроили научный процесс в платформу.

Ценообразование

Вместе с выпуском версии 2.0 мы также официально публикуем наши планы и цены.

Планы различаются в зависимости от того, сколько данных вы хотите вычислить, вызовов API и конфиденциальности проекта.

Первый фактор - вычисление. Любой, у кого есть любой тарифный план, может загружать столько данных, сколько хочет, и создавать файлы анализа любого размера. Единственная разница в том, сколько данных вы хотите вычислить в облаке с помощью R, Python и т. Д. С планами Pro и Team вы можете вычислить файл любого размера, какой захотите, как на вашем собственном компьютере *.

Второй фактор в структуре ценообразования - доступ к API. Любой, у кого есть учетная запись Datazar, может получить доступ к API с помощью токенов. При выборе плана Student, Pro или Team вы получаете более высокие ограничения скорости API.

Третий фактор - конфиденциальность проекта. Все бесплатные учетные записи могут создавать столько общедоступных проектов, сколько они хотят, загружая файлы любого типа и размера. Платные планы позволяют учетным записям создавать частные проекты, к которым имеют доступ только приглашенные соавторы.

Мы также создали версию плана Pro со скидкой для студентов с относительно высокими вычислительными ограничениями и ограничениями API.

* с учетом аппаратных ограничений

Разное

Ускоренный рендеринг: визуализации и диаграммы D3 теперь загружаются в 3,5 раза быстрее, чем раньше, из-за переработанного механизма рендеринга.

Массовая загрузка: теперь файлы можно загружать массово, а не один на один. Datazar теперь также автоматически определяет, какой это файл (необработанные данные, подготовленные данные, анализ, визуализация…)

Контроль участия сообщества: владельцы и сопровождающие проектов теперь могут контролировать, может ли сообщество предоставлять наборы данных и анализ, даже если проекты являются общедоступными.

Документация: на docs.datazar.com/guides загружено несколько руководств. Через несколько недель мы откроем для всех доступ к системе Документов, чтобы каждый мог писать руководства.

Внешний доступ: теперь доступ к социальным сетям доступен для всех файлов.

Еще раз благодарим всех, кто участвовал в этом, мы на один шаг ближе к изменению подхода к исследованиям. Если вы думаете о переносе исследования в Datazar или просто о том, чтобы заняться исследованиями, не стесняйтесь обращаться по адресу [email protected]. Страницы Изучить и Продукт - отличные ресурсы, если вы стоите на пороге, но, как всегда, лучший способ узнать это - сразу перейти к делу.

Присоединяйтесь к обсуждению на ProductHunt.