Публикации по теме 'data-visualization'


Распознавание рукописных цифр с помощью Scikit-Learn…
ВВЕДЕНИЕ Распознавание рукописного текста — это проблема, которая восходит к первым автоматическим машинам, которым нужно было распознавать отдельные символы в рукописных документах. Классификация рукописного текста или чисел важна для многих реальных сценариев. Например, почтовая служба может сканировать почтовые индексы на конвертах, чтобы автоматизировать группировку конвертов, которые должны быть отправлены в одно и то же место. В этой статье рассказывается о распознавании..

Классификация книг на основе данных Goodreads
Все в этой статье основано на наборе данных Goodreads-books , который можно найти здесь, на Kaggle: https://www.kaggle.com/jealousleopard/goodreadsbooks . Созданный из совокупности нескольких переменных, извлеченных с помощью API Goodreads, набор содержит такие функции, как количество страниц, количество обзоров, средний рейтинг (из 5), информацию об издателе и многое другое для более чем одиннадцати тысяч романов. Прежде чем использовать какие-либо алгоритмы машинного обучения, были..

Лучшие языки программирования выходного дня - по данным GitHub
Лучшие языки программирования выходного дня - по данным GitHub Stack Overflow опубликовал статью с анализом лучших языков программирования выходного дня . Одна из их специалистов по обработке данных - Джулия Силг - проделала отличную работу, но она проанализировала только теги Stack Overflow. На reddit и Hacker News было задано много вопросов, и я собираюсь использовать данные из коммитов GitHub, чтобы найти на них ответ. Лучшие языки на выходных в 2016 году: Rust,..

Кластеризация клиентов торгового центра — K-Means (машинное обучение)
У нас есть некоторые основные данные о клиентах, такие как идентификатор клиента, возраст, пол, годовой доход и оценка расходов. Оценка расходов присваивается клиенту на основе некоторых параметров, таких как поведение клиента и данные о покупках. Мы постараемся сгруппировать эти данные по этим признакам. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Read data df = pd.read_csv("../input/Mall_Customers.csv") # Info df.info()..

GeoSpock отображает триллионы точек данных
Расширение GL JS для создания пользовательских визуализаций для бизнес-аналитики Автор: Анджелина Кальдерон Geospock создает механизм индексации данных для приема, хранения и извлечения геопространственных и временных данных в петабайтном масштабе. Их цель - разблокировать огромные объемы данных в реальном времени, которые собирают компании, предоставляя аналитическое программное обеспечение, которое ускоряет получение информации и, следовательно, более рентабельное управление..

Как наука о данных помогает бизнесу? 8 основных реализаций
Внедрение тактики науки о данных в деловом мире Прямо сейчас, в 21 веке, есть много предприятий, а также много новых стартапов, которые выходят на рынок и хотят развивать свой бизнес как в плане продукта, так и в финансовом плане. Многие новые владельцы бизнеса ищут «Как наука о данных помогает предприятиям», чтобы увеличить свой доход. Есть несколько новых стартапов или, можно сказать, компаний, которые делают маленькие шаги, чтобы построить свою империю и завоевать свое имя на..

Привет (3D) мир
Недавно мне понадобился специальный способ отображения данных о географическом местоположении, который будет немного полезен для сайта с резюме. Конечный результат показан на GIF-изображении ниже. В этой статье вы пройдете через этапы от вдохновения, подготовки данных и реализации с использованием WebGL до THREE.js. Код примера будет урезанной версией глобуса, который мне нужен для моего конкретного случая использования, но он будет отображать те же геометрические фигуры, но не будет..