Публикации по теме 'data-mining'


Как мы можем определить, будет ли фильм отличным?
Объединение кластеризации k-средних с деревом решений по данным IMDb Задний план Вы когда-нибудь задумывались, насколько великим будет фильм до его выхода? Недавно данные IMDb о более чем 5000 фильмах были скопированы с помощью Python и опубликованы на Kaggle.com Чуаном Саном. Набор данных доступен здесь . Цель Наша цель - выяснить, какие факторы могут способствовать созданию отличных фильмов. Подход 1… Примените кластеризацию k-средних, чтобы разделить фильмы на..

Текстовый поиск на основе оценки TF-IDF
Чтобы выполнить очень похожий метод поиска, такой как простая версия Google, самый простой способ — использовать модель Bag of Words для измерения каждого слова в наборе данных. Поэтому при вводе запроса приложение будет возвращать документы с наибольшим суммарным весом в терминах запроса. В этом уроке я буду использовать Python-Flask. Вы можете течь со мной вместе. ЧАСТЬ I: Подготовка документов/веб-страниц Сначала начинаем работать в бэкенде. Для этого нам нужно загрузить важные..

Электронная торговля и наука о данных: это не так просто, как вы думаете
Фон Машинное обучение и интеллектуальный анализ данных, похоже, сейчас в моде в кругах веб-технологий. Однако, оглядываясь назад, можно сказать, что в науке, стоящей за этими терминами, нет ничего нового или передового. Они существуют с 1960-х годов и использовались, чтобы доставить нас на Луну. По своей сути машинное обучение и интеллектуальный анализ данных основаны на простых статистических уравнениях, созданных для оценки больших наборов данных, чтобы находить закономерности и..

Уроки искусственного интеллекта Омдены для лечения посттравматического стрессового расстройства
Уроки искусственного интеллекта Омдены для лечения посттравматического стрессового расстройства Я доцент, доктор философии. по математике и присоединился к следующему испытанию AI for Good. Одно впереди: за короткий период времени я и команда из 34 сотрудников по всему миру многому научились в нескольких областях, в том числе: Интеллектуальный анализ данных, искусственный интеллект, машинное обучение, трансферное обучение, обработка естественного языка и доступные инструменты..

Прогнозирование успеваемости учащихся: часть 1
Аннотация — я сосредоточен на прогнозировании успеваемости учащихся и поиске тенденций, если это возможно. Этот проект важен, потому что образование является ключевым фактором для достижения долгосрочного экономического прогресса. Я хочу понять влияние демографического, социального и экономического статуса на успеваемость учащихся. Чтобы представить данные, мой метод заключается в реализации алгоритмов классификации для прогнозирования успеваемости учащихся. Моя цель — глубже изучить..

Classification_of_rainy_days_using_supervised_learning
import pandas as pd import seaborn as sns import numpy as np import matplotlib.pyplot as plt import dexplot as dxp import datetime as dt from imblearn.over_sampling import RandomOverSampler from scipy.stats import chi2_contingency,ttest_ind,bartlett import warnings warnings.filterwarnings('ignore') %matplotlib inline Загрузка данных В этом случае мы будем работать с набором данных различных переменных, связанных с дождем в Австралии. Эти переменные включают в себя такую..

Руководство по интеллектуальному анализу данных: как, почему и лучшие практики [2019]
Хотите знать, зачем вашему бизнесу интересоваться интеллектуальным анализом данных и с чего начать? Это руководство вам нужно. Там, где когда-то алмазы и золото были единственными вещами, которые были нужны людям, сегодня данные — это блестящий слиток золота, который каждый хочет получить в свои руки. От небольших стартапов до крупных корпораций, наличие нужных данных под рукой даст вам мощное конкурентное преимущество, которое вы можете использовать для продвижения своего бренда,..