Публикации по теме 'data-processing'


Агрегирование 22 ГБ данных о транзакциях с помощью Terality
Обработка большого набора данных транзакций для исследования данных и разработки функций Деньги говорят, и ничто не говорит о покупателе больше, чем то, где он их тратит. Мы можем получить представление о клиентах, изучая транзакции или создавая модели с данными. Наборы данных о транзакциях имеют тенденцию быть большими. Следовательно, это затрудняет их обработку на вашем персональном компьютере. Чтобы обрабатывать эти большие наборы данных, вы можете настроить сервер. Или вы..

Использование визуализации данных для управления экспериментами по глубокому обучению
Майк Макрори В этой статье мы поговорим о глубоком обучении и некоторых проблемах и возможностях, с которыми специалисты по обработке данных и ИТ-специалисты сталкиваются в этой захватывающей и развивающейся области. Мы исследуем, как управлять этими проблемами и возможностями с помощью визуализации данных. Прежде чем мы углубимся в тонкости глубокого обучения, давайте сначала выясним, что мы подразумеваем под «глубоким обучением». Глубокое обучение - это подполе более широкого..

Предварительная обработка текста в Python
[Это часть 100 Days of ML] Алгоритму машинного обучения нужны данные в числовой форме, но данные обычно имеют смешанные функции, такие как числовые, текстовые, категориальные, порядковые. Вот почему нам нужно сначала обработать текст, прежде чем подавать его в модели машинного обучения. В этом посте я взял набор данных с kaggle, набор данных содержит текст и другие функции блогов с blogger.com. Проверьте набор данных: Датасет: https://www.kaggle.com/rtatman/blog-authorship-corpus..

Слишком много функций? Давайте посмотрим на анализ главных компонентов
Серия самодельных моделей машинного обучения Репозиторий сопутствующего контента доступен здесь ! Проклятие размерности — одна из основных проблем машинного обучения. По мере увеличения количества признаков увеличивается и сложность модели. Более того, если данных для обучения недостаточно, это приводит к переобучению. В этой записи будет представлен анализ основных компонентов (АПК). Во-первых, я объясню, почему слишком много функций является проблемой. Затем математика PCA и..

Реализуйте предварительную обработку данных в машинном обучении
В предыдущей статье я подробно расскажу о методах предварительной обработки данных, которые могут использоваться в любой области. Сейчас я просто объясню « как мы реализуем методы предварительной обработки данных, используемые в машинном обучении ». Некоторые методы, которые используются в любом алгоритме машинного обучения для обработки данных и полезны для будущего использования для получения лучших результатов. Я использовал Python , вы будете использовать любой язык, на котором..

Инженерный искусственный интеллект: изучение тонкостей и проблем создания…
Введение: В последние годы область искусственного интеллекта (ИИ) пережила огромный рост, при этом системы ИИ все больше интегрируются в различные аспекты современной жизни. Разработка искусственного интеллекта включает в себя проектирование, разработку и совершенствование алгоритмов и моделей, которые позволяют машинам имитировать человеческий интеллект и решать сложные проблемы. В этом всестороннем исследовании мы углубимся в междисциплинарный характер разработки ИИ, основные..

Способы обработки категориальных столбцов с отсутствующими данными и их реализации
В моем последнем блоге Ссылка я объяснил различные способы обработки отсутствующих данных в непрерывном столбце и их реализацию. В этом блоге я объясню, как обрабатывать отсутствующие значения столбца категориальных данных в наборе данных с помощью реализации с использованием python. Дискретные / категориальные данные: дискретные данные - это количественные данные, которые можно подсчитать и которые имеют конечное число возможных значений или данных, которые можно разделить на..