Публикации по теме 'ml-so-good'


Регрессия больших данных — Полный конвейер — Часть 1/2
TL; DR В этой статье, состоящей из двух частей, представлен всесторонний взгляд на реальную проблему больших данных регрессии, включая код и подробный анализ. Часть 1 (эта статья) в основном посвящена EDA и моделированию поверхностного обучения, а часть 2 в основном посвящена моделированию глубокого обучения. Повестка дня Описание проблемы и набора данных Исследовательский анализ данных (EDA) Моделирование поверхностными методами 1. Описание проблемы и набора данных..

Поиск работы в трех крупных компаниях: мои идеи для успешной карьеры в сфере данных
Нанять отраслевых гигантов: как это сделать? Содержание: Обо мне и остановке моей карьеры Как устроиться на работу: ориентироваться на рынке труда Почему они наняли вас? Мой путь к трудоустройству Демонстрация своей уникальности: искусство самопрезентации Ваше терпение Если бы у меня был шанс начать все сначала: извлеченные уроки В этой статье я расскажу вам, как попасть на работу в три отраслевых гиганта в области данных и машинного обучения: FPT Software,..

Актуальные вопросы машинного обучения – 8
Корреляция и предположения. Вопросы В чем разница между ковариацией и корреляцией ? Каковы некоторые недостатки использования корреляции, т.е. каковы ее ограничения? Можете ли вы назвать лучшую альтернативу корреляции? Чтобы сделать вывод о данных, нам нужно сделать предположения. Предположим, вы тренируетесь полностью…

Вывод по графическим моделям — Часть 1
В этой статье мы начнем серию статей о логических выводах на графических моделях. В этой серии мы увидим, что структура сети, т. е. утверждения об условной независимости и связанная с ними факторизация совместного распределения, важна для нашей способности даже делать выводы. В первую очередь мы сосредоточимся на запросах с условной вероятностью, т. е. на запросах, которые имеют следующую форму: P(Y | X= x). В этой статье мы начнем с простого анализа сложности как точных , так и..

Обучение в ансамбле — Бэггинг с Python
Руководство по реализации бэггинга с помощью scikit-learn. Ансамблевое обучение помогает повысить производительность модели машинного обучения за счет объединения нескольких моделей. Этот подход обеспечивает лучшую прогностическую эффективность по сравнению с одной моделью. В этом посте я раскрою следующие темы. Что такое бэгинг? Построение модели с помощью scikit-learn Дерево решений против мешков Прежде чем приступить к работе, мы создаем контент, связанный с наукой о..

Приступаем к машинному обучению с AWS
Что такое машинное обучение? Машинное обучение (ML) — это метод разработки программного обеспечения, который позволяет компьютерам решать сложные задачи, используя образцы из реальных данных. Таким образом, этот метод позволяет компьютеру автоматически учиться и совершенствоваться с опытом, если он не запрограммирован на это явно. Как это работает? При традиционном решении проблем с программной инженерией инженер собирает данные и анализирует реальную проблему. Они..

Используйте SelectPercentile sklearn для выбора объектов в наборе данных сонара.
Выбор признаков в машинном обучении — это процесс уменьшения количества входных переменных при разработке прогностической модели. Желательно уменьшить количество входных признаков, чтобы снизить вычислительные затраты на моделирование и, в некоторых случаях, повысить производительность модели.