Статьи по теме data-science

Публикации по теме 'data-science'

Python: сверкающая жемчужина современных технологий

В сегодняшнюю цифровую эпоху мы стоим на пороге постоянно развивающегося технологического пространства, которое манит гармоничной симфонией технологических чудес. Центральное место в этой симфонии занимает мелодичный инструмент под названием Python. Воплощение простоты и универсальности, Python открыл новую эру в технологиях, которые произвели революцию в том, как мы живем, работаем и думаем. В этой статье мы пройдемся по извилистым тропам влияния Python на современные технологии,..

Дерево решений - метод сокращения затрат - сложность

Машинное обучение - это проблема компромиссов. Классический вопрос - это чрезмерная посадка или недостаточная посадка. Чрезмерная подгонка происходит, когда модель настолько хорошо запоминает свои обучающие данные, что обучается шуму поверх сигнала. Недостаточная подгонка - это противоположное событие: модель слишком проста, чтобы найти закономерности в данных. Излишняя подгонка приводит к более сложным деревьям решений, чем это необходимо, ошибка обучения больше не дает точной..

День 2 из 30 дней Data Engineering

С примерами и проектами… С возвращением на второй день Data Engineering! Что покрыто 30-дневной серией Data Engineering с проектами до сих пор — День 1: что такое инженерия данных, почему инженерия данных, инженеры данных — инженеры машинного обучения — специалисты по обработке и анализу данных, цель и область применения

Как работает анализ основных компонентов в конвейерах машинного обучения, часть 4 (машинное обучение)

Быстрый анализ главных компонентов для крио-ЭМ изображений (arXiv) Автор: Николас Ф. Маршалл , Оскар Микелин , Юнпэн Ши , Амит Сингер Аннотация: Анализ главных компонент (PCA) играет важную роль в анализе крио-ЭМ-изображений для различных задач, таких как классификация, шумоподавление, сжатие и моделирование ab-initio. Мы вводим быстрый метод для оценки сжатого представления двумерной ковариационной матрицы зашумленных проекционных изображений криоэлектронной микроскопии,..

Использование извлечения признаков в различных сценариях, часть 2

Дистилляция знаний для извлечения признаков в подводном VSLAM (arXiv) Автор: Цзинхэ Ян , Мингминг Гонг , Гириш Наир , Чон Хун Ли , Джейсон Монти , Е Пу . Аннотация: В последние годы обнаружение и сопоставление признаков на основе обучения превзошли методы, разработанные вручную, в случаях полета в воздухе. Однако изучить особенности подводного сценария сложно из-за отсутствия аннотированных наборов подводных данных. В этом документе предлагается кросс-модальная структура..

8 лучших алгоритмов машинного обучения

Лучшие алгоритмы машинного обучения, которые должны знать специалисты по данным и инженеры по машинному обучению. Искусственный интеллект возник в ответ на вопрос, могут ли машины думать, как люди. ИИ — одна из самых популярных областей исследований сегодня. Машинное обучение — это подмножество ИИ, которое дает машине возможность автоматически учиться на основе опыта без явного программирования. Многие проблемы, которые невозможно решить с помощью классических статистических методов,..

Смещение и дисперсия

В вашем проекте машинного обучения при обучении и оценке модели, чтобы повысить производительность, вы должны получить больше обучающих данных или оптимизировать гиперпараметры и/или использовать другой алгоритм. Чтобы решить это, вам нужно понять два важных типа ошибок в ML, а именно смещение и дисперсию. В любом эксперименте по машинному обучению у вас будет набор данных для обучения, на котором вы будете обучать свою модель, и набор данных для тестирования/разработки/удержания для..