Публикации по теме 'data-science'
Python: сверкающая жемчужина современных технологий
В сегодняшнюю цифровую эпоху мы стоим на пороге постоянно развивающегося технологического пространства, которое манит гармоничной симфонией технологических чудес. Центральное место в этой симфонии занимает мелодичный инструмент под названием Python. Воплощение простоты и универсальности, Python открыл новую эру в технологиях, которые произвели революцию в том, как мы живем, работаем и думаем. В этой статье мы пройдемся по извилистым тропам влияния Python на современные технологии,..
Дерево решений - метод сокращения затрат - сложность
Машинное обучение - это проблема компромиссов. Классический вопрос - это чрезмерная посадка или недостаточная посадка. Чрезмерная подгонка происходит, когда модель настолько хорошо запоминает свои обучающие данные, что обучается шуму поверх сигнала. Недостаточная подгонка - это противоположное событие: модель слишком проста, чтобы найти закономерности в данных.
Излишняя подгонка приводит к более сложным деревьям решений, чем это необходимо, ошибка обучения больше не дает точной..
День 2 из 30 дней Data Engineering
С примерами и проектами…
С возвращением на второй день Data Engineering!
Что покрыто 30-дневной серией Data Engineering с проектами до сих пор —
День 1: что такое инженерия данных, почему инженерия данных, инженеры данных — инженеры машинного обучения — специалисты по обработке и анализу данных, цель и область применения
Как работает анализ основных компонентов в конвейерах машинного обучения, часть 4 (машинное обучение)
Быстрый анализ главных компонентов для крио-ЭМ изображений (arXiv)
Автор: Николас Ф. Маршалл , Оскар Микелин , Юнпэн Ши , Амит Сингер
Аннотация: Анализ главных компонент (PCA) играет важную роль в анализе крио-ЭМ-изображений для различных задач, таких как классификация, шумоподавление, сжатие и моделирование ab-initio. Мы вводим быстрый метод для оценки сжатого представления двумерной ковариационной матрицы зашумленных проекционных изображений криоэлектронной микроскопии,..
Использование извлечения признаков в различных сценариях, часть 2
Дистилляция знаний для извлечения признаков в подводном VSLAM (arXiv)
Автор: Цзинхэ Ян , Мингминг Гонг , Гириш Наир , Чон Хун Ли , Джейсон Монти , Е Пу .
Аннотация: В последние годы обнаружение и сопоставление признаков на основе обучения превзошли методы, разработанные вручную, в случаях полета в воздухе. Однако изучить особенности подводного сценария сложно из-за отсутствия аннотированных наборов подводных данных. В этом документе предлагается кросс-модальная структура..
8 лучших алгоритмов машинного обучения
Лучшие алгоритмы машинного обучения, которые должны знать специалисты по данным и инженеры по машинному обучению.
Искусственный интеллект возник в ответ на вопрос, могут ли машины думать, как люди. ИИ — одна из самых популярных областей исследований сегодня. Машинное обучение — это подмножество ИИ, которое дает машине возможность автоматически учиться на основе опыта без явного программирования. Многие проблемы, которые невозможно решить с помощью классических статистических методов,..
Смещение и дисперсия
В вашем проекте машинного обучения при обучении и оценке модели, чтобы повысить производительность, вы должны получить больше обучающих данных или оптимизировать гиперпараметры и/или использовать другой алгоритм. Чтобы решить это, вам нужно понять два важных типа ошибок в ML, а именно смещение и дисперсию.
В любом эксперименте по машинному обучению у вас будет набор данных для обучения, на котором вы будете обучать свою модель, и набор данных для тестирования/разработки/удержания для..