Публикации по теме 'accuracy'


Является ли точность надежным показателем производительности модели для несбалансированного набора данных?
Наиболее распространенной оценочной метрикой, используемой для измерения производительности модели классификации, является Точность. Хотя точность оказалась важной метрикой, она недостаточно надежна, когда дело доходит до работы с наборами данных дисбаланса. В этой статье я объясню, почему точность не следует рассматривать в качестве основного показателя для оценки производительности модели на несбалансированных данных. Как правило, в практических сценариях наборы классификационных..

Показатели эффективности моделей
В школах и колледжах регулярно проводятся тесты. Основная идея заключается в измерении успеваемости учащихся. Чтобы понять, что является их сильной стороной и над чем им нужно работать усерднее. Аналогичным образом мы также тестируем нашу модель машинного обучения, чтобы измерить их производительность, и на основе этой производительности мы пытаемся понять, что модель делает правильно и где ей нужно работать усерднее (в основном нам нужно работать усерднее). В области машинного обучения,..

Логистическая регрессия
Логистическая регрессия — это статистический метод, используемый для моделирования вероятности бинарного результата (т. е. переменной, которая может принимать одно из двух возможных значений, например 0 или 1). Это тип обобщенной линейной модели, в которой используется логистическая функция для моделирования связи между независимыми переменными и вероятностью зависимой переменной. Логистическая функция представляет собой сигмовидную кривую, которая находится в диапазоне от 0 до 1 и..

FedAvg упрощенный
Федеративное обучение — это метод машинного обучения, который позволяет нескольким устройствам, например смартфонам или периферийным устройствам, совместно обучать модель, сохраняя свои данные на устройствах и никогда не отправляя их на центральный сервер. Этот подход имеет несколько преимуществ, таких как защита конфиденциальности и возможность обучать модели на гораздо большем наборе данных, распределенном по устройствам. Один из популярных методов реализации федеративного обучения..

Матрица путаницы и дисбаланс данных (3/3)
Предыдущий ‹‹ Матрица путаницы и дисбаланс данных (2/3) Здесь мы узнаем о различных метриках, используя их для объяснения результатов, полученных из модели двоичной классификации, которую мы построили в предыдущем упражнении. Визуализация данных Мы еще раз воспользуемся набором данных с разными классами объектов, найденных на горе: import pandas import numpy !wget https://raw.githubusercontent.com/MicrosoftDocs/mslearn-introduction-to-machine-learning/main/graphing.py !wget..

Работа с несбалансированным набором данных
В этом уроке мы решаем проблему несбалансированного набора данных и узнаем, как легко их обнаружить, и технику SMOTE. Допустим, вы только что закончили колледж и ищете работу. Одна из компаний, в которую вы обращались ранее, отправила вам тематическое исследование, включая задачу классификации. Вы выполнили предварительную обработку, внедрили различные методы, нашли правильную модель и т. д. модель для тестового набора, посмотрите, как она может управлять невидимыми данными, и вы..

Какие метрики выбрать для ML?
Когда я работал над несколькими наборами данных, я был сбит с толку, какая метрика является точной, чтобы дать мне ответ на мою мысль «Как мне получить максимально правильную модель?» Увы, после внедрения нескольких наборов данных я получил ответ… ни одна из метрик не является хорошей или плохой для выбора модели… все зависит от того, «какую бизнес-задачу вы пытаетесь решить с помощью модели?» Чтобы понять приведенное выше утверждение, давайте углубимся. Матрица путаницы показывает..