Публикации по теме 'statistics'


Контроль доступа и элитарность в науке о данных
Если честно, мне часто кажется, что мне нужно показать, что я лучше других. Я могу быть особенно эгоистичным, когда речь идет о вещах, на которых я построил свою личность, о вещах, которыми я очень горжусь, о вещах, которые дают мне чувство собственного достоинства, каким бы поверхностным оно ни было. Поэтому, когда я сталкиваюсь с элитарностью и снобизмом, интеллектуальным контролем в области науки о данных, я полностью понимаю. Когда я слышу, как люди, которые проводят большую часть..

Изучение сложности анализа данных
Проводя статистический анализ данных, мы часто сталкиваемся с непонятными ситуациями, где правда может быть не так очевидна, как может показаться. Анализ данных требует тщательного рассмотрения, поскольку разные точки зрения могут привести к противоречивым выводам. Таким образом, важно изучить данные со всех сторон, прежде чем делать какие-либо выводы. Давайте углубимся в мир парадоксов, рассмотрев несколько реальных примеров, которые подчеркивают важность тщательного анализа данных...

Корреляция VS Ковариация: простой способ
Корреляция VS ковариация: простой способ Всем привет. Это мой второй пост из серии «Машинное обучение», в котором я пытаюсь объяснить концепции машинного обучения с точки зрения непрофессионала. Мы обсудим один популярный вопрос из интервью по машинному обучению: « В чем разница между корреляцией и ковариацией ?» Мы постараемся найти самый простой ответ на вопрос. Хотя и корреляция, и ковариация измеряют взаимосвязь и зависимость между двумя переменными, они различаются в некоторых..

От непрерывного к категориальному: изучение логистической регрессии   —   неделя 3, день 17
Приветствую, энтузиаст данных! Добро пожаловать на 17-й день нашей серии «Python для науки о данных: 100 дней до мастерства». Основываясь на нашем понимании линейной регрессии из 16-го дня, сегодня мы переходим к логистической регрессии — важному инструменту для задач классификации. К концу нашего занятия вы овладеете концепцией и практической реализацией логистической регрессии с использованием Python. Логистическая регрессия: учебник для начинающих В то время как линейная..

Мера изменчивости
Термины «мера изменчивости» и «мера дисперсии» используются в статистике взаимозаменяемо. Оба они относятся к одному и тому же понятию, которое определяет количественную оценку разброса или рассеяния точек данных в наборе данных. Меры изменчивости или дисперсии предоставляют информацию о том, как точки данных распределяются вокруг центральной меры тенденции (такой как среднее значение, медиана или мода), и указывают на разброс или степень, в которой значения отклоняются от центрального..

Как не быть обманутым точностью модели
Визуальное руководство по метрикам модели бинарной классификации и их правильному использованию Фон — простой на поверхности Метрики, используемые для оценки эффективности моделей классификации, довольно просты, по крайней мере, с математической точки зрения. Тем не менее, я заметил, что многие специалисты по моделированию и специалисты по данным сталкиваются с трудностями при формулировании этих показателей и даже применяют их неправильно. Это легко допустить ошибку, поскольку эти..

Что такое начальная загрузка в машинном обучении?
Большая часть статистики связана со сравнением двух вещей и определением того, различаются ли они на самом деле, или же мы случайно наблюдали разницу в собранной нами выборке, но на самом деле разницы нет. Вот что делает статистику такой интересной. Например, действительно ли производительность iphone13 лучше, чем у iphone10? Или модель машинного обучения, которую я построил, действительно лучше существующей системы? Для примера с iphone, как бы вы это сделали? Предположим, вы измеряете..