Публикации по теме 'statistics'
Контроль доступа и элитарность в науке о данных
Если честно, мне часто кажется, что мне нужно показать, что я лучше других. Я могу быть особенно эгоистичным, когда речь идет о вещах, на которых я построил свою личность, о вещах, которыми я очень горжусь, о вещах, которые дают мне чувство собственного достоинства, каким бы поверхностным оно ни было. Поэтому, когда я сталкиваюсь с элитарностью и снобизмом, интеллектуальным контролем в области науки о данных, я полностью понимаю.
Когда я слышу, как люди, которые проводят большую часть..
Изучение сложности анализа данных
Проводя статистический анализ данных, мы часто сталкиваемся с непонятными ситуациями, где правда может быть не так очевидна, как может показаться. Анализ данных требует тщательного рассмотрения, поскольку разные точки зрения могут привести к противоречивым выводам. Таким образом, важно изучить данные со всех сторон, прежде чем делать какие-либо выводы. Давайте углубимся в мир парадоксов, рассмотрев несколько реальных примеров, которые подчеркивают важность тщательного анализа данных...
Корреляция VS Ковариация: простой способ
Корреляция VS ковариация: простой способ
Всем привет. Это мой второй пост из серии «Машинное обучение», в котором я пытаюсь объяснить концепции машинного обучения с точки зрения непрофессионала. Мы обсудим один популярный вопрос из интервью по машинному обучению: « В чем разница между корреляцией и ковариацией ?» Мы постараемся найти самый простой ответ на вопрос.
Хотя и корреляция, и ковариация измеряют взаимосвязь и зависимость между двумя переменными, они различаются в некоторых..
От непрерывного к категориальному: изучение логистической регрессии — неделя 3, день 17
Приветствую, энтузиаст данных! Добро пожаловать на 17-й день нашей серии «Python для науки о данных: 100 дней до мастерства». Основываясь на нашем понимании линейной регрессии из 16-го дня, сегодня мы переходим к логистической регрессии — важному инструменту для задач классификации. К концу нашего занятия вы овладеете концепцией и практической реализацией логистической регрессии с использованием Python.
Логистическая регрессия: учебник для начинающих
В то время как линейная..
Мера изменчивости
Термины «мера изменчивости» и «мера дисперсии» используются в статистике взаимозаменяемо. Оба они относятся к одному и тому же понятию, которое определяет количественную оценку разброса или рассеяния точек данных в наборе данных.
Меры изменчивости или дисперсии предоставляют информацию о том, как точки данных распределяются вокруг центральной меры тенденции (такой как среднее значение, медиана или мода), и указывают на разброс или степень, в которой значения отклоняются от центрального..
Как не быть обманутым точностью модели
Визуальное руководство по метрикам модели бинарной классификации и их правильному использованию
Фон — простой на поверхности
Метрики, используемые для оценки эффективности моделей классификации, довольно просты, по крайней мере, с математической точки зрения. Тем не менее, я заметил, что многие специалисты по моделированию и специалисты по данным сталкиваются с трудностями при формулировании этих показателей и даже применяют их неправильно. Это легко допустить ошибку, поскольку эти..
Что такое начальная загрузка в машинном обучении?
Большая часть статистики связана со сравнением двух вещей и определением того, различаются ли они на самом деле, или же мы случайно наблюдали разницу в собранной нами выборке, но на самом деле разницы нет. Вот что делает статистику такой интересной. Например, действительно ли производительность iphone13 лучше, чем у iphone10? Или модель машинного обучения, которую я построил, действительно лучше существующей системы?
Для примера с iphone, как бы вы это сделали? Предположим, вы измеряете..