Публикации по теме 'hypothesis-testing'


Все, что вам нужно знать о проверке гипотез в машинном обучении
Что такое проверка гипотез? Образец посредством исследовательского анализа данных и выводной статистики мы получаем информацию о образце. Теперь мы хотим использовать эту информацию для прогнозирования значений для всего населения. делается для подтверждения нашего наблюдения за населением с использованием выборочных данных в пределах желаемого уровня ошибки. С помощью проверки гипотез мы можем определить, достаточно ли у нас статистических данных, чтобы сделать вывод, верна ли..

Проверка гипотез, часть 2
P-значение P-значение – это вероятность получения выборки как или более экстремальной (имеющей больше доказательств против H₀ ), чем наша собственная выборка, с учетом нулевой гипотезы. ( H₀ ) верно. Допустим, я провожу эксперимент, в котором я посылаю кого-то (взяв опекуна из Doom 2) украсть горох. Это испытание Бернулли, поскольку результаты эксперимента либо крадут горох, либо нет (результат типа «да/нет»). Это испытание становится биномиальным распределением, то есть..

Проверка гипотез для машинного обучения
Определение Википедии: проверка статистической гипотезы  — это метод статистического вывода, используемый для определения того, достаточно ли имеющиеся данные подтверждают конкретную гипотезу. Проверка гипотез позволяет нам делать вероятностные утверждения о параметрах совокупности. Проверка гипотез позволяет нам проверить взаимосвязь между функциями в нашем наборе данных, например, оценить значимость корреляции между переменными. Проводя проверку гипотезы, мы можем определить,..

Проверка гипотез — Повседневные заметки
Отказ от ответственности. Этот блог предназначен для всех, кто хочет немного разобраться в проверке гипотез в машинном обучении. Эксперт или новичок, это для тех, кому интересно знать. Я хочу поделиться с вами кое-чем о машинном обучении (ML). Я изучаю ML уже довольно давно. При обучении машины возникает масса сложностей. Алгоритмы машинного обучения разработаны таким образом, чтобы они могли учиться на данных в строго структурированной и контролируемой среде. В отличие от..

A / B-тестирование: подход Python (часть 2)
Мы уже выполнили EDA для нашего набора данных, взятого из задачи Kaggle. Набор данных основан на игре под названием cookie cats. Чтобы разобраться в выбранных показателях, формулировке гипотез, размере выборки и коэффициенте удержания, пожалуйста, прочтите мою другую статью . T-тест Чтобы сравнить разницу между средними значениями двух разных групп, взятых из одной и той же совокупности, мы используем статистический инструмент, известный как t-критерий независимых выборок...

Машинное обучение - научный подход
Машинное обучение часто входит в число основных навыков, перечисленных в резюме специалиста по данным (а у меня оно определенно есть). Некоторые считают, что это даже синоним Data Science, а для большинства команд Data Science это основной элемент повседневной жизни. Споры, которые я часто веду с другими практиками машинного обучения, касаются того, как создать набор функций. Как правило, существует два лагеря: лагерь «добавьте все возможные функции и позвольте алгоритму сделать свою..

Логическая статистика - проверка гипотез
Логика проверки гипотез и типы ошибок Вы могли встретить бесчисленное количество утверждений и утверждений, связанных с цифрами, особенно в маркетинговых кампаниях и рекламе. «9 из 10 врачей рекомендуют зубную пасту Colgate» или «Деттол убивает 99,9% бактерий» - вот классические примеры числовых утверждений. Статистическая достоверность таких утверждений относительно какого-либо параметра может быть проверена, если вы соберете некоторые образцы данных и выполните над ними определенные..