Публикации по теме 'hypothesis-testing'
Все, что вам нужно знать о проверке гипотез в машинном обучении
Что такое проверка гипотез?
Образец посредством исследовательского анализа данных и выводной статистики мы получаем информацию о образце. Теперь мы хотим использовать эту информацию для прогнозирования значений для всего населения.
делается для подтверждения нашего наблюдения за населением с использованием выборочных данных в пределах желаемого уровня ошибки. С помощью проверки гипотез мы можем определить, достаточно ли у нас статистических данных, чтобы сделать вывод, верна ли..
Проверка гипотез, часть 2
P-значение
P-значение – это вероятность получения выборки как или более экстремальной (имеющей больше доказательств против H₀ ), чем наша собственная выборка, с учетом нулевой гипотезы. ( H₀ ) верно.
Допустим, я провожу эксперимент, в котором я посылаю кого-то (взяв опекуна из Doom 2) украсть горох. Это испытание Бернулли, поскольку результаты эксперимента либо крадут горох, либо нет (результат типа «да/нет»). Это испытание становится биномиальным распределением, то есть..
Проверка гипотез для машинного обучения
Определение Википедии: проверка статистической гипотезы — это метод статистического вывода, используемый для определения того, достаточно ли имеющиеся данные подтверждают конкретную гипотезу. Проверка гипотез позволяет нам делать вероятностные утверждения о параметрах совокупности.
Проверка гипотез позволяет нам проверить взаимосвязь между функциями в нашем наборе данных, например, оценить значимость корреляции между переменными. Проводя проверку гипотезы, мы можем определить,..
Проверка гипотез — Повседневные заметки
Отказ от ответственности. Этот блог предназначен для всех, кто хочет немного разобраться в проверке гипотез в машинном обучении. Эксперт или новичок, это для тех, кому интересно знать.
Я хочу поделиться с вами кое-чем о машинном обучении (ML). Я изучаю ML уже довольно давно. При обучении машины возникает масса сложностей. Алгоритмы машинного обучения разработаны таким образом, чтобы они могли учиться на данных в строго структурированной и контролируемой среде. В отличие от..
A / B-тестирование: подход Python (часть 2)
Мы уже выполнили EDA для нашего набора данных, взятого из задачи Kaggle. Набор данных основан на игре под названием cookie cats. Чтобы разобраться в выбранных показателях, формулировке гипотез, размере выборки и коэффициенте удержания, пожалуйста, прочтите мою другую статью .
T-тест
Чтобы сравнить разницу между средними значениями двух разных групп, взятых из одной и той же совокупности, мы используем статистический инструмент, известный как t-критерий независимых выборок...
Машинное обучение - научный подход
Машинное обучение часто входит в число основных навыков, перечисленных в резюме специалиста по данным (а у меня оно определенно есть). Некоторые считают, что это даже синоним Data Science, а для большинства команд Data Science это основной элемент повседневной жизни.
Споры, которые я часто веду с другими практиками машинного обучения, касаются того, как создать набор функций. Как правило, существует два лагеря: лагерь «добавьте все возможные функции и позвольте алгоритму сделать свою..
Логическая статистика - проверка гипотез
Логика проверки гипотез и типы ошибок
Вы могли встретить бесчисленное количество утверждений и утверждений, связанных с цифрами, особенно в маркетинговых кампаниях и рекламе. «9 из 10 врачей рекомендуют зубную пасту Colgate» или «Деттол убивает 99,9% бактерий» - вот классические примеры числовых утверждений. Статистическая достоверность таких утверждений относительно какого-либо параметра может быть проверена, если вы соберете некоторые образцы данных и выполните над ними определенные..