Публикации по теме 'statistics'


Почему уменьшение размерности имеет решающее значение в моделях машинного обучения?
Привет, ребята, Высокая размерность создает проблемы с точностью производительности моделей машинного обучения. В этой статье я исследовал важность уменьшения размерности при построении моделей машинного обучения и обсудил, почему высокая размерность влияет на производительность моделей машинного обучения/статистических моделей. Здесь я коснулся следующих вопросов: Что такое высокая размерность? Какие трудности вызывает высокая размерность? Что такое проклятие размерности?..

Советы и хитрости Pythonic - поиск GCD и LCM
Путь Змеи Советы и хитрости Pythonic - поиск GCD и LCM Как получить наибольший общий знаменатель и наименьший общий множитель с помощью Python Для многих из нас поиск наибольшего общего знаменателя между числами был обычным делом в математике в начальной школе. Однако в реальном мире поиск НОД может составлять неотъемлемую часть наших алгоритмов и анализа. В этой статье мы рассмотрим, как получить НОД при различных сценариях. Давайте начнем! «Создайте функцию, которая будет..

Понимание показателей классификации: путь к оценке модели
В шумном мире машинного обучения задачи классификации занимают важное место. Модели классификации вездесущи, будь то прогнозирование того, является ли электронное письмо спамом или нет, или определение вероятности наличия у пациента конкретного заболевания. Однако просто построить модель недостаточно. Точная оценка его эффективности имеет первостепенное значение. Введите метрики классификации — критерии оценки модели. Давайте погрузимся. Бинарная классификация, задача отнесения..

Итерация политики - простой пример
Итерация политик - это способ найти оптимальную политику для заданных состояний и действий. Предположим, у нас есть политика (𝝅: S → A), которая назначает действие каждому состоянию. Действие 𝝅 (s) будет выбираться каждый раз, когда система находится в состоянии s. Идея итерации политики Оценить данную политику (например, инициализировать политику произвольно для всех состояний s ∊ S) путем вычисления функции ценности для всех состояний s S в рамках данной политики..

Непрерывное распределение вероятностей
Определение Равномерное распределение Вопросы: Если X1 и X2 оба из равномерного распределения, как насчет X1 + X2, X1 * X2, max(X1, X2), min(X1, X2), 1-X1? Нормальное распределение Тест нормальности включает W-тест Шапиро-Уилка, тест Андерсона-Дарлинга (AD-тест) и тест Колмогорова-Смирнова. Если log(x) имеет нормальное распределение, мы говорим, что x имеет логарифмически нормальное распределение Экспоненциальное распределение Смоделируйте время,..

Кластеризация в управлении капиталом: оригинальный способ визуализации поведения клиентов
Управление капиталом состоит в управлении инвестициями от имени других. Чтобы предоставлять наилучшие услуги, управляющим активами крайне важно понимать поведение клиентов. Вот почему в частных банках принято искать закономерности в данных клиентов. Кластеризация является распространенным методом для достижения этой цели. Однако одной из ключевых проблем при таком подходе является отображение и интерпретация результатов. В этой статье я кратко расскажу о кластеризации и, самое главное,..

Как определить количество ячеек гистограммы?
В этой статье объясняются два часто используемых метода для расчета количества интервалов гистограммы. Что такое гистограмма? Гистограмма отображает частоту (количество) числовой переменной, разбивая ее на ячейки (интервалы). По оси абсцисс гистограммы показаны интервалы, а по оси ординат - частота выборок в этих интервалах. Форма гистограммы может варьироваться в зависимости от количества интервалов. Следовательно, важно выбрать правильное количество интервалов для правильного..