Публикации по теме 'statistics'


Моделирование оттока с использованием методов ансамбля (XGBoost) с Python
Преимущества ансамблевых методов, таких как Random Forests, AdaBoost, XGBoost и т. д. Менее подвержены ошибкам из-за выбросов Масштабирование переменных не требуется, поскольку разбиение дерева основано на упорядочении переменных, а не на абсолютном значении. Более устойчивая производительность против пропущенных значений Поддерживает распределенные вычисления, а задания можно разделить на несколько процессоров. Используется в качестве «серебряной пули» в промышленности..

Почему уменьшение размерности имеет решающее значение в моделях машинного обучения?
Привет, ребята, Высокая размерность создает проблемы с точностью производительности моделей машинного обучения. В этой статье я исследовал важность уменьшения размерности при построении моделей машинного обучения и обсудил, почему высокая размерность влияет на производительность моделей машинного обучения/статистических моделей. Здесь я коснулся следующих вопросов: Что такое высокая размерность? Какие трудности вызывает высокая размерность? Что такое проклятие размерности?..

Советы и хитрости Pythonic - поиск GCD и LCM
Путь Змеи Советы и хитрости Pythonic - поиск GCD и LCM Как получить наибольший общий знаменатель и наименьший общий множитель с помощью Python Для многих из нас поиск наибольшего общего знаменателя между числами был обычным делом в математике в начальной школе. Однако в реальном мире поиск НОД может составлять неотъемлемую часть наших алгоритмов и анализа. В этой статье мы рассмотрим, как получить НОД при различных сценариях. Давайте начнем! «Создайте функцию, которая будет..

Понимание показателей классификации: путь к оценке модели
В шумном мире машинного обучения задачи классификации занимают важное место. Модели классификации вездесущи, будь то прогнозирование того, является ли электронное письмо спамом или нет, или определение вероятности наличия у пациента конкретного заболевания. Однако просто построить модель недостаточно. Точная оценка его эффективности имеет первостепенное значение. Введите метрики классификации — критерии оценки модели. Давайте погрузимся. Бинарная классификация, задача отнесения..

Итерация политики - простой пример
Итерация политик - это способ найти оптимальную политику для заданных состояний и действий. Предположим, у нас есть политика (𝝅: S → A), которая назначает действие каждому состоянию. Действие 𝝅 (s) будет выбираться каждый раз, когда система находится в состоянии s. Идея итерации политики Оценить данную политику (например, инициализировать политику произвольно для всех состояний s ∊ S) путем вычисления функции ценности для всех состояний s S в рамках данной политики..

Непрерывное распределение вероятностей
Определение Равномерное распределение Вопросы: Если X1 и X2 оба из равномерного распределения, как насчет X1 + X2, X1 * X2, max(X1, X2), min(X1, X2), 1-X1? Нормальное распределение Тест нормальности включает W-тест Шапиро-Уилка, тест Андерсона-Дарлинга (AD-тест) и тест Колмогорова-Смирнова. Если log(x) имеет нормальное распределение, мы говорим, что x имеет логарифмически нормальное распределение Экспоненциальное распределение Смоделируйте время,..

Кластеризация в управлении капиталом: оригинальный способ визуализации поведения клиентов
Управление капиталом состоит в управлении инвестициями от имени других. Чтобы предоставлять наилучшие услуги, управляющим активами крайне важно понимать поведение клиентов. Вот почему в частных банках принято искать закономерности в данных клиентов. Кластеризация является распространенным методом для достижения этой цели. Однако одной из ключевых проблем при таком подходе является отображение и интерпретация результатов. В этой статье я кратко расскажу о кластеризации и, самое главное,..