Почти год назад мне выпала честь совершить восхождение на одну из самых сложных гор в хребтах Североамериканского каскада — гору РЕНЬЕ.

Гора Ренье — это действующий вулкан высотой 15000 футов, покрытый льдом, расположенный недалеко от Сиэтла, штат Вашингтон. Каждый год сотни людей пытаются подняться на гору, и только одной трети удается восхождение на вершину, в основном из-за пересеченной местности, неожиданных изменений погоды на пути восхождения и в зависимости от уровня физической подготовки альпинистов. По данным NPS, за последние 10 лет было предпринято около 10 940 попыток восхождения, из которых 5 250 удалось достичь края кратера.

Наша команда из 12 человек, включая 4 гида, представляла собой смешанную группу людей. Пара, которая уже предпринимала попытки восхождения на гору Ренье раньше, трое других, у которых был опыт альпинизма, а остальные двое, включая меня, являются полными новичками в альпинизме, но с некоторой предварительной подготовкой. Вся команда успешно поднялась на вершину. Нас отметили как одну из сильнейших команд, с которыми работали гиды.

Эта статья представляет собой попытку описать, как можно использовать алгоритмы машинного обучения для прогнозирования успешности восхождения на вершину в определенный день и по заданному маршруту, используя историческую статистику восхождений и информацию о погоде, собранную за определенный период времени.

Анализ был построен на данных за 2014 и 2015 годы. Было бы очень полезно, если бы у меня были данные за остальные годы.

Обратите внимание, что этот анализ машинного обучения и модели не учитывают уровни физической подготовки альпинистов при оценке степени успеха, а полагаются исключительно на погоду и маршрут, которые могут быть не идеальной моделью оценки.

Давайте посмотрим на некоторые детали исследовательского анализа данных:

На приведенном ниже графике показано количество попыток и количество успехов в достижении вершины в разные месяцы года.

Анализ показывает, что пиковый период лазания приходится на июнь, июль и август.

Сезон скалолазания начинается во вторую неделю мая и заканчивается к сентябрю. Мне довелось лазить в течение 3-й недели мая, и в этот период, хотя показатели успеха невелики из-за того, что лето еще не началось, лазание гораздо менее сложное из-за твердого снега, который дает хорошее сцепление с каждым. шаг, и маршрут можно было сократить, поднявшись по леднику Ин-Грэма, который не растаял до конца мая. Но следите за этими трещинами.

На графике ниже показаны различные маршруты и их популярность.

Как видите, Путь через Тесак Разочарования — самый правильный маршрут. Восхождение на него не так сложно, как на других маршрутах.

Теперь мы знаем, что маршрут и продолжительность восхождения определяют успех восхождения на вершину, было бы интересно посмотреть, как погодные параметры играют роль в конкретный день.

Изображение выше представляет собой тепловую карту, описывающую корреляцию переменных в наборе данных.

Напряжение батареи и температура имеют отрицательную корреляцию. Умеренная и солнечная радиация имеют положительную корреляцию. Влажность и температура также имеют отрицательную корреляцию. В каком-то смысле столбец «Успех» отрицательно коррелирует со всеми переменными, кроме «Попытка» и «Температура».

Вот еще один способ взглянуть на корреляцию между переменными

С анализом данных здесь сделано еще несколько шагов, которые помогают в прогнозировании

  1. Уменьшение размерности сильно коллинеарных переменных, а также использование важности признаков
  2. Вменение данных для отсутствующих значений и выбросов

И, наконец, применение данных к моделям: я использовал приведенные ниже модели, чтобы предсказать успех восхождения.

  1. Логистическая регрессия
  2. Регрессор опорных векторов
  3. Дерево решений и случайный лес
  4. Методы ансамбля с бэггингом и бустингом
  5. Случайный лес с настройкой гиперпараметров и поиском по сетке

Фактический код модели и подробные шаги находятся здесь — Kaggle- https://www.kaggle.com/codersree/regression-models-to-predict-success-rate

Несмотря на то, что модель может предсказать вероятность успеха, физическое состояние альпиниста играет важную роль.

На самом деле только чистая воля и грация определяют успех восхождения🤞