Пассивная реконструкция холодного содержимого снежного покрова

Задний план

Горный снежный покров в средних широтах представляет собой сезонную водонапорную башню, которая сильно меняется от года к году. Как водный ресурс, довольно большие снежные покровы могут представлять опасность наводнений, в то время как небольшие снежные покровы могут усугублять засушливые условия в некоторых регионах. Таким образом, важно уметь понимать и прогнозировать количество снежного покрова и время его таяния. Одним из ключевых требований (хотя и не исчерпывающим) является определение его холодного содержания (CC) или количества энергии, необходимого для его плавления. Это функция плотности снежного покрова и температурного профиля, которые могут быть измерены с помощью снежной ямы или стратифицированных датчиков. Эти подходы к измерениям затрудняют определение характеристик CC над горным хребтом без сложной, физически обоснованной модели земной системы, которая требует подробной информации о погоде. Возникает вопрос, в какой степени экономная модель может предсказать CC?

В этой статье представлено краткое исследование подхода машинного обучения к оценке CC. Я изучаю несколько различных моделей перед проведением нескольких экспериментов по удержанию данных с использованием как спутниковых, так и наземных измерений с хорошо оснащенного исследовательского участка, которые затем сравниваются с опубликованными оценками CC из физической модели.

Сайт и данные исследования

Район долгосрочных экологических исследований на хребте Нивот расположен в Скалистых горах штата Колорадо, США, к востоку от континентального водораздела. Он содержит несколько метеорологических станций, охватывающих субальпийские, альпийские и высокогорные районы, с ежечасными измерениями, начиная с 1990 года. Снежные съемки проводятся несколько раз в месяц в течение снежного сезона, на которых записываются стратифицированные измерения температуры и плотности снега, на основании которых можно определить CC. рассчитано. Здесь я использую измерения с альпийского участка (3528 м), так как он имеет рекорд самой плотной снежной ямы для тренировки и оценки смоделированного CC (343 ямы с 1995 по 2016 год). Как метеорологические (температура воздуха, относительная влажность, скорость ветра), так и измерения снежной ямы были получены от Jennings et al. (2018) .

Почасовые измерения водного эквивалента снега (SWE) производятся на снежной подушке возле субальпийского участка, находящегося под управлением Службы охраны природных ресурсов, которая контролирует обширную сеть телеметрии снежного покрова (снотель) на западе США. Следует отметить, что измерения SWE ближе к субальпийскому участку, чем к альпийскому (~ 2–3 км друг от друга). Истинное поведение альпийского SWE может отличаться, особенно во время сезона таяния, что может ухудшить оценки CC. Это ограничение ставит под сомнение подход машинного обучения, позволяющий успешно использовать прокси-измерение вероятной (но неизвестной) корреляции с истиной.

То же самое можно сказать и о спутниковых измерениях дистанционного зондирования, поскольку они являются косвенными и часто ограничиваются другими физическими величинами через алгоритмы для получения интересующей величины. Тем не менее, они открывают многообещающие возможности для описания и понимания земных систем в крупном масштабе. Здесь я использовал суточные пассивные микроволновые яркостные температуры с разрешением 3,125 км (TB, Brodzik et al., 2016) от ближайшей к площадке точки сетки. Было показано, что межканальные различия помогают в оценках SWE с помощью дистанционного зондирования (например, Bair et al. 2018). TB здесь и далее относится к разнице между каналами 37 ГГц и 85 ГГц на борту датчиков SSMI. Из-за того, что значения часто отсутствуют, я использовал как тропический (ночной), так и северный (утренний) проход. Пропущенные тропические значения были заполнены северными значениями, скорректированными на систематическую ошибку, для каждого снежного сезона. Данные каждого сезона были сглажены кубическим сплайном, чтобы заполнить оставшиеся пробелы, которые длились не более 3–4 дней.

Переменные-предикторы

Все предикторы (14) перечислены и описаны в таблице 1. Некоторые из них взяты в день целевого измерения (Дата, TB, SWE), в то время как большинство представляют собой сводку за предыдущие 30 дней, предшествовавших целевому измерению. Каждый предсказатель классифицируется по соответствующему потоку данных (метеорология, спутниковый эллит или снотел). Обратите внимание, что Date и Cold-hrs (a) применимы ко всем потокам. Это связано с тем, что на сайтах SNOTEL датчики температуры часто размещаются на снежной подушке, и это позволяет представить сценарий дистанционного зондирования, основанный на температуре воздуха и TB.

Выбор модели

Данные обучения были случайным образом разделены из 343 целевых точек, 25 процентов из которых были удержаны для проверки тестовых структур, описанных ниже. Описанные мной схемы оказались наиболее эффективными для этого конкретного набора данных после краткого анализа чувствительности параметров. Все предикторы были стандартизированы перед обучением, и все моделирование проводилось с использованием библиотеки Python sklearn.

Регрессия главных компонентов (PC. R)

Мультиколлинеарность предикторов (рис. 1) гарантирует исчерпание избыточных корреляций перед применением линейной регрессии. CC в этом случае регрессировал по первым 9 основным компонентам, которые объясняют 99 процентов его изменчивости.

Регрессия опорных векторов (SV. R)

В структуре машины опорных векторов использовалось ядро ​​гауссовой радиальной базисной функции с параметрами C = 10 и epsilon = 1.0.

Ансамбли дерева решений

Первый метод ансамбля (из трех) представлял собой случайный лесной регрессор (RF), имеющий максимальную глубину 15 и минимальную выборку разделения / листьев 3. Второй использовал агрегацию начальной загрузки (Bag), а третий использовал AdaBoost (AdaB) с решением оценщик базы дерева, имеющий максимальную глубину 15. В каждом подходе использовалось 1000 оценщиков.

Диаграммы рассеяния, кривые характеристики ошибки регрессии (REC) и диаграмма Тейлора для каждого случая показаны на рисунке 2, которые демонстрируют, что методы ансамбля превосходят два других. Оба SV. R и ПК. R имеет тенденцию недооценивать большие значения CC и иногда возвращает физически невозможные (т.е.отрицательные) значения. Ансамблевые подходы полностью избегают этой тенденции и работают аналогично. Подход повышения производительности незначительно превосходит структуры RF и Bag (с оценкой отсутствия из сумки 0,64) и используется в следующих экспериментах.

Эксперименты по удержанию данных

Пять случаев «недостающих данных» были исследованы путем перестановки нескольких из трех потоков данных (таблица 1). Таблица 2 определяет каждый случай, производительность которого, как я предполагал, будет ухудшаться. В настройке модели для каждого из них использовалось одинаковое количество оценок, но максимальная глубина была скорректирована так, чтобы она была на единицу больше, чем количество предикторов в каждом сценарии.

На рисунке 3 сравниваются характеристики моделей, которые показывают, как ухудшается точность модели без информации SWE. Удержание только SWE (то есть случай SAT + MET) оставляет работу большинства предсказателей, но оценки CC страдают гораздо больше. Оба случая, как и в случае SAT, склонны сгруппировать свои прогнозы по климатологическому среднему ненулевому CC (~ 3,8 МДж) вместо того, чтобы фиксировать наблюдаемые хвосты CC.

Это заслуга самого SWE, который является частью расчета CC. Таким образом, эти результаты означают конгруэнтное поведение SWE на субальпийских и альпийских участках, разделенных километрами. Это также означает, что спутниковые измерения (микроволновые) должны быть дополнены вспомогательной информацией о погоде, поверхности земли или более разнообразной спектральной информацией, чтобы они были эффективны для характеристики снежного покрова. Важность разложения (рис. 4) подчеркивает этот момент, показывая, что CC объясняется главным образом SWE, температурой воздуха и скоростью ветра.

При наличии информации SWE оценки CC с помощью машинного обучения конкурируют с оценками, полученными на основе физической модели снежного покрова (таблица 3, Jennings et al. 2018), в то время как оценки, полученные только на основе метеорологической или спутниковой информации, работают менее удовлетворительно.

Заключительное замечание

В целом, модель машинного обучения может начать успешно оценивать труднодоступный снежный покров без физической модели, но только при наличии подробной информации о чуть менее труднодоступных свойствах. Снежные съемки или метеорологические / снотельные станции нельзя проводить через каждые несколько метров горного хребта, поэтому пространственное распределение снежного покрова является давней проблемой.

использованная литература

[1] Э. Баир, А.А. Кальфа, К. Риттгер и Дж. Дозье, Использование машинного обучения для оценки водного эквивалента снега в режиме реального времени в водосборных бассейнах Афганистана (2018), Криосфера, 12, 1579– 1594, https://doi.org/10.5194/tc-12-1579-2018.

[2] М.Дж. Бродзик, Д.Г. Лонг, М.А. Хардман, А. Пэджет и Р. Армстронг, Калиброванная температура яркости пассивного микроволнового излучения EASE-Grid 2.0 с улучшенным разрешением, ESDR, версия 1 [SSMI] (2016 г.), Национальное агентство NASA Центр распределенного активного архива центра данных по снегу и льду, https://doi.org/10.5067/MEASURES/CRYOSPHERE/NSIDC-0630.001. [2020–11–27].

[3] К.С. Дженнингс, Т.Г.Ф. Киттель и Н.П. Молотч, Приведенные наблюдения и моделирование сезонной эволюции холодного содержания снежного покрова и его связи с таянием снега и энергетическим бюджетом снежного покрова (2018), Криосфера, 12, 1595 –1614, https://doi.org/10.5194/tc-12-1595-2018.