Как Мы Отказались От Нейросетей, А Потом Вернули Их В Прогноз Осадков Яндекс.погоды

Мы уже рассказывали вам, как работает Яндекс.

Погода сверхкраткосрочный прогноз осадков на метеорологических радарах и спутниковые наблюдения .

Сегодня мы расскажем, как нам удалось улучшить качество такого прогноза за счет внедрения нейросетевых подходов и почему мы уже отказались от них в прошлом.

Также вы узнаете, как мы улучшили визуальное восприятие самой карты на границе радиолокационных и спутниковых наблюдений.

И снова о прогнозировании текущей погоды

Когда мы говорим о прогнозе погоды, мы чаще всего имеем в виду температуру и осадки, например, на завтра или ближайшие выходные.

В этом случае достаточно традиционных погодных тенденций.

Но если вы выходите на улицу пообедать или прогуляться с ребенком и не хотите попасть под дождь, то важно знать точный момент начала дождя в течение следующих получаса.

В таких ситуациях на помощь приходит наша карта осадков, известная как прогноз погоды.

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Рисунок 1. Карта осадков Яндекс.

Погода прогноз текущей погоды — сверхкраткосрочный прогноз погоды (до 2–6 часов) с шагом 5–15 минут, предсказывающий поведение погодных явлений с коротким жизненным циклом.

Такой прогноз в той или иной степени сводится к задаче экстраполяции наблюдаемых метеорологических явлений, поскольку реальные тяжелые физические модели для него менее пригодны и не могут оперативно учитывать быстро меняющиеся условия.

Поскольку мы говорим о карте осадков, нас интересует источник данных об областях скопления влаги в воздухе, имеющий относительно высокую частоту обновления.

Лучшими вариантами для этого являются метеорадиолокаторы, предоставляющие такую информацию непосредственно в виде изображений, и геостационарные спутники, изображения с которых необходимо предварительно обрабатывать.

Как решить

Если предположить, что прогноз текущей погоды сводится к задаче экстраполяции (рис.

2), то формальное определение будет выглядеть так:

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Где

— кадр с метеорологического радара и/или спутника,

— количество кадров, на основе которых делается прогноз,

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

— количество прогнозируемых кадров.

В этом случае можно интерпретировать кадр как обычную картинку и свести задачу к работе с видеоизображением.

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Рисунок 2. Пример изображений метеорологического радара.

Вверху: пример входных фреймов для модели.

Внизу: ожидаемое количество кадров во время прогнозирования.

Здесь

, А

Мы прогнозируем на два часа вперед с шагом в 10 минут. Это 12 кадров плюс еще несколько в запасе на случай перебоев в подаче данных с РЛС.

Чаще всего решение такой задачи сводится либо к использованию алгоритмов оптических потоков ( 1 , 2 , 3 ), или методам нейронной сети ( 1 , 2 , 3 , 4 , 5 , 6 ).

Долгое время в продакшене у нас был алгоритм на основе оптического потока, который мы смогли настроить так, что он превосходил нашу предыдущую архитектуру нейросети по метрикам.

Далее мы поговорим о том, как мы наконец-то обошли оптический поток и сделали более качественный прогноз с помощью нейронных сетей.

Сетевая архитектура

За основу мы взяли архитектуру PredRNN++.

[Ванг и др.

; ICML '18] .

Основное нововведение статьи - модификация классического Ячейки ConvLSTM .

Авторы добавили вход для пространственной памяти (обозначение

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

в статье) и расширил выходной вентиль, чтобы научиться его учитывать (рис.

3).

Утверждается, что это помогает лучше запоминать пространственные изменения последовательности кадров видеоряда.

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Рисунок 3. Причинная архитектура рекуррентных ячеек LSTM. Отличие от ConvLSTM выделено красным.

( Источник ) При решении задачи мы перешли от обычной регрессии интенсивности осадков в мм/ч для отдельного пикселя к прогнозированию областей осадков и их типа (легкие, сильные или очень сильные), что эквивалентно задаче сегментации изображения.

на три класса.

Только для изображений из будущего, которого мы еще не знаем.

В качестве функции потерь использовалась классическая сумма перекрестной энтропии и игральных костей:

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Где

является примером из обучающего набора, и

— прогнозируемая стоимость.

Результаты

При сравнении новой модели с предыдущей мы рассматривали как стандартные метрики для задач сегментации и классификации (F1, IoU), так и специально построенные метрики, отражающие восприятие прогноза пользователем (например, долю идеальных прогнозов).

Это помогло, среди прочего, улучшить то, что наши пользователи видят в прогнозе и как они получают из него информацию.

Ниже представлена таблица изменений по сравнению с решением с оптическим потоком:

Метрики	Изменять, %
F1, в среднем за 2 часа	+7,6
ЙоУ, во-первых. шаг	+3,5
IoU, второй шаг	+6,1
Процент идеальных прогнозов	+2,2
Доля точно предсказанных дождей	+6,0

Если F1 и IoU — широко известные метрики, то на последних двух стоит остановиться, поскольку именно они характеризуют восприятие прогноза пользователем.

Доля правильно спрогнозированных наступлений дождя представляет собой отношение количества правильно спрогнозированных первых дождей в данном двухчасовом окне ко всем случаям начала первого дождя в двухчасовых окнах.

А доля идеальных прогнозов показывает, какая часть двухчасовых последовательностей предсказана без ошибки на любом этапе.

Таким образом, эти метрики позволяют нам оценить пользовательский опыт использования прогнозирования текущей погоды.

Также посмотрим на зависимость метрик от диапазона прогноза:

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Рисунок 4. График зависимости средней IoU от прогнозируемого расстояния между кадрами с течением времени Для расчета оптического потока мы использовали Плотный обратный поиск с постоянным вектором переноса (на графике показан лучший из полученных вариантов), показавший лучшие результаты среди других алгоритмов оптического потока для задачи прогнозирования текущей погоды как в наших экспериментах, так и в эксперименты коллеги.

Эксперименты с PredRNN++ отличаются использованием медианного фильтра на входных данных (поскольку радары иногда зашумлены) и метрикой, по которой выбирался порог бинаризации (F1 или F1.5).

На графике видно, что оптический поток лучше нейронных сетей только в первые десять минут. Затем его прогнозы начинают сильно ухудшаться, и на втором часу он проигрывает всем вариантам.

Кроме того, возвращение нейросетевой архитектуры позволяет еще больше повысить качество прогнозов осадков, поскольку позволяет дополнительно учитывать особенности, которые потенциально помогают прогнозировать внезапное появление или исчезновение зон осадков, в то время как подход, основанный на оптический поток позволяет им перемещаться только вдоль вектора переноса.

Объединение радиолокационных и спутниковых изображений

В последний раз Мы описали, как мы расширили нашу зону прогнозирования текущей погоды за пределы станций метеорологических радиолокаторов с помощью спутниковых изображений.

Напомним, что мы использовали нейронные сети для восстановления радиолокационных полей по спутниковым изображениям.

В данном случае наша модель была близка по качеству к самим радарам, но поскольку спутники и радары на самом деле различаются по способу измерения осадков, области дождя между ними могут не полностью совпадать.

Поэтому нам часто справедливо указывали на резкие границы между зонами радиолокации и спутниковой науки.

Мы использовали нейронные сети и для решения этой задачи — для точного перехода из одной зоны в другую, чтобы карта осадков выглядела более реалистично, а границы были менее заметны для пользователей.

Прежде чем прогнозы можно будет отображать на одной карте, необходимо согласовать изображения с метеорологических радаров и геостационарных спутников.

Это необходимо для того, чтобы избежать границ зоны действия радара и резких изменений зон осадков на границах радиолокационной и спутниковой связи.

Наша идея состоит в том, что мы делаем умную нейронную сеть, склеивающую стыки изображений.

Мы взяли нейросетевой инпейнтинг из NVIDIA , основанный на Unet-подобной архитектуре.

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.

Погоды

Рисунок 5. Пример алгоритма из оригинальной статьи «Рисование изображений неправильных отверстий с использованием частичных сверток» Наглядный пример работы алгоритма, дополняющего недостающие части, можно увидеть на рисунке выше, а также на это видео .

Только вместо завершения изображения на заштрихованной области мы создаем маску на границе радар-спутник, где мы пытаемся восстановить переход осадков между соседними зонами.

Решение этой проблемы состоит из двух этапов:

Производится альфа-смешение радиолокационных и спутниковых изображений – получается постепенный переход от спутника к радиолокационному.
Переход перерисовывается с помощью inpainting, при этом ближе к центру перехода меш получает все меньше данных от входного изображения.

Как мы отказались от нейросетей, а потом вернули их в прогноз осадков Яндекс.
</p><p>
Погоды

Рисунок 6. Сравнение карты осадков без склейки нейросети (слева) и с ней (справа) В результате такой подход позволяет получить единое изображение прогнозов по всей области прогнозирования текущей погоды без резких границ полукруга.

Заключение

Конечно, идеальная точность недостижима.

Человечество все еще учится понимать и предсказывать погоду.

И описанные в посте улучшения не являются потолком для нейросетевых подходов.

Мы продолжаем экспериментировать с другими архитектурами и дополнительными данными, чтобы сделать наш прогноз более надежным.

Будем рады, если описанный опыт поможет и вам.

Теги: #Машинное обучение #математика #Исследования и прогнозы в ИТ #нейронные сети #Геоинформационные сервисы #прогнозирование #прогноз погоды #Яндекс.

погода #Яндекс.

погода #команда Яндекс.

погоды #погода #осадки #радиолокационные системы #научное прогнозирование

Как Мы Отказались От Нейросетей, А Потом Вернули Их В Прогноз Осадков Яндекс.погоды

Последнее изменение: 2024-10-19 21:10:22

Вместе с данным постом часто просматривают:

Как Мы Отказались От Нейросетей, А Потом Вернули Их В Прогноз Осадков Яндекс.погоды

И снова о прогнозировании текущей погоды

Как решить

Сетевая архитектура

Результаты

Объединение радиолокационных и спутниковых изображений

Заключение

Открытие Неизвестных Типов Файлов В Windows

Бисбрук, Джордж Ван

Visa И Mastercard Отреагировали На Заявление Фас О Готовности Возбудить Дело По Тарифам Для Бизнеса

Конец Детства: Авторские Права На Произведения, Созданные Искусственным Интеллектом (Ии)

Тенденции Кибербезопасности От Bi.zone

Обучение Cisco 200-125 Ccna V3.0. День 38. Протокол Etherchannel Для Уровня Osi 2

Devops Или Как Мы Теряем Зарплаты И Будущее Ит-Индустрии

Google Высмеивает Веб-Сервисы Microsoft

Действительно Ли Социальная Среда — Чушь?

Сказка О Том, Насколько Вредной Может Быть Установка Компонентов Из Коробки

Автор Статьи

Роман Иванов

Интересно

Bobocomm – Создатели Рекламы...

Growbydata — Программное Обеспечение Для Конкурентной Разведки...

Neolive - Программное Обеспечение Для Цифровых Вывесок...

Casey Powell Lacrosse 18 Xbox One X S Активация...

Увеличение Трафика На Выставке За Пределами Выставочного Зала...

Партнерам Нужна Надежная Маркетинговая Стратегия, Чтобы Добиться Успеха В...

Федуленков...

Dima Manisha