Разнообразие температур, наблюдаемое этой зимой, напомнило мне о проекте.
MyCli.me Хабраюзер айб , который собирает прогнозы погоды сразу с нескольких гидрометеорологических сайтов и позволяет повысить их точность за счет усреднения «в голове».
Собственно, полтора года назад, когда я впервые познакомился с сайтом, первое, что меня поразило, это то, что статистика с него является идеальным материалом для неформальной оценки качества прогнозов погоды.
Если быть совсем точным, то на самом сайте есть рейтинговая система надежности прогнозов , выбирая лучшего «прогнозиста» для каждого перечисленного города за прошедший месяц.
Но мне хотелось более длинной и «сбалансированной» оценки.
Входные данные
Города-участники анализа: Москва, Санкт-Петербург, Нижний Новгород, Киев, Сочи – поровну из разных уголков европейской части России и Украины.Красноярск, Новосибирск и другие близлежащие города пришлось исключить из-за частых сильных (до 22 градусов) ошибок на многих метеосайтах, которые в результате сильно меняют общую статистику качества прогнозов.
Период анализа: 3 месяца – ноябрь, декабрь, январь.
Для Москвы за эти 3 месяца максимальная фактическая температура составила +13С, минимальная -23С, т. е.
наблюдался практически весь зимний диапазон значений.
Первый вариант: краткосрочный или долгосрочный
Делаем выборку усредненных значений абсолютной (по модулю) погрешности для разных прогнозов «на 1 день», «на 2 дня»,…, «на 5 дней» (только для дневной температуры).Хочу сразу вас предупредить (потому что неоднократно я сам возмутился ), что ось X слегка приподнята — исключительно для удобства чтения графика.
Второй разрез: день или ночь
Попробуем определить общую точность прогноза на конкретный день.Для этого присвоим веса (коэффициенты) [45%, 25%, 15%, 10%, 5%] ошибкам прогноза на 1, 2,.
и 5 дней соответственно.
Это экспоненциально взвешенное среднее (EMA) с периодом T=2 дня (т.е.
любая пара коэффициентов, отличающихся друг от друга 2 днями, отличается в 2,718 раза).
Логично предположить, что ошибка в прогнозе за сутки до дедлайна может вызвать более неприятные последствия, чем за 4 или 5. Графически веса выглядят примерно так:
Чтобы графическое представление было более понятным, рассчитаем среднюю ошибку с этими весами отдельно для дневных и отдельно для ночных температур и отложим их по разным осям.
Соответственно, признаком качественного прогноза является близость к точке (0;0), этот факт дополнительно выделен штриховкой.
Резкое ухудшение позиций BBC Weather на этом графике интересно тем, что.
ее дневные прогнозы являются одними из самых точных, а ночные прогнозы не входят в пятерку лучших.
В «сухом остатке»
Озвучивать выводы – дело неблагодарное, каждый может сделать их сам.Некоторых больше интересует прогноз «на завтра», других «на 5 дней вперед», для третьих важнее температура в течение дня, а для третьих наоборот. Конечно, некоторых сайтов здесь вообще нет, а некоторые сайты имеют существенные конкурентные преимущества, например, в продолжительности публикуемого прогноза.
Задача заключалась не в том, чтобы найти «лучший метеорологический сайт», а лишь в том, чтобы сравнить точность краткосрочных прогнозов на ближайший трехмесячный период. Если сравнение вас заинтересовало, вы можете попробовать провести аналогичный анализ за 12 месяцев.
Теги: #прогноз #ИТ-статистика #погода #VESA
-
Доступ 2007 – Хит И Удача
19 Oct, 24 -
Наречие
19 Oct, 24 -
Долгожданные Ракеты На «Союзе»
19 Oct, 24 -
Как Вы Относитесь К Хабраленте?
19 Oct, 24 -
Netscape Navigator Мертв
19 Oct, 24