В последнее время я вижу много новостей о новом вирусе, но так ли все плохо, пик эпидемии пройден или все еще впереди? По большей части из новостных релизов сложно сделать какие-либо выводы.
В конце концов я решил разобраться сам, и вот что из этого вышло.
Для того, чтобы разобраться в ситуации, мне нужно было получить данные для анализа, мне удалось найти их на сайте.
Всемирная организация здравоохранения (ВОЗ) .
Данные публикуются в виде pdf-отчетов за каждый день, начиная с 21 января 2020 года.
Написать универсальный парсер не удалось, так как все отчеты разные, поэтому пришлось копировать данные из них вручную.
В первую очередь меня интересовало количество зараженных и умерших, получив это, я подсчитал количество зараженных и умерших за сутки:
Отобразим количество смертей за каждый день на графике:
На графике показаны аномальные данные за 13 и 14 февраля, уточнив это в отчетах за указанные периоды, я заметил опечатки, за 14 и 15 февраля указано, что число умерших в эти дни равно 121 человеку, что совсем не так.
не соответствуют тому, что было рассчитано ранее.
Поэтому (хотя 13 февраля совпадает с тем, что напечатано в отчете), я взял их среднее значение за 13 и 14 февраля.
По обновленной информации из комментария КоньковВладимир от 13 февраля я вычел 108, а к 14 февраля прибавил 108, доказательства Здесь (примечание 5):
Далее отобразим на графике количество зараженных за каждый день:
На этот раз аномальное значение было 17 февраля, проверив данные отчетов на эту дату, я узнал, что до 17 февраля инфицированные и люди с симптомами вируса (т.е.
случаи, не подтвержденные лабораторно) содержались отдельно, и после этой даты они объединились, из-за этого такой скачок на графике.
Чтобы это исправить, я взял среднее значение между 16 и 18 февраля за 17 февраля:
Теперь графики больше похожи на реальные; для наглядности я наложил графики друг на друга:
Из этих графиков можно сделать вывод, что пик как числа зараженных, так и числа смертей пройден, и хотя общее число зараженных велико, позитивный прогноз все же прослеживается.
Данные графики получены по данным из Китая; Остальной мир я не брал, потому что.
мало данных для статистики.
Выводы, которые я получил, являются лишь мнением автора и ни на что не претендуют. Обновлен график на 08.03.2020. Оригинал код .
Я написал второй пост о коронавирусе - «Анализ данных по коронавирусу часть 2, попытка сравнения с тем, что произошло в Китае», можно прочитать Здесь .
Теги: #Популярная наука #здоровье #вирусы #python #Визуализация данных #коронавирус #Открытые данные #Интеллектуальный анализ данных #здоровье компьютерщика
-
Хранение Кода В Scm
19 Oct, 24 -
Электронные Книги На Русском Языке.
19 Oct, 24 -
Обзор Moto Z Play: Младший Брат Флагмана
19 Oct, 24 -
«Роснано» Реорганизует Plastic Logic
19 Oct, 24