Анализ Данных О Коронавирусе Sars-Cov-2 (2019-Ncov)

В последнее время я вижу много новостей о новом вирусе, но так ли все плохо, пик эпидемии пройден или все еще впереди? По большей части из новостных релизов сложно сделать какие-либо выводы.

В конце концов я решил разобраться сам, и вот что из этого вышло.



Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

Для того, чтобы разобраться в ситуации, мне нужно было получить данные для анализа, мне удалось найти их на сайте.

Всемирная организация здравоохранения (ВОЗ) .

Данные публикуются в виде pdf-отчетов за каждый день, начиная с 21 января 2020 года.

Написать универсальный парсер не удалось, так как все отчеты разные, поэтому пришлось копировать данные из них вручную.

В первую очередь меня интересовало количество зараженных и умерших, получив это, я подсчитал количество зараженных и умерших за сутки:

Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

Отобразим количество смертей за каждый день на графике:

Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

На графике показаны аномальные данные за 13 и 14 февраля, уточнив это в отчетах за указанные периоды, я заметил опечатки, за 14 и 15 февраля указано, что число умерших в эти дни равно 121 человеку, что совсем не так.

не соответствуют тому, что было рассчитано ранее.

Поэтому (хотя 13 февраля совпадает с тем, что напечатано в отчете), я взял их среднее значение за 13 и 14 февраля.

По обновленной информации из комментария КоньковВладимир от 13 февраля я вычел 108, а к 14 февраля прибавил 108, доказательства Здесь (примечание 5):

Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

Далее отобразим на графике количество зараженных за каждый день:

Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

На этот раз аномальное значение было 17 февраля, проверив данные отчетов на эту дату, я узнал, что до 17 февраля инфицированные и люди с симптомами вируса (т.е.

случаи, не подтвержденные лабораторно) содержались отдельно, и после этой даты они объединились, из-за этого такой скачок на графике.

Чтобы это исправить, я взял среднее значение между 16 и 18 февраля за 17 февраля:

Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

Теперь графики больше похожи на реальные; для наглядности я наложил графики друг на друга:

Анализ данных о коронавирусе SARS-CoV-2 (2019-nCov)

Из этих графиков можно сделать вывод, что пик как числа зараженных, так и числа смертей пройден, и хотя общее число зараженных велико, позитивный прогноз все же прослеживается.

Данные графики получены по данным из Китая; Остальной мир я не брал, потому что.

мало данных для статистики.

Выводы, которые я получил, являются лишь мнением автора и ни на что не претендуют. Обновлен график на 08.03.2020. Оригинал код .

Я написал второй пост о коронавирусе - «Анализ данных по коронавирусу часть 2, попытка сравнения с тем, что произошло в Китае», можно прочитать Здесь .

Теги: #Популярная наука #здоровье #вирусы #python #Визуализация данных #коронавирус #Открытые данные #Интеллектуальный анализ данных #здоровье компьютерщика

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.