Najnowsza prognoza rozwoju pandemii COVID-19. W śląskim 44% zakażeń,w wielkopolskim 28%. Dotychczasowa sprawdzalność prognoz – 95.1% 1 lipca, 2020 – Posted in: analizy, covid19, lifestyle, Nasze prognozy, posty

Poziom restrykcji epidemiologicznych w Polsce został kolejny raz obniżony. Niestety o ile do tej pory obostrzenia były dość ściśle przestrzegane, o tyle ostatnio mamy z tym coraz większy problem. Sytuacja jednak w poszczególnych województwach różni się jeszcze dość mocno , ale jest bardziej wyrównana niż jeszcze kilka dni temu. W województwie śląskim liczba zakażeń w końcu dość wyraźnie spada. Niestety łódzkie i mazowieckie nadal dostarczają dość sporo nowych zakażeń i dla całej Polski dobowy wzrost od kilku dni utrzymuje się w pobliżu 300.

Pod poniższym linkiem zobaczyć można prognozy dla poszczególnych województw, znajdujące się w arkuszu „Województwa”. Po otwarciu arkusza prosimy o zapoznanie się z objaśnieniami do wykresów, znajdującymi się po ich prawej stronie. Uwaga! Link daje dostęp bezpośrednio do arkusza w związku z czym na załadowanie całej zawartości trzeba poczekać kilkanaście sekund.

https://docs.google.com/spreadsheets/d/1aQiPui1WsuagFiooUnJsgV3Wwf1IKc0X/edit#gid=1722728191

Obecnie najlepiej prezentują się województwa: lubuskie, lubelskie, podkarpackie, podlaskie, świętokrzyskie, warmińsko-mazurskie.

Na drugim biegunie nadal znajduje sie województwo śląskie, ale sytuacja nieco się wyrównuje. Obecnie trzy województwa: śląskie, mazowieckie i łódzkie dostarczają ponad połowę wszystkich nowych zakażeń w Polsce, podczas gdy niedawno w samym województwie śląskim było ponad 70% ogólnej liczby nowych zakażeń.

W dalszej części artykułu prezentujemy wykresy przebiegu zakażeń (bez prognoz) w poszczególnych województwach i aktualny udział każdego z nich w ogólnej liczbie wykrytych zakażeń.

Liczba testów potrzebnych do wykrycia jednego zakażenia wzrosła już z 19 do 43 ( liczba wszystkich dotychczas przeprowadzonych testów odniesiona do liczby wykrytych zakażeń), co na razie jest chyba jedyną dobrą informacją.

W tej sytuacji widzimy, że reestymowany model dla całej Polski nadal sugeruje liniowy wzrost, podobnie jak miało to miejsce w Korei Płudniowej. Dopiero po takim okresie nastąpiło tam spłaszczenie do linii poziomej. Przypominamy, że wykresy dotyczace wcześniejszych wersji modelu znajdują się u dołu artykułu.

Rzeczywisty i prognozowany przebieg liczby potwierdzonych zakażeń:

Prognoza na 01.07.2020 modelu reestymowanego przewidywała 35068 zakażonych. Wartość rzeczywista to 34775.

Przebieg liczby zakażeń z podziałem na województwa:

Udział procentowy województw w ogólnej liczbie wykrytych zakażeń (w śląskim 44% wszystkich,a w wielkopolskim 28%):

„Luzowanie obostrzeń jest istotne zarówno z ze względu na gospodarkę , jak również z powodu „granic wytrzymałości społecznej”. Należy to jednak robić bardzo rozsądnie, obserwując wpływ tych działań na sytuację związaną z epidemią.” – uważa Ryszard Łukoś główny analityk ExMetrix

W związku z licznymi pytaniami dotyczącymi wykresów słupkowych wyjaśniamy, że  prognozowana  dzienna zmiana ilości zarażeń liczona była jako różnica prognozy na dzień następny i rzeczywistej wartości z dnia bieżącego.

Dla wielu  odbiorców naszych komunikatów nie było to jasne i dostawaliśmy w związku z tym liczne zapytania.  Od dnia 16.04.2020 prezentujemy prognozowaną liczbę dziennych zarażeń na wykresie słupkowym jako różnicę w kolejnych dniach wynikającą tylko z modelu prognostycznego. Dla porównania (na dole artykułu) zamieszczamy także wykres utworzony według dotychczasowej metodologii.

Ważne jest też informacja, że nasze modele prognozują całkowitą liczbę zarażeń  – krzywą liniową – a nie bezpośrednio jej dzienne zmiany. W związku z tym wykres słupkowy publikowany jest jedynie jako źródło dodatkowej informacji.

Prognozowane i rzeczywiste dzienne przyrosty liczby zakażeń:

Niestety, w zaistniałych okolicznościach, ograniczanie dziennych przyrostów przebiega znacznie wolniej niż wcześniej można było oczekiwać, a cały proces jest rozciagnięty w czasie. Notujemy w sumie dość stabilna liczbę dziennych zakażeń, jednak na stosunkowo wysokim poziomie. W naszej opinii w województwie śląskim powinny zostać zastosowane odrębne obostrzenia i środki inne niż w pozostałych.

Dotychczasowa realizacja oraz prognoza na kolejny dzień znajduje się w poniższej tabeli:

DateForecast
– central path
Real valuePercentage
error %
MAPE
error % (*)
2020-03-22588634-8.58.50
2020-03-23725749-4.16.30
2020-03-24891901-1.94.83
2020-03-25108910513.04.38
2020-03-26132412217.95.08
2020-03-271598138915.06.74
2020-03-28178316388.97.04
2020-03-29 (r)2089186212.27.69
2020-03-30 214720554.57.33
2020-03-31238323113.16.91
2020-04-01 2706255466.82
2020-04-023034294636.5
2020-04-03342033831.16.09
2020-04-04 383236275.76.05
2020-04-05422841023.15.86
2020-04-064677441365.98
2020-04-07 (r)497948482.75.68
2020-04-08542252054.25.57
2020-04-09574655753.15.44
2020-04-10612259552.85.31
2020-04-11648163562.05.15
2020-04-12681866742.15.01
2020-04-13702069341.24.85
2020-04-14736572022.34.75
2020-04-15763275820.74.58
2020-04-16 (r)804879181.64.47
2020-04-17848383791.24.35
2020-04-18880087420.74.21
2020-04-1990979287-24.14
2020-04-2093749593-2.34.08
2020-04-2196319856-2.34.02
2020-04-22986710169-33.99
2020-04-23 (r)1048510511-0.23.63
2020-04-241075810892-1.23.56
2020-04-251101211273-2.33.53
2020-04-26 (r)1133611617-2.43.5
2020-04-271173911902-1.43.44
2020-04-281205312218-1.13.38
2020-04-291234112640-2.43.36
2020-04-301258712877-2.33.33
2020-05-011281413105-2.23.3
2020-05-021302213375-2.63.29
2020-05-031321213693-3.53.3
2020-05-04(r)1401114006-0.013.28
2020-05-051427614412-1.13.2
2020-05-061453014723-1.43.18
2020-05-071477015026-1.83.11
2020-05-081499815366-1.93.1
2020-05-09(r)1562115651-0.23.02
2020-05-101586615996-0.83
2020-05-111610316326-1.42.97
2020-05-121633116882-3.453.07
2020-05-131655017204-3.83.12
2020-05-141676217615-4.63.17
2020-05-151696718016-5.83.3
2020-05-161716418257-63.35
2020-05-171735618529-6.33.42
2020-05-181754218885-7.13.5
2020-05-191790419268-93.6
2020-05-201808119739-10.23.7
2020-05-211825720143-11.23.8
2020-05-221843120619-12.33.95
2020-05-231860420931-12.84.02
2020-05-241877821326-13.64.1
2020-05-251897521631-144.2
2020-05-261912522074-14.94.25
2020-05-27(r)2231422473-0.74.05
2020-05-282268322825-0.64
2020-05-292309723155-0.33.96
2020-05-302346923571-0.43.9
2020-05-31237912378603.8
2020-06-01241632416503.75
2020-06-0224519243950.53.7
2020-06-0324809246870.53.65
2020-06-0425121251210.33.6
2020-06-0525446254100.13.5
2020-06-062570425986-1.13.6
2020-06-072595926561-2.33.75
2020-06-082624227160-3.44
2020-06-092647727560-3.94.15
2020-06-102668327842-4.24.22
2020-06-112691828201-4.54.5
2020-06-122713428577-54.57
2020-06-132730529017-5.94.62
2020-06-142749129392-6.54.67
2020-06-152768629788-7.14.72
2020-06-162783730195-7.84.77
2020-06-172798030701-8.94.85
2020-06-182815031015-9.34.9
2020-06-192829531316-9.64.94
2020-06-202840731620-10.15.02
2020-06-212854931931-10.65.07
2020-06-222869432227-115.12
2020-06-232879332527-11.55.21
2020-06-242890732821-11.95.25
2020-06-25(r)3301833110-0.35.2
2020-06-263333133395-0.25.14
2020-06-273366033714-0.25.08
2020-06-2834010339070.35.02
2020-06-2934352341540.64.97
2020-06-3034714343930.94.9
2020-07-0135068347750.84.84
2020-07-02(p)35432
2020-07-03(p)35720
2020-07-04(p)35987
2020-07-05(p)36259
2020-07-06(p)36513


(*) Średni bezwzględny błąd procentowy MAPE (mean absolute percentage error) informuje on o średniej wielkości błędów prognoz dla okresu testowego, wyrażonych w procentach.
(r) re-estymacja modelu

Do tej pory 29 marca , 07 kwietnia ,16 kwietnia , 23 i,26 kwietnia ,04 maja, 09 maja i 27 maja model został poddany tzw. reestymacji – czyli uwzględnia wiedzę o aktualnej sytuacji w naszym kraju oraz przebiegu epidemii w innych krajach.

Jak zaznaczaliśmy w chwili pierwszej publikacji prognoz dla Polski (23.03.2020), w miarę rozwoju sytuacji i napływu nowych danych, szczególnie z krajów, gdzie epidemia zaczęła się wcześniej niż w Polsce, będziemy aktualizować model oraz uwzględniać wszelkie dodatkowe informacje, aby był on możliwie najbardziej precyzyjny. Zabieg taki jest potrzebny, aby model uwzględnił wiedzę jaką zbieramy na bieżąco.

Wypowiedź z 29.03.2020:

„W najbliższych dniach będziemy mieć rekordowe przyrosty stwierdzonych przypadków zakażenia, nawet do ok. 500 zakażonych zaraportowanych dziennie, jak wskazują nasze modele, co oczywiście jest znacznie mniejszą liczbą niż w Hiszpanii czy Włoszech, ale wymaga dalszej bardzo dużej dyscypliny narodu. Należy pamiętać, że model pokazuje prognozę, która nie jest odporna na nagłe rozluźnienie dyscypliny tzw. social distancing” – komentuje Zbigniew Łukoś, CEO firmy ExMetrix.

„Jeżeli zachowamy nadal ogromną dyscyplinę, jest szansa, że Polska uniknie drogi podobnej niż Włoska czy Hiszpańska. Być może unikniemy też scenariusza Niemieckiego – i miejmy nadzieję, że potoczy się optymistyczny scenariusz Polski.” – dodaje główny analityk ExMetrix Ryszard Łukoś.

Jednocześnie, dla porównania , poniżej prezentujemy także wcześniejsze wersje modelu :

Model użytkowany do 26.05.2020:

Trzecia wersja – model pierwotny reestymowany 07.04.2020 i użytkowany do 16.04.2020:

Wykres słupkowy według dotychczasowej metodologii:

Druga wersja – model pierwotny reestymowany 28.03.2020 i użytkowany do 07.04.2020

Pierwsza wersja z 23.03.2020

Oryginalną publikację prognozy z 23.03.2020r. mogą Państwo znaleźć tutaj:

W budowie modelu przebiegu epidemii wirusa zostały uwzględnione następujące obszary informacyjne:

  • Dotychczasowy przebieg pandemii w wielu krajach
  • Czynniki meteorologiczne
  • Stan opieki zdrowotnej w danym kraju
  • Stan kondycji zdrowotnej społeczeństwa, ze szczególnym uwzględnieniem czynników ryzyka takich jak, choroby onkologiczne, kardiologiczne, cukrzyca i otyłość
  • Strukturę demograficzną społeczeństwa. Szczególnie zwracaliśmy uwagę na odsetek ludzi w podeszłym wieku
  • Poziom restrykcji stosowanych przez władze i przestrzeganie ich przez obywateli

Model został zbudowany przy wykorzystaniu technologii z zakresu sztucznej inteligencji (sieci neuronowe i symulowane wyżarzanie). Technologia ta pozwoliła oszacować wpływ informacji z wymienionych obszarów na takie parametry krzywej zakażeń, jak:

  • nachylenie – odzwierciedlające przyrost liczby zakażonych w danej chwili
  • rozpiętość – pozwalająca określić maksymalny pułap liczby zachorowań oraz czas trwania epidemii

Założenia, ryzyko sprawdzalności:

Przy budowie modelu założyliśmy, że statystyki w krajach dotkniętych COVID-19 nie były zatajane ani sztucznie modyfikowane.

Źródło danych o liczbie zakażeń:

Johns Hopkins University
https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series

Źródła danych opisujących poszczególne obszary uwzględnione w modelu:

OECD, World Bank, http://population.city/, https://www.accuweather.com

ExMetrix to spółka zajmująca się prognozowaniem ekonomicznym i społecznym, która tworzy oprogramowanie wykorzystujące najnowsze modele statystyczne i numeryczne oparte o Machine Learning, Sztuczną Inteligencję i Sieci Neuronowe. ExMetrix daje dostęp do gotowych modeli statystycznych i predykcyjnych oraz umożliwia tworzenie własnych modeli, bazując na 80 milionach strumieni danych dostępnych w systemie lub na dowolnych zbiorach własnych danych. Z ExMetrix korzysta kilkadziesiąt organizacji różnej wielkości, m.in. Grupa Azoty. Oprogramowanie wykorzystywane jest również do edukacji studentów na UEK i UMCS.  Współzałożycielami i inwestorami ExMetrix są Grzegorz Błażewicz i Konrad Pawlus, założyciele spółki SALESmanago, wiodącej na świecie firmy zajmującej się Big Data, Customer Experience i Marketing Automation.

Bez przestrzegania obostrzeń możliwe nawet 60 tys zakażeń – analiza „what-if”. Sprawdzalność prognozy ExMetrix – 95,9% »