En nærmere titt på antall rapporterte Coronavirus-perspektiver

Analyser av saksnummeret med hensyn til landstørrelser

Ansvarsfraskrivelse: Mot Data Science er en Medium publikasjon primært basert på studiet av datavitenskap og maskinlæring. Vi er ikke helsepersonell eller epidemiologer, og meningene i denne artikkelen skal ikke tolkes som profesjonelle råd. Hvis du vil lære mer om coronavirus-pandemien, kan du klikke her.

I løpet av bare noen få måneder har coronavirus (COVID-19) spredd seg over hele verden, noe som har ført til en de facto global pandemi. I mange land og regioner vokser de bekreftede sakene fortsatt eksponentielt. Etter å ha rapportert bekreftede saksnummer daglig, er jeg veldig bekymret for hvordan viruset påvirker folks liv, markeder og verdensøkonomi. Opprinnelig fra Beijing, Kina, er minnet om SARS-utbruddet i 2003 fortsatt friskt. Imidlertid var jeg overrasket over å finne ut at så mange mennesker i Vesten er så likegyldige overfor alvorlighetsgraden av COVID-19: "Det er bare en influensa", "det berører bare gamle mennesker", "media propaganda", "flokk mot immunitet" ... Disse høydene fra allmennheten holder meg oppe om natten.

Kanskje noen mennesker ikke er imponert over det rapporterte antall tilfeller, og tror de fleste av de infiserte sakene er langt borte på den andre siden av verden. Jeg er enig i å se på at de bekreftede saksnummerene er abstrakte. Her lagde jeg noen plott for å sette disse tallene i perspektiver.

Advarsler: modellen er bare like god som kilden til dataene. Alle de bekreftede tilfellene av COVID-19 er levert av Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE), som samlet offisielt rapporterte tall fra WHO og myndigheter rundt om i verden. Uten tvil er det underrapportering fra de fleste land på grunn av mangel på diagnostiske tester, mangel på åpenhet fra myndighetene og folk som ikke klarer å ta testen på grunn av uvitenhet.

Alle tallene nedenfor er basert på bekreftede COVID-19-tilfeller fra 15. mars 2020.

Kumulerte saker på regionnivå

Topp berørte land / regioner etter kumulerte bekreftede COVID-19 tilfeller

Mange visualiseringer (som dette) viser bare statistikk på landnivå. Fra plottet på regionnivå kan vi skille forskjellige provinser i Kina og stater i USA. Hubei, en gang episentret av COVID-19, sammen med nesten alle andre provinser i Kina, har flatet ut i antall bekreftede tilfeller. Iran, Sør-Korea, Italia, sammen med mange europeiske land, overgikk mange Guangdong, den andre hardest rammede kinesiske provinsen.

Passer den eksponentielle veksten

La oss deretter undersøke hvor raskt COVID-19 spredte seg i regioner. Jeg utstyrte de kumulative bekreftede sakene med en eksponentiell funksjon, y = exp (a + bx). Her brukte jeg vanlig minste firkantet (OLS) for å bestemme parametrene a og b, skråningen b tilsvarer brattheten til eksponentiell kurve.

I virkeligheten følger nesten ingenting eksponentiell vekst på ubestemt tid. Imidlertid kan det første utbruddet av en smittsom sykdom modelleres med en eksponentiell funksjon. For forskjellige regioner passet det kumulerte antallet bekreftede COVID-19-tilfeller i løpet av denne første perioden, definert av å ha 50 tilfeller i minst 5 til 10 dager. Sorterer de monterte bakkene (b) fra eksponentielle funksjoner, fant jeg en slående liste over land med vekstrater større enn Hubei rundt lockdownen den 01/23, inkludert Iran, Finland, Portugal, Italia, Sør-Korea, Danmark, Slovenia og Spania , hvorav mange opplever eksponentiell vekst nå (fra 15. mars). I tillegg rangerte staten New York og Washington i USA også 15 og 19 blant de raskest spredte regionene i verden.

Raskest spredte regioner / land. Legenden indikerer b i eksponentiell funksjon og datoperiode brukt for å passe vekstkurven.

På baksiden kan vi også oppdage regionene og landene med den tregeste spredningen av COVID-19. De 20 beste er nesten utelukkende i Asia, hvorav mange er avsidesliggende og mindre befolket provinser i Kina som Ningxia, Indre Mongolia og Xinjiang. Merkelig er at tilfeller av COVID-19 eksisterer i Singapore og Japan siden midten av februar, men likevel spredte seg mye tregere, sannsynligvis på grunn av den tidlige og effektive implementeringen av sosial distansering.

Langsomt spredte regioner / land.

Normaliser til befolkning

En måte å sette antallet smittede i perspektiv på er å normalisere det mot befolkningsstørrelsen i regionen eller landet. Under viser jeg de 20 beste regionene / landene med den største andelen av befolkningen som er smittet med COVID-19. San Marino, et innkapslet mikrostat omgitt av Italia, rangerte den første i COVID-19 tetthet etter befolkning. Andre land med lav befolkning som Island topper også listen.

Normaliser til område

En annen måte å gjøre seg kjent med antall smittede mennesker er å normalisere seg mot området i regionen / landet for å utlede tettheten av sakene når det gjelder geografi. Igjen, San Marino topper listen på grunn av det lille området. Mange byer og bystater er også blant de øverste: Macau, Singapore og Washington DC.

Normaliser til sykehuskapasitet

En mer virkningsfull måte å sette antall COVID-19 tilfeller i perspektiv på er å kvantifisere belastningen for sykehus i regionene. Dette kan gjøres ved å normalisere seg mot sykehuskapasiteten, som måles med estimert antall sykehussenger.

De nåværende infiserte pasienter med COVID-19 er nok til å okkupere 72% av sykehussengene i San Marino, som bare har ett sykehus. Andre land med veldig stor belastning inkluderer Island, Iran, Italia og Qatar, med COVID-19 pasienter som tar over 10% av sykehussengene. Merk at dette forutsetter best case-scenario der pasienter er proporsjonalt fordelt rundt sykehus, slik at de ikke vil flomme til samme sykehus.

Man bør også ta hensyn til antall senger i ICU og antall tilgjengelige mekaniske ventilatorer, som er avgjørende for å redde pasienter med alvorlige symptomer. I følge American Hospital Association utgjør senger i ICD ~ 5% av alle sykehussenger i USA. Forutsatt at alle disse pasientene trenger ICU-opphold, blir ~ 10% sykehussenger en uhyggelig ~ 200% ICU-kapasitet.

Oppdatert sykehusbyrde basert på bekreftede tilfeller frem til 21. mars

Jeg kunne estimere sykehussenger for stater i USA ved å bruke data herfra. Som du kan se på tomten, har de bekreftede sakene i San Marino allerede oversteg antall sykehussenger. Sykehusbyrden i Italia hoppet til ~ 23%. Tre stater i USA, New York, Washington og New Jersey rangerte også i topp 20, med 16%, 12% og 4% alle sykehussenger som potensielt er okkupert av bekreftede COVID-19 tilfeller, forutsatt at alle krever sykehusinnleggelse.

koder:

https://github.com/wangz10/covid_19_analyses