Die Bundesliga mit ihren Corona-Daten zeigt mehr: Wir haben tatsächlich bereits zwischen 15 und 55 mal mehr Corona-Fälle als bestätigt laut Robert-Koch-Institut

Herzlichen Dank an die deutsche Bundesliga! Wie lange warten wir Anwendungsstatistiker schon auf eine repräsentative Stichprobe der Corona-Infizierten? Damit es mit dem Fußball wieder losgehen kann – mit Geisterspielen in leeren Stadien – wurden umfangreiche Tests durchgeführt. Schön für die Fußballbegeisterten, noch viel schöner für uns Freunde der Daten- und faktenbasierten Entscheidungen!

Bei oConsulting haben wir die Ergebnisse der Bundesliga-Auswertung analysiert und sind zu einem sehr überraschenden Ergebnis gekommen. Mit erprobten Six Sigma Methoden, wie sie typischer Weise in der regulierten Produktion und Qualitätssicherung verwendet werden, haben wir die Anzahl der tatsächlich Infizierten in Deutschland ausgerechnet. Sie ist erheblich höher als erwartet. Und das ist ausgesprochen gut für Wirtschaft und Gesellschaft!

Vorab zur Datenlage:

Die offiziellen Daten des Robert-Koch-Instituts zeigen die gemeldeten Fälle, also die Personen, die positiv auf Covid-19 getestet wurden. In Deutschland wird üblicherweise mit einem PCR Test gearbeitet, der Polymerase Chain Reaction. Dieser Test diagnostiziert, ob man derzeit den Virus im Körper hat.

Mit diesen Tests wurde ermittelt, dass bisher knapp 170‘000 Menschen in Deutschland mit dem Virus infiziert waren. Es wird geschätzt, dass über 144‘000 davon inzwischen genesen sind. Mit über Siebentausend Verstorbenen kommt man damit auf etwa 17‘000 derzeit Infizierte. Das entspricht 10% der bisher infizierten insgesamt 170‘000 Deutschen. Diese so errechneten 10% werden wir gleich nutzen.

Wichtig zu wissen: In Deutschland wurde bisher nicht mit repräsentativen Studien getestet. Nur solche Personen wurden getestet, die starke Symptome zeigen, die sich in Hochrisikogebieten oder in sehr engem Kontakt mit positiv bestätigten Personen befunden haben.  Sowie einige besonders interessante Persönlichkeiten, von denen übrigens auffällig viele Corona-positiv waren. Wie auch unsere Bundesliga:

Damit man Ende des Monats mit Fußball wieder loslegen kann, wurden nun 1724 Sportler sowie auch ihre Teams getestet. 12 von ihnen waren Corona-positiv, übrigens ohne auffällige Symptome zu zeigen.

Wunderbar! Zum ersten Mal wurden Ergebnisse einer repräsentativ getesteten Population veröffentlicht. Wir setzen auf Statistik, um daraus Rückschlüsse für die Gesamtbevölkerung zu ziehen, denn die Probanden kommen immerhin aus allen Teilen Deutschland und aus verschiedenen Altersgruppen. Allerdings:

  • Ist unsere Bundesliga-“Testgruppe” überwiegend männlich. Das ist zwar nicht repräsentativ, aber auch nicht kritisch, da Corona bekanntlich Männer und Frauen gleichermaßen befällt,
  • wurden der Testgruppe zwar die gleichen Kontaktrestriktionen auferlegt wie dem Rest von Deutschland, aber wahrscheinlich hatten sie eher die Möglichkeit sich nicht in überfüllten Supermärkten und öffentlichen Verkehrsmitteln aufzuhalten. Die tatsächliche Bevölkerung sollte also eher noch stärker infiziert sein.

Wir arbeiten hier basierend auf 1724 Personen – zugegebener Maßen sind das nicht besonders viele, um Rückschlüsse auf eine Gesamtbevölkerung von >80 Mio. zu ziehen. Das führt zu einer Ungenauigkeit der Abschätzung, wie wir sie später sehen werden.

Los geht’s mit Statistik

In einem unserer Six Sigma Prozessverbesserungs-Trainings würden wir folgende Übung machen: “Sie haben 1‘724 Personen getestet. 12 davon waren positiv. Das entspricht einem Anteil von 0.58%. Angenommen unsere Stichprobe ist repräsentativ und Sie können daraus auf die gesamte Bevölkerung Rückschlüsse ziehen: Welche tatsächliche Infektionsrate können Sie erwarten?” Normalerweise nutzt man diese Ansätze für geschickte Prozessvalidierung oder für die Bearbeitung von  Abweichungen.

Die richtige Antwort lautet: „Die tatsächliche Infizierungsrate liegt zwischen 0,36% und 1,21% (95%iger Vertrauensbereich).”

Welche überraschende Erkenntnis lässt sich daraus ableiten?

Wir hören täglich in den Nachrichten die Anzahl der infizierten Menschen. Stand 10.05.2020: ca. 170‘000 Menschen. Das wäre ein sehr kleiner Anteil der Gesamtbevölkerung. In Wirklichkeit wurden erheblich mehr Menschen infiziert:

  • Die Anzahl der im Augenblick tatsächlich in Deutschland infizierten Menschen liegt zwischen 300‘000 und 1 Million. Nicht bei ca. 17‘000 (~10% von 170‘000) wie man sie sich aus den Robert Koch Institut Daten ausrechnen kann.
  • Noch spannender: Insgesamt waren bisher mindestens 2,9 Millionen Deutsche infiziert und bis zu 9,8 Millionen. (In der Abbildung entspricht das dem grünen plus dem roten Teil.) Also 4% bis 12% der Deutschen hatten bereits den Virus.
  • Die veröffentlichen Zahlen weichen also mindestens um einen Faktor 17 (!) ab. Es könnten auch 58 mal so viele Infizierte sein.

Warum diese große Spanne von 2,9 Mio. bis 9,8 Mio.? Das ist typisch für statistische Daten: Je kleiner die Stichprobe ist, die ich ziehe (bei uns sind es diese 1724 Bundesliga-Leute), desto unpräziser die Abschätzung.

Was lernen wir daraus?

Weit verbreitet ist die Meinung, dass man die Pandemie nicht stoppen kann, aber verlangsamen sollte. Die gute Botschaft unserer Analyse: Erheblich mehr Menschen als angenommen waren bereits infiziert und dürften immun sein. Nämlich um einen Faktor 17 bis 58 mal mehr als berichtet.

Nachdem wir festgestellt haben, wie schlecht die Zahlen die wirkliche Situation repräsentieren, raten wir dringlichst davon ab, auf dieser Basis Entscheidungen zu fällen. Zum Beispiel ist die Datenlage nicht klar genug, um bei 50 neuen Fällen pro 100‘000 Einwohner die Restriktionen zu verschärfen. Schließlich ist die Zahl um mindestens einen Faktor 10 falsch und zumindest sehr wenig aussagekräftig.

Die schlechte Neuigkeit: Es wird noch lange dauern und die Wirtschaft wird das schwer treffen. Wenn wir wie gewünscht bei maximal ca. 900 gemessenen Neuinfektionen pro Tag bleiben, was in Wirklichkeit mindestens etwa 16‘000 Neuinfektionen entspricht, dann werden bis September 2020 maximal 20% der Bevölkerung infiziert. Das bedeutet, die Beschränkungen werden andauern.

Empfehlungen

Als Berater und spezialisiert auf Effektivität empfehlen wir:

Mit einer repräsentativen Studie sollte die Datenlage verbessert werden. Eine Studie mit einem soliden Ansatz in punkto repräsentativer Testergebnisse mit PCR und vor allem auch mit Antikörper-Tests, die nachweisen, wer schon infiziert war. Damit kann das Verhältnis der aktuellen Infizierten zu den insgesamt Infizierten ermittelt werden.

oConsulting

Kommen Sie gerne auf uns zu, wenn Sie Fragen zur Statistik unserer Analyse haben oder wenn Sie sich für praxisnahe Trainings und Umsetzungsunterstützung im Bereich Lean Six Sigma interessieren!

0 Kommentare

Einen Kommentar abschicken

Ihre E-Mail Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Unseren Blog abonieren