Coronavirus: Bei Statistiken gibt es viele Stolperfallen
Den größten Wert in Corona-Zeiten haben - neben Klopapier - wohl Zahlen. Auf einmal rufen Menschen, die mit Mathematik und Statistik wenig am Hut haben, mehrmals täglich Daten zu Coronavirus-Fällen ab. Und jeder scheint zu wissen, was exponentielles Wachstum ist und hofft, die Kurve möge sich schnell und ausreichend abflachen. Statistiker warnen davor, sich allzu sehr auf die Zahlen zu verlassen.
Viele Stolperfallen
Die verfügbaren Zahlen enthielten zu wenige Informationen, erklärt Katharina Schüller, Gründerin des Münchner Unternehmens Stat-Up und Leiterin der Arbeitsgruppe "Statistical Literacy" der Deutschen Statistischen Gesellschaft. "Sie bilden nur einen kleinen Teil der Realität ab, nämlich die schwer Erkrankten, einen Teil der leichter Erkrankten mit Symptomen und einen ganz kleinen Teil von Menschen ohne Krankheitszeichen, die getestet wurden, weil sie Verdachtsfälle waren."
"Können nur raten"
Ob auch viele andere infiziert sind oder nicht, "das wissen wir nicht und können es auch nur mehr oder weniger begründet erraten", schreibt Schüller in einem Beitrag für das Hochschulforum Digitalisierung: "Wir wissen, dass jede unserer Modellrechnungen falsch sein muss." Trotzdem könnten die Schlussfolgerungen daraus richtig sein.
Jeder zählt anders
In Deutschland bekommt das Robert Koch-Institut (RKI) als oberste Behörde für Infektionskrankheiten Zahlen zu mit Sars-CoV-2 infizierten Menschen und Toten, die die Krankheit Covid-19 hatten, von den Landesbehörden. Die wiederum erhalten sie von den regionalen Gesundheitsämtern. "Zwischen der Meldung durch die Ärzte und Labore an das Gesundheitsamt und der Übermittlung der Fälle an die zuständigen Landesbehörden und das RKI können einige Tage vergehen (Melde- und Übermittlungsverzug)", erklärt das RKI dazu. Zahlen werden also auch nachträglich in der Statistik ergänzt.
Andere wie die Johns Hopkins Universität aus den USA beziehen auch Quellen wie regionale Medien ein. Das Europäische Zentrum für die Prävention und die Kontrolle von Krankheiten (ECDC), eine Einrichtung der EU, wiederum gleicht nach eigener Darstellung staatliche Angaben mit rund 500 anderen Quellen ab, darunter etwa Twitter-, Facebook- oder Youtube-Konten von Gesundheitsministerien. "Benutzern wird empfohlen, alle Daten mit Vorsicht und unter Berücksichtigung ihrer Einschränkungen zu verwenden", heißt es dazu extra auf der ECDC-Homepage.
Und auch die Weltgesundheitsorganisation (WHO) weist unter anderem auf "Unterschiede bei den Berichtsmethoden, rückwirkende Datenkonsolidierung und Verzögerungen bei der Berichterstattung" hin. Wegen der Inkubationszeit, der Zeit für den Test und der Meldeverzögerungen zeigen in Deutschland zum Beispiel Maßnahmen wie Kontaktverbote oft erst etwa 14 Tage später Folgen bei den Zahlen.
Die Tücke liegt im Detail
Es gibt viele solche Stolperfallen bei den Corona-Daten. Die Tücke liegt wie so oft im Detail. "So hat die Zahl der getesteten Infizierten nur bedingt etwas mit der Zahl der tatsächlichen Infizierten zu tun, weil Menschen mit wenigen oder gar keinen Symptomen bisher in den seltensten Fällen getestet werden, insbesondere nicht, wenn sie keinen Kontakt zu nachweislich Infizierten hatten", erklären die Macher der "Unstatistik des Monats", einem Angebot mehrerer Statistik-Experten, das auf mögliche Fehler bei der Interpretation von Statistiken hinweist.
Neue Testverfahren könnten das zwar ändern und beispielsweise auch bisher nicht erfasste Fälle (Stichwort: Dunkelziffer) erheben - doch dann könnten die gemeldeten Fallzahlen steigen, ohne dass es eine beschleunigte Erkrankungsdynamik gibt.
Heikle Ländervergleiche
Besonders heikel sind Ländervergleiche. "Insbesondere hängen die erfassten Fallzahlen in jedem Land zentral davon ab, wie systematisch und umfangreich dort auf den Virus getestet wird", erläutern die Macher der "Unstatistik", zu denen auch Katharina Schüller gehört.
Etliche Faktoren beeinflussen Stand und Schweregrad der Infektionen und können sich von Land zu Land immens unterscheiden: Einwohnerzahl, Altersstruktur, spezielle Erkrankungen in der Bevölkerung wie Tuberkulose, das Stadium der Ausbruchswelle, der Wille oder das Vermögen zu testen, die Richtlinien dafür, wer überhaupt getestet wird. In Altersheimen gestorbene Menschen etwa werden in einigen Ländern nachträglich getestet und fließen in die Statistik ein - in anderen nicht. Da vorwiegend Ältere mit Covid-19 sterben, kann das enorme vermeintliche Unterschiede zur Folge haben.
Dunkelziffer
Die statistische Erfassung der Todesursachen variiere von Land zu Land erheblich, betonen auch die Autoren der "Unstatistik". Dennoch werden immer wieder Vergleiche von Sterberaten diskutiert. Generell sei es falsch, einfach die Toten ins Verhältnis zu den bekannten Infizierten zu setzen. Werde die Dunkelziffer nicht berücksichtigt (die wiederum erheblich vom Ausmaß der durchgeführten Tests abhängt), dann werde der Nenner - also die Zahl unterm Bruchstrich beim Teilen - zu klein. Daraus folgt: Die geschätzte Letalität – also der Anteil der Todesfälle unter allen Infizierten – wird systematisch überschätzt.
Genesene: Schwieriges Terrain
Kniffelig wird es auch bei Aussagen zur Zahl der Genesenen, die hier und da bis auf die letzte Stelle angegeben werden und damit ziemlich exakt aussehen. Doch wo nicht einmal alle Infizierten getestet und erhoben werden, kann natürlich noch viel weniger über die Zahl der Genesenen bekannt sein. Daher sind all diese Angaben immer nur Schätzungen - sehr grobe Schätzungen in vielen Fällen.