Ein wesentliches Grundproblem bei der Bewertung der Risiken durch SARS-CoV-2 / Covid-19 ist das Fehlen verlässlicher und vergleichbarer Daten. So sind weder die Grundgesamtheit der infizierten Personen bekannt noch die Anzahl der kausal durch (und nicht mit) Covid-19 verstorbenen Personen. Auch die PCR-Tests liefern keine konsistente Datengrundlage, da auch falsch positive und auch negative Ergebnisse generiert werden. Daher wäre für die aktuelle Diskussion eine höhere Datenkompetenz bzw. Data Literacy wichtig. Hiermit sind die Fähigkeiten gemeint, Daten auf kritische Art und Weise zu sammeln, zu managen, zu bewerten und anzuwenden. Die RiskNET-Redaktion sprach mit der Statistikerin Katharina Schüller.
Katharina, du hast letztes Jahr eine große Studie über Datenkompetenz geschrieben. Warum brauchen wir jetzt Datenkompetenz? Es wimmelt doch vor Experten, die uns die aktuellen Zahlen zu COVID-19 in bunten Grafiken erklären?
Katharina Schüller: Gerade in einer Krisenphase wie der jetzigen, in der wir mit unvollständigen Daten Szenariorechnungen erstellen, ist Data Literacy eine Schlüsselkompetenz. Wir wissen, dass jede unserer Modellrechnungen falsch sein muss. Trotzdem sind die Schlussfolgerungen richtig: Wenn wir es nicht schaffen, die Ansteckungsgeschwindigkeit massiv auf einen Wert zu bringen, der geringer ist als derjenige der optimistischsten Szenarien, dann wird unser Gesundheitssystem kollabieren. Denn selbst das "best case" Szenario ist nicht gut genug, um sorglos zu sein. Es braucht ziemlich viel Datenkompetenz, um zu verstehen, dass man auch aus "falschen" Zahlen richtiges Handeln ableiten kann.
Warum sind denn die Zahlen falsch?
Katharina Schüller: Sie bilden nur einen kleinen Teil der Realität ab, nämlich die schwer Erkrankten, einen Teil der leichter Erkrankten mit Symptomen und einen ganz kleinen Teil von Menschen ohne Krankheitszeichen, die getestet wurden, weil sie Verdachtsfälle waren. Ob alle anderen infiziert sind oder nicht, das wissen wir nicht und können es auch nur mehr oder weniger begründet erraten. Wir Statistiker haben deshalb ein Problem. Von uns wird erwartet, dass wir die Zahlen analysieren und Prognosen daraus erstellen, aber die Zahlen sind dafür nicht geeignet, weil sie zu wenige Informationen enthalten.
Trotzdem hast auch du einen Artikel geschrieben, in dem du Zahlen einordnest und Abschätzungen vornimmst...
Katharina Schüller: Klar, trotzdem versuche ich, ehrlich zu sein und transparent zu kommunizieren, wie wenig wir wissen. Aber das birgt die Gefahr, dass viele Menschen die Botschaft empfangen, dass die Modellrechnungen falsch sind (weil die Wahrscheinlichkeit, dass es genauso abläuft wie im Modell, praktisch Null beträgt) und daraus ableiten, dass die empfohlenen Maßnahmen dann auch falsch sein müssen (obwohl sie wahrscheinlich notwendig und richtig sind). Je länger wir in dieser Phase der Unsicherheit sind, für umso wahrscheinlicher halte ich es, dass viele Menschen die Einschränkungen nicht mehr akzeptieren wollen. Weil sie weh tun und weil man "nichts" sieht und weil es ziemlich unangenehm ist, nicht zu wissen, ob das Ganze noch zwei Wochen anhält, zwei Monate oder gar bis zum Jahresende...
Ist das eine Situation, die du meinst, wenn du von Datenethik sprichst?
Katharina Schüller: Ganz genau. Datenethik dreht sich nicht nur darum, ob wir Handydaten verwenden dürfen, um die Kontakte von Infizierten zu tracken. Sondern es ist ein riesiges datenethisches Dilemma, wie man damit umgeht, dass die Kommunikation der "Wahrheit" vielleicht zu den falschen Konsequenzen führt. Ist es besser, wir bleiben bei der Wahrheit und hoffen, dass uns Experten trotzdem geglaubt wird bei der Interpretation von Unsicherheit? Oder sollten wir mehr Sicherheit suggerieren, um das Richtige zu erreichen, auch wenn wir im strengen Sinne nicht "beweisen" können, dass es richtig ist?
Der Autor und Risikoforscher Nassim Taleb schreibt in einem aktuellen Essay, es sei klüger für den einzelnen Menschen, in Bezug auf COVID-19 übertrieben und mit einer Art Panik zu reagieren, obwohl das individuelle Risiko im Durchschnitt für jeden einzelnen von uns ziemlich klein ist. Siehst du das auch so?
Katharina Schüller: Im Prinzip ja. Das mit dem kleinen Risiko gilt natürlich nicht für Risikogruppen, aber für vermutlich mindestens 97% der Bevölkerung, denn aktuell scheinen in Deutschland nur 3% aller Infektionen einen schweren Verlauf zu nehmen. Aber die Dominoeffekte sind nicht abzusehen, wenn sich schlagartig sehr viele Menschen anstecken, so dass das System als Ganzes kippen kann.
Was kann die Statistik denn jetzt noch besser machen, was können Experten wie du tun? Könnt ihr nicht mehr aus den Daten herausholen?
Katharina Schüller: Ich denke, wir Statistiker haben unsere Handlungsmöglichkeiten weitgehend ausgeschöpft, was die aktuelle Datenlage angeht. Wenn es nicht bald möglich ist, repräsentative Daten zu bekommen, mit denen wir zuverlässigere Einschätzungen über die Verbreitung und die Gefährlichkeit des neuen Corona-Virus abgeben können, dann werden unsere Warnungen bald nicht mehr ernst genommen. Deswegen halte ich es für unerlässlich, dass Tests nicht nur an schweren Fällen und prominenten Verdachtsfällen durchgeführt werden, sondern an repräsentativen Bevölkerungsstichproben. Nur wenn wir deutlich mehr und systematisch testen, schaffen wir die Möglichkeit, dass wir stufenweise zu einem einigermaßen normalen Leben zurückzukehren und damit die negativen sozialen und wirtschaftlichen Konsequenzen dieser Pandemie einigermaßen begrenzen.
Wie bewertest Du die Risikokommunikation in den vergangen Wochen – häufig basierend auf unsicherem Wissen?
Katharina Schüller: Der berühmte indische Statistiker C.R. Rao sagte einmal: Sicheres Wissen ist die Summe aus unsicherem Wissen und dem Wissen über das Ausmaß der Unsicherheit. Vorneweg: Auch wir Statistiker wissen nicht sicher, wie sich COVID-19 entwickeln wird.
In der folgenden Einordnung der aktuell kursierenden Statistiken folge ich deshalb drei Prinzipien: 1. Wir akzeptieren, dass die Aussagefähigkeit der Daten begrenzt ist. 2. Wir suggerieren keine Schein-Sicherheit in den Prognosen. 3. Wir wägen mögliche Erklärungen für unerwartete Entwicklungen ab, statt übereilt in Panik zu geraten oder zu entwarnen.
Wenn wir diese Prinzipien zugrunde legen, sind viele Statistiken und Medienberichte, die in den letzten Wochen rund um COVID-19 kursieren, als "Unstatistiken" zu qualifizieren.
Wie verlässlich sind die Datengrundlagen?
Katharina Schüller: Die Zahl der getesteten Infizierten hat nur bedingt etwas mit der Zahl der tatsächlichen Infizierten zu tun. Diese Hypothese lässt sich sachlogisch begründen, weil Menschen mit wenigen oder gar keinen Symptomen in den seltensten Fällen getestet wurden und werden, insbesondere nicht, wenn sie keinen Kontakt zu nachweislich Infizierten hatten. Erst mit der Entwicklung schnellerer Testverfahren, die vor wenigen Tagen erstmals in Deutschland zum Einsatz kamen, wird es möglich, systematisch und unverzerrt zu testen. Die Fallzahlen hängen also massiv davon ab, wie intensiv in den unterschiedlichen Regionen getestet wird. Dies zeigen nicht zuletzt die riesigen Unterschiede in den Sterberaten.
In den statistisch erfassten Verläufen ist zu erkennen, dass Länder, die systematisch und (eher) repräsentativ testen, ein stabiles Verhältnis der Todesfälle zu den bestätigt Infizierten aufweisen. Dabei ist es nicht sinnvoll, die heute bestätigten Infektionsfälle als Referenz zu verwenden, vielmehr sind die bestätigten Fälle der infizierten Kohorte, aus der die mutmaßlichen Todesfälle stammen, die richtige Vergleichsgruppe.
Wird der Zeitverzug nicht beachtet und werden stattdessen die kumulierten Todesfälle durch die kumulierten bestätigten Fälle geteilt, dann sind die Schätzungen der Tödlichkeit von COVID-19 erheblich nach unten verzerrt. Deshalb war eine Todesfall-Rate von knapp 0,2%, wie sie bis vor wenigen Tagen noch vom Geo Health Centre der Universität Bonn im Esri Corona Dashboard berechnet wurde und immer noch im Netz kursiert, irreführend.
Wird allerdings die Dunkelziffer nicht berücksichtigt, dann ist die geschätzte Letalität – d.h. der Anteil der Todesfälle an allen neu Infizierten – systematisch zu hoch.
Gibt es nicht doch Anhaltspunkte oder solide Zeitreihen aus anderen Ländern?
Katharina Schüller: Der Abgleich der Zeitreihen von bestätigten Infektionen und Todesfällen aus China und Deutschland lässt den Schluss zu, dass etwa 11 Tage Verzug das stabilste Verhältnis liefern, d.h. dass es am plausibelsten ist, den Anteil der Todesfälle an der Zahl der bestätigten Fälle 11 Tage zuvor zu berechnen.
Die Zahl der Toten wird fast überall vollständiger sein als die der Infizierten, die eine hohe Dunkelziffer aufweisen. Allerdings gibt es ein "Land", das Kreuzfahrtschiff "Diamond Princess", bei dem von einer vollständigen Erfassung der Infizierten auszugehen ist, weil alle Passagiere getestet wurden. Zwar ist die Besatzung eines Kreuzfahrschiffs älter als die Durchschnittsbevölkerung, aber diese Altersverschiebung können Statistiker herausrechnen. Aus den Daten der "Diamond Princess" ergibs sich nach einer Altersstandardisierung dann eine Letalität von COVID-19, die bei 0,5% liegt – mit einer Unsicherheit, die etwa bei +/-50% liegt.
Dieses rechnerische Ergebnis deckt sich mit der Einschätzung des Virologen Christian Drosten, der die Letalität auf 0,3% bis 0,7% schätzt.
Wie exakt sind die Prognosen und welchen Effekt können wir von Social Distancing Maßnahmen erwarten?
Katharina Schüller: Die Entwicklung der Infektionen hängt im Wesentlichen von drei Annahmen ab: Erstens, wie viele Menschen eine infizierte Person ansteckt. Zweitens, wie lange eine infizierte Person ansteckend ist. Drittens, ob Immunität eintritt.
Alle diese Annahmen sind unsicher. Statistik/Epidemiologie und virologische Expertise sind gleichermaßen vonnöten, um aus den Daten zumindest grobe Schätzungen zu erhalten und die Krankheitsverläufe zu beurteilen. Häufig ist zu lesen, dass ein (unerkannt) Infizierter innerhalb von 5 Tagen zwei bis drei weitere Personen anstecken würde, wenn er seine sozialen Kontakte wie bisher pflegt. In einer Modellrechnung, die vom Bundesministerium für Gesundheit unter dem Hashtag #wirbleibenzuhause in den sozialen Medien verbreitet wurde, ist ein sogenannter Reproduktionsfaktor von 2,5 Ansteckungen pro Infiziertem angenommen, bis dieser nach 5 Tagen in Quarantäne geht. Das würde rechnerisch zu 406 Infizierten nach 30 Tagen führen. Liegt der Reproduktionsfaktor jedoch tatsächlich bei 2 oder bei 3, dann liegt die Anzahl der Infizierten nach 30 Tagen zwischen 129 und 1010, also um ein Mehrfaches darüber oder darunter.
Wie viele Fallzahlen also in den nächsten Tagen zu erwarten sind, das lässt sich nicht einmal annähernd verlässlich prognostizieren. Dazu sind die Spannbreiten, innerhalb derer die unbekannten Parameter liegen können, viel zu groß. Die Wachstumsrate, über deren absolute Höhe man nur spekulieren kann, spielt dabei eine erheblich größere Rolle als die beobachteten Fallzahlen zu einem bestimmten Zeitpunkt.
Wir reden hier von einer Exponentialfunktion, die für viele Menschen nur schwer greifbar ist.
Katharina Schüller: Ja, richtig. Der Grund für den enormen Einfluss der Wachstumsrate liegt in der exponentiellen Ausbreitung. Wenn die Zahl der Infizierten in einer gegebenen Zeitspanne nicht um einen festen absoluten Betrag wächst, sondern sich um einen bestimmten Faktor vervielfacht, dann spricht man von exponentiellem Wachstum. Exponentielles Wachstum bedeutet also, dass sich die Zahl der Infizierten in einem bestimmten Zeitraum verdoppelt.
So würden aus 10.000 Infizierten innerhalb von sieben Verdopplungs-Zyklen bereits 1,2 Millionen Infizierte, nach weiteren drei Zyklen wären es über 10 Millionen. Exponentielles Wachstum führt rasch zu extrem großen Zahlen, selbst wenn die Ausgangsbasis klein ist. Wenn deshalb nicht auf Dauer verhindert werden kann, dass sich Menschen anstecken, so ist es zumindest sinnvoll, die Ausbreitungszeit zu verlangsamen.
Dies ist der Hintergrund der Überlegung, dass eine Verringerung der sozialen Kontakte auch zu einer Verlangsamung der Ausbreitung von COVID-19 führt, und zwar ebenfalls überproportional. 50% weniger Kontakte verringern in der obigen Modellrechnung die Zahl der tatsächlich Infizierten nach 30 Tagen im Mittel um 96%, 75% weniger Kontakte sogar um 99,4%.
Allerdings täuscht jede Prognose, die keine Angaben über die Prognoseunsicherheit macht, eine Sicherheit vor, die niemand besitzt. Weder lassen die vorhandenen Daten zweifelsfreie Schlüsse auf die wahre Verbreitung oder Ausbreitungsgeschwindigkeit des Corona-Virus zu, noch sind die Auswirkungen verschiedener Maßnahmen klar bezifferbar.
Wie sind die Zahlen und Prognosen zu interpretieren und was bedeutet es, wenn trotz Maßnahmen die Fallzahlen weiter steigen?
Katharina Schüller: In den letzten Tagen sind die Schlagzeilen von der Meldung dominiert, dass die Fallzahlen viel stärker steigen würden als erwartet. Einer solchen Erwartung liegen allerdings Annahmen zugrunde, die wir eben dargestellt haben. Dabei spielt es eben nicht nur eine Rolle, ob die Annahmen zum Zeitpunkt der Prognose zutreffend waren, sondern auch, ob sie nach wie vor zutreffen.
Ändert sich der Anteil der bestätigten Fälle an allen Infizierten, d.h. den bestätigten und der Dunkelziffer, dann können Fallzahlen steigen oder sinken, auch wenn das unterstellte Modell nach wie vor gilt. Die beobachteten Fallzahlen lassen dann keine Rückschlüsse darauf zu, ob die Annahmen über die Ansteckungsraten korrekt waren oder nicht. Deshalb sind Mutmaßungen wie im Focus zu den gestiegenen Fallzahlen der letzten Tage aus unserer Sicht als Fehlschlüsse zu betrachten:
Durch Inkubationszeit, Test- und Auswertungsdauer etc. gehen die heutigen Fallzahlen auf Infektionen von vor 5 bis 10 Tagen zurück. Am Montag wurde allerdings ein neues, schnelleres Testverfahren (CDC-Test) vorgestellt. Mit gutem Grund lässt sich annehmen, dass damit die Test- und Auswertungsdauer in den letzten zwei bis drei Tagen beschleunigt wurde und allein deshalb die Zahl der bestätigten Fälle vorübergehend ansteigt – ein Effekt, der sich durchaus mit den Auswirkungen des "Doppelabiturs" nach Einführung von G8 vergleichen lässt.
Immer wieder werden in der Berichterstattung die aktuellen Maßnahmen den Fallzahlen gegenübergestellt ("trotz der verschärften Maßnahmen sind die Fallzahlen auch gestern weiter gestiegen", u.a. im heute journal oder ähnlich auch bei Spiegel Online). Ob die verschärften Maßnahmen wirken, können wir aber vermutlich erst in 1 bis 2 Wochen beurteilen. Insofern muss der Politik die Zeit gegeben werden, den Erfolg der Maßnahmen zu evaluieren.
[Die Fragen stellte Frank Romeike | RiskNET - The Risk Management Network]
Katharina Schüller, Studium der Psychologie an der TU Dresden, Studium der Statistik an der LMU München, Promotionsstudium an der TU Dortmund, Stipendiatin der Bayerischen EliteAkademie und des Nobelpreisträgerkomitees Lindau.
Sie gründete im Jahr 2003 das Unternehmen STAT-UP Statistical Consulting & Data Science in München, das mit Niederlassungen in Madrid und London europaweit für Unternehmen, Forschungsinstitute und die Öffentliche Hand tätig ist. Der Öffentlichkeit bekannt ist sie durch regelmäßige Radio- und Fernsehbeiträge sowie Fach- und populärwissenschaftliche Publikationen.
Katharina Schüller wurde im Internationalen Jahr der Statistik von der American Statistical Association als "Statistikerin der Woche" vorgestellt, ist Lehrbeauftragte an verschiedenen Hochschulen und als Expertin für Digitalisierung und Data Analytics zudem Mitglied des Beirats der Deutschen Bank und des Beirats von Burda Forward. Ihr Buch "Statistik und Intuition: Alltagsbeispiele kritisch hinterfragt" erschien im Januar 2016 bei Springer.
Kommentare zu diesem Beitrag
"Das Datenchaos macht vielen Menschen Angst, die Unsicherheit grassiert immer weiter. Denn obwohl es keine klare Datenevidenz gibt, ergreifen Politiker Maßnahmen, die uns in unserem Alltag enorm einschränken", so ein Artikel auf Focus Online.
"Genauso, wie man repräsentative Meinungen erheben kann, um beispielsweise Wahlprognosen aufzustellen, könnte man auch testen", erklärt die Statistikerin Katharina Schüller gegenüber FOCUS Online. Wichtig sei es dabei, regelmäßig zu testen, täglich mindestens 300 Menschen zu überprüfen, um die Entwicklung der Zahlen besser zu überwachen. "So kann man sehen, wie sich die Zahl der Infizierten über die Zeit verändert."
Neben den Tests sollten weitere Merkmale erhoben werden: das Alter, Begleiterkrankungen oder ob die Menschen rauchten oder nicht. "So können wir besser sehen, wer wirklich gefährdet ist – und das, schon bevor Symptome auftreten", so Schüller weiter Man müsse Menschen überprüfen, noch bevor sie zum Verdachtsfall würden.
"Wir befinden uns in einer Situation, in der wir sehr schlechte Daten haben", erklärt die Statistikerin. "Derzeit müssen gewichtige Entscheidungen, die in der Geschichte der Bundesrepublik ohne Beispiel sind, im Blindflug getroffen werden. Wir können nur vermuten, welche Maßnahmen wahrscheinlich die Richtige sind. Aber wir haben keine Ahnung, wie gut und wie schnell sie wirken. Damit dürfen wir uns nicht zufrieden geben."
Unterstützung erhält Schüller in der Zwischenzeit auch vom Ärztepräsident Klaus Reinhardt, der solche Tests als eine sehr intelligente Maßnahme hält, um sich ein vollständiges Bild über das Ausmaß der Pandemie zu machen.
Siehe: https://m.focus.de/gesundheit/news/es-grassiert-ungewissheit-repraesentative-tests-sollen-wahres-ausmass-in-deutschland-zeigen_id_11813688.html