Statistik und Daten richtig interpretieren

So eine Statistik ist klar und eindeutig, könnte man meinen. Sie beruht schließlich auf Daten, also auf Fakten. Doch so manche Statistik führt in die Irre und man muss darauf achten, dass man die Zahlen und Daten richtig interpretiert. Im schlimmsten Fall kann man mit einer unpassenden Darstellung sogar etwas manipulieren.

Wer eine Statistik benutzt, muss sie richtig interpretieren.

Der Klassiker mit dem Hasen und dem Jäger

Bevor ich zu einem aktuellen Beispiel bezüglich Corona komme, beginnen wir mal mit einer bekannten Geschichte, die zeigt, wie viel Unsinn man mit Statistik erzählen kann. Stellt euch vor, ein Jäger will einen Hasen (oder ein anderes Tier) erlegen. Zunächst schießt er knapp links vorbei, beim nächsten Versuch schießt er genauso knapp rechts vorbei. Der Jäger denkt: Pech gehabt, knapp verfehlt. Der (schlechte) Statistiker sagt: Im Durchschnitt ist der Hase tot.

Corona und der Prävalenzfehler

Seit Covid-19 in der Welt ist, wird das Coronavirus intensiv erforscht und es gibt ständig neue Erkenntnisse. Leider genauso allgegenwärtig sind die Idioten, die Corona leugnen und Zweifel an der Wissenschaft schüren. Beide Seiten versuchen, die Menschen auch mit echten oder erfundenen Statistiken zu überzeugen. Vor ein paar Wochen kursierte dazu ein Beitrag in den Social Media.

In einer Gruppe von 100 Menschen sind 99 geimpft, einer nicht. Jeweils eine geimpfte und eine ungeimpfte Person kommen mit Covid-19 ins Krankenhaus. Die Manipulierer behaupten nun, dass 50% Geimpfte behandelt werden müssen. Einer von zwei sind tatsächlich 50%, aber mit dieser Rechnung lenkt man von der wesentlichen Erkenntnis ab. Denn wenn man die verschiedenen Gruppen betrachtet, sieht man, dass in diesem Beispiel 100% der Ungeimpften, aber nur etwas mehr als 1% der Geimpften im Krankenhaus sind.

Nun haben wir in Wirklichkeit bekanntlich leider noch keine Impfquote von 99% erreicht. Aber der Fehler in der Argumentation mit den 50/50 ist offensichtlich. Experten sprechen hier von einem Prävalenzfehler. Der diesbezügliche Wikipedia-Artikel erklärt das Phänomen mit einem Beispiel anhand von DNA-Tests.

Irreführende Grafiken

Eine Statistik kann sogar dann einen falschen Eindruck vermitteln, wenn die Daten völlig korrekt erhoben wurden. Das Problem kann nämlich auch in der grafischen Darstellung liegen. Passieren kann das unter anderem, wenn man in einem Koordinatensystem die Balken nicht bei Null, sondern zum Beispiel bei 100 beginnen lässt. Dann sieht man in den Balken nämlich nur den Bereich zwischen 100 und dem jeweiligen Wert, wo die Unterschiede dann größer wirken, als sie tatsächlich sind. Ein paar andere Beispiele zeigt das Wissenschaftsmagazin Quarks in diesem PDF-Dokument (S. 26ff.).

Statistik kritisch hinterfragen

Ein beliebter Satz lautet: „Traue keiner Statistik, die du nicht selbst gefälscht hast.“ Das ist natürlich etwas krass ausgedrückt. Aber auf jeden Fall sollte man die Daten und ihre Darstellung immer kritisch hinterfragen. Neben den schon erwähnten Punkten sind folgende Fragen hilfreich:

  • Ist klar definiert, was die Statistik aussagen soll?
  • Wurden die Daten vernünftig erhoben?
  • Sind die Daten aktuell und vollständig?
  • Werden die Daten sinnvoll verglichen und aufbereitet?
  • Wer hat die Statistik erstellt (möglicher Einfluss von Interessengruppen)?
  • Hat man den Unterschied von Korrelation und Kausalität berücksichtigt (mehr dazu hier)?

Viel Statistik in einem Buch

Wenn ihr euch noch näher mit Statistiken und wissenschaftlicher Arbeit beschäftigen wollt, empfehle ich euch das Buch Die kleinste gemeinsame Wirklichkeit. Darin vermittelt die Wissenschaftsjournalistin Mai Thi Nguyen-Kim auf allgemeinverständliche Weise viel Wissen zu diesem Thema.