Hydrophil SH - Alles über Gewässer in Schleswig-Holstein

Die Datenkrake: Statistik-Lexikon

zurück

Keine Ahnung von Statistik? Kein Problem! Ich erkläre hier Statistik auf eine Weise, die hoffentlich Jeder versteht, der die Grundrechenarten und Bruchrechnung beherrscht. Das Statistik-Lexikon entsteht schrittweise und teilweise unsystematisch. Die veröffentlichten Teile sind aber inhaltlich solide. Für Fragen und Hinweise bin ich dankbar.


Inhalt


Was ist Statistik?

Statistik ist die Wissenschaft davon, wie man aus großen Mengen von Daten sinnvolle kompakte Zusammenfassungen erstellt. Statistik ist die Kunst, von Teilen aufs Ganze zu schließen. Statistik ist gewissermaßen die Wissenschaft vom "genau genug".


Die einfachste Statistik: die Anzahl

Die einfachste Statistik ist mit Sicherheit die schlichte Anzahl: Wie viele Menschen haben in der Badesaison 2023 den Strand von Scharbeutz besucht, wie viele den Strand von Damp, wie viele den von St. Peter-Ording und wie viele den von Westerland? Wenn wir diese Zahlen haben, können wir die Strände nach Besucherzahlen vergleichen und haben schon ein kleines aber relevantes statistisches Ergebnis. Zum Beispiel brauchen öffentliche Badestrände mit mehr Besucherinnen vermutlich auch mehr Infrastruktur wie Mülleimer und Toiletten.


Die zweiteinfachste Statistik: der Median

Der Median der im wahrsten Sinne des Wortes "mittlere Wert" einer Reihe von Zahlen.


Die bekannteste Statistik: das arithmetische Mittel, auch bekannt als der Durchschnitt

Die bekannteste Statistik ist vermutlich der Durchschnitt. Er wird auch "Mittelwert" genannt und heißt wissenschaftlich korrekt "arithmetisches Mittel". Idealerweise benutzt man letzteren Begriff; denn es gibt noch andere Mittelwerte wie den Median.

Das arithmetische Mittel einer Zahlenreihe wird errechnet, indem man alle Zahlen addiert und dann das Ergebnis durch die Anzahl der Zahlen dividiert.

Für den Einstieg sei hier ein sehr einfaches und hoffentlich anschauliches Beispiel gegeben: die Aufteilung einer Torte. Angenommen acht Personen teilen sich eine Torte. Diese acht Personen sind aber sehr unterschiedlich hungrig, weshalb manche von ihnen sehr kleine Stücke essen und manche sehr große Stücke. Wir wissen nicht, wie groß die Tortenstücke wirklich sind - nur dass sie sehr unterschiedlich groß sind. Was wir trotzdem sagen können, ist, dass jede der acht Personen ein Stück der Torte gegessen hat. Deshalb gehen wir mangels genauerer Informationen einfach davon aus, dass die Stücke alle gleich groß waren. Wir teilen also im Geiste eine Torte gleichmäßig unter acht Personen auf. Eins geteilt durch acht ergibt ein Achtel. Soviel hat jede Person durchschnittlich gegessen: ein Achtel der Torte.


Wenn acht Personen eine Torte untereinander irgendwie aufteilen, isst in jedem Szenario jede Person durchschnittlich ein Achtel der Torte.


Betrachten wir ein weiteres Beispiel, dass schon ein wenig komplexer ist aber besser zu Hydrophil SH passt: Angenommen wir hätten fünf kleine Seen und wollten das arithmetische Mittel ihrer Oberflächengrößen bestimmen. See A habe eine 12.000 m² große Oberfläche, die Oberfläche von See B sei 28.000 m² groß, die von See C 40.000 m², die von See D 19.000 m² und See E habe 72.000 m² Oberfläche. Um das arithmetische Mittel zu finden addieren wir also 12.000 m² + 28.000 m² + 40.000 m² + 19.000 m² + 72.000 m² = 171.000 m². Durch die Anzahl der Seen geteilt ergibt sich 71.000 m² / 5 = 34.200 m². Die See-Oberflächen sind also im arithmetischen Mittel oder, umgangssprachlich ausgedrückt, durchschnittlich 34.200 m² groß.

Indem wir das arithmetische Mittel bestimmen, tun wir so, als wäre die Summe der Werte völlig gleich auf ihre Einzelteile verteilt. Wenn wir sagen: "Die fünf Seen sind durchschnittlich 34.200 m² groß." sagen wir genau genommen: "Wenn wir die Oberfläche der fünf unterschiedlich großen Seen zu einer einzigen See-Oberfläche zusammenfassten und diese dann wieder in fünf gleich große Teile aufteilten, dann würden Seen mit der Oberflächengröße von 34.200 m² herauskommen.


Probleme mit arithmetischem Mittel und Median

Das arithmetische Mittel und der Median sind sehr einfach zu errechnen. Diese Einfachheit hat ihren Preis: Sie sind so einfach, dass sie oft nicht aussagekräftig genug sind.


Die überflüssigste Statistik: Prozente

Prozentwerte werden in den Nachrichten sehr häufig benutzt. Man findet sie in Aussagen wie "95 Prozent der Deutschen glauben dieses, aber 60 Prozent der Deutschen tun trotzdem jenes." Trotz der Allgegenwärtigkeit von Prozentzahlen vermute ich, dass Viele ihre Bedeutung nicht verstehen. Deshalb folgt nun eine Erklärung dafür, was Prozente eigentlich sind.

"Prozent" geht auf das Lateinische "pro cent" zurück und heißt auf Deutsch "von hundert". Tatsächlich wird das Wort "Prozent" im Amtsdeutsch manchmal noch mit "v.H." für "vom Hundert" abgekürzt. Sehr viel üblicher ist aber das Zeichen "%" als Abkürzung für "Prozent".

Das Prozent-Prinzip ist eine Methode, um über Teile und ihr Verhältnis zum Ganzen zu sprechen - ohne das Ganze konkret beziffern zu müssen. Wir legen einfach fest, dass das Ganze "100 %" heißt. Außerdem tun wir so, als bestehe das Ganze aus 100 gleich großen Teilen; so als nähmen wir eine Fuhre Sand und machten 100 gleich große Haufen daraus. Damit wird auch schon eine Eigenschaft des Prozent-Prinzips deutlich: Wir können uns über einen Teil informieren und wissen dann übers Ganze Bescheid. Wir wiegen zum Beispiel nur einen der 100 Sandhaufen und wissen dann, wie viel unsere Fuhre Sand insgesamt wiegt. Anders gesagt: Wenn 1 % unseres Sandes 5 Kilogramm wiegt, dann wiegen die ganzen 100 % Sand 500 Kilogramm.

Wenn das Ganze aus 100 Teilen besteht, dann besteht die Hälfte natürlich aus 50 Teilen. So bedeutet die Formulierung "50 %" exakt das Gleiche wie "die Hälfte". Wenn wir beispielsweise sagen, dass sich bei einer Party 50 % der Gäste gut amüsieren, heißt das, dass sich die Hälfte der Gäste gut amüsiert. Wenn die besagte Party aber so aussieht, dass zwei Kumpels sich zum Saufen treffen - dann besteht die Hälfte der Partygäste aus exakt einer Person. Aus der Aussage, dass 50 % der Gäste sich gut amüsieren, wird bei genauerem Hinsehen also die Aussage, dass sich ein Gast gut amüsiert. Würden wir vom Wacken Open Air reden, wären 50 % der Gäste mehrere Tausend. Ob wir in solchen Fällen "50 %" oder "die Hälfte" sagen, ist vollkommen egal - beides ist korrekt und kann trotzdem irreführend sein. Wenn wir als ehrliche Statistiker mit Prozenten arbeiten wollen, müssen wir also immer sagen, wie viel unsere 100 Prozent in Wirklichkeit sind. Andere Anteile als die Hälfte können wir in Prozent ausdrücken, indem wir 100 durch den jeweiligen Nenner teilen. Wollen wir ein Drittel in Prozent ausdrücken, teilen wir 100 durch 3 und erhalten den etwas lästigen Dezimalbruch 100 / 3 = 33,33. Ein Drittel entspricht also 33,33 %. Etwas praktischer ist es schon bei einem Viertel; denn 100 / 4 = 25. Also entspricht ein Viertel 25 %

Bevor wir anfangen, mit Prozenten zu rechnen, müssen wir also eine Mini-Gleichung aufstellen, indem wir unser Ganzes mit 100 % gleichsetzen. Reden wir von einem Apfel, dann lautet die Gleichung: 1 Apfel = 100 %. Daraus folgt: 1/2 Apfel = 50 %. Reden wir von einer Gruppe von Menschen, zum Beispiel von den Einwohnern der Kleinst-Stadt Arnis an der Schlei, dann lautet die Gleichung: 273 Einwohner = 100 %.

Warum bezeichne ich Prozente nun aber als "die überflüssigste Statistik"? Das ist natürlich leicht übertrieben, aber eben nur leicht.

Roland Westphal, der von 1980 bis 2014 an der Schleswiger Lornsenschule Biologie, Chemie und gelegentlich auch Philosophie und Statistik unterrichte, sagte einmal: "Wenn Ihnen jemand mit Prozentwerten kommt, gehen Sie immer davon aus, dass man Sie verarschen will." Warum diese pointierte Aussage? Weil man bei der Nutzung von Prozentwerten immer so tut, als ob man von exakt hundert Objekten - z.B. von Äpfeln, Flüssen, Menschen, Häusern - spreche. In Wirklichkeit könnten es aber auch tausend oder nur ein einziges sein. Wenn ich also sage "Ich habe eine Umfrage gemacht und 90 Prozent der Befragten stimmen mir zu." ist es völlig offen, ob mir 9 von 10 Leuten zustimmen oder 900 von 1.000. Oder wie oben beschrieben kann hinter einer Prozentzahl auch ein einziger Mensch stehen. Und eine Gruppe von Menschen, die in Prozenten ausgedrückt nach einer deutlichen Mehrheut aussieht, kann in absoluten Zahlen eine kleine Minderheit sein. Vergleicht man also Prozentangaben miteinander, sollte man sich vorher davon überzeugen, dass die zugrundeliegenden echten Sachverhalte auch sinnvoll vergleichbar sind.