Wichtige Kennzahlen der deskriptiven Statistik
Die deskriptive Statistik beschreibt und komprimiert Datensätze, ohne Rückschlüsse auf eine größere Grundgesamtheit zu ziehen. Sie ist das unverzichtbare Handwerkszeug für Schüler, Studierende, Wissenschaftler und Datenanalysten. Anstatt hunderte Einzelwerte zu betrachten, fasst sie die wesentlichen Informationen in wenige aussagekräftige Kennzahlen:
- Lagemaße: Mittelwert, Median, Modus – zeigen, wo die Mitte der Daten liegt
- Streuungsmaße: Varianz, Standardabweichung, Spannweite – zeigen, wie weit die Werte auseinanderliegen
- Extremwerte: Minimum, Maximum, Quartile – beschreiben die Grenzen der Verteilung
Ob Sie Testergebnisse einer Schulklasse auswerten, Verkaufszahlen analysieren oder wissenschaftliche Messdaten untersuchen – der erste Schritt ist stets die deskriptive Zusammenfassung. Unser Statistik-Rechner erledigt das in Sekunden, inklusive Umschaltung zwischen Stichproben- und Populationsformeln.
Mittelwert vs. Median: Was ist der Unterschied?
Der arithmetische Mittelwert ist die Summe aller Werte geteilt durch ihre Anzahl – das, was die meisten Menschen als „Durchschnitt" kennen. Er ist intuitiv verständlich, hat jedoch einen gravierenden Schwachpunkt: Ausreißer verzerren ihn stark.
Ein klassisches Beispiel: Das Durchschnittseinkommen in Deutschland liegt brutto bei ca. 4.323 € pro Monat. Klingt ordentlich – doch die Mehrheit der Beschäftigten verdient weniger, weil sehr hohe Gehälter von Topverdienern den Mittelwert nach oben ziehen. Der Median liegt dagegen bei rund 3.500 € und spiegelt die tatsächliche Einkommensmitte der Bevölkerung weit realistischer wider.
Praxisbeispiel: Ausreißereffekt
Datenreihe: {10, 12, 11, 13, 10, 11, 250}
Mittelwert: (10+12+11+13+10+11+250) ÷ 7 = 45,28 – stark verzerrt durch den Ausreißer 250
Median: Sortiert: 10, 10, 11, 11, 12, 13, 250 → Mitte = 11 – robust & realistisch
Als Faustformel gilt: Verwenden Sie den Median bei schiefen Verteilungen oder starken Ausreißern (Einkommen, Immobilienpreise). Verwenden Sie den Mittelwert bei annähernder Normalverteilung ohne extreme Ausreißer (Körpergrößen, kontrollierte Messwerte).
Varianz und Standardabweichung einfach erklärt
Lagemaße allein reichen nicht aus. Stellen Sie sich zwei Schulklassen vor: Klasse A hat Noten {5, 5, 5, 5, 5}, Klasse B hat Noten {1, 2, 5, 8, 9}. Beide haben denselben Mittelwert (5), aber eine völlig unterschiedliche Streuung. Genau hier kommen Varianz und Standardabweichung ins Spiel.
Die Varianz summiert die quadrierten Abweichungen der einzelnen Werte vom Mittelwert und teilt durch n (Grundgesamtheit) oder n–1 (Stichprobe). Das Quadrieren verhindert, dass sich positive und negative Abweichungen aufheben, und gewichtet größere Ausreißer stärker.
Da die Einheit der Varianz quadratisch ist (z. B. €²), zieht man die Wurzel und erhält die Standardabweichung – sie hat dieselbe Einheit wie die Originaldaten. Bei einer Normalverteilung gilt die 68-95-99,7-Regel:
- ~68 % der Werte liegen innerhalb von ±1 Standardabweichung vom Mittelwert
- ~95 % der Werte liegen innerhalb von ±2 Standardabweichungen
- ~99,7 % der Werte liegen innerhalb von ±3 Standardabweichungen
Stichprobe (n–1) oder Grundgesamtheit (n)?
Grundgesamtheit (Population): Sie kennen jeden einzigen Wert – etwa alle Noten einer Schulklasse. Dann teilen Sie durch n.
Stichprobe (Sample): Sie kennen nur einen Teil der Daten und möchten auf die Grundgesamtheit schließen – etwa 200 befragte Bürger einer Stadt. Dann teilen Sie durch n–1. Diese Besselsche Korrektur macht die Varianzschätzung erwartungstreu, weil der Stichprobenmittelwert selbst ein Schätzer ist und die Abweichungen dadurch systematisch unterschätzt werden. Im Rechner können Sie zwischen beiden Modi wählen.
