Das Kefk Network Wiki befindet sich im Testbetrieb.
Deskriptive Statistik
Aus Kefk.
Die deskriptive oder beschreibende Statistik ist der Zweig der Statistik, in dem alle Techniken zusammengefasst werden, die eine Menge von beobachteten Daten summarisch darstellen. Man spricht auch vom direkten Schluss oder Inklusionsschluss, bei dem von der Grundgesamtheit auf die Stichprobe geschlossen wird.
Von der induktiven oder inferentiellen Statistik (Inferenzstatistik) unterscheidet sich die deskriptive Statistik dadurch, dass sie keine Aussagen zu einer über die untersuchten Fälle hinausgehenden Grundgesamtheit macht. Beim Konklusionsschluss (indirekter Schluss) der inferentiellen Statistik ist es also umgekehrt: Dort werden ausgehend von der Stichprobe unbekannte Parameter der Grundgesamtheit geschätzt.
Inhaltsverzeichnis |
Deskriptive Zusammenfassung von Daten
Im Einzelnen gibt es folgende Möglichkeiten der Zusammenfassung:
- Tabellarische Auflistung
- Grafische Darstellung
- Berechnung von statistischen Kennwerten
Kenngrößen (statistische Kennwerte)
Zwei Arten von Kenngrößen sind hauptsächlich von Interesse:
Lagemaße - zentrale Tendenz einer Häufigkeitsverteilung
- Mittelwert
- Median
- Modus oder Modalwert
- Quantile (Quartile, Dezile)
Streuungsmaße - Streuung oder Dispersion der Verteilung
- Varianz
- Standardabweichung (radizierte Varianz)
- Variationsbreite, auch Spannweite (range) genannt
- Interquantilbereiche
- Mittlere Absolute Abweichung
Aus der Lage der verschiedenen Schätzwerte für die zentrale Tendenz zueinander lassen sich Schiefe und Exzess einer Verteilung bestimmen.
Die Wahl der geeigneten Kenngrößen hängt zum einen von dem Skalen- oder Messniveau der Daten und zum anderen von den gewünschten Robustheitseigenschaften der Kenngröße ab.
Beispiele
- Darstellung der Durchschnittstemperatur und der Temperaturschwankungen in einer Region durch Mittelwert und Streuung; Angabe, wie oft bestimmte Temperaturen überschritten werden (Quantile); Vergleich nach Regionen und/oder Zeiträumen mithilfe von Grafiken oder Tabellen.
- In einer Urne sind fünf rote und vier blaue Kugeln. Es werden drei Kugeln ohne Zurücklegen aus dieser Urne gezogen. Definiert man die Zufallsvariable X: Zahl der roten Kugeln unter den drei gezogenen, ist X hypergeometrisch verteilt mit M=5 als Zahl der roten Kugeln in der Urne, N=9 als Gesamtzahl der Kugeln in der Urne und n=3 als Zahl der Versuche. Hier können alle Informationen über die Verteilung von X gewonnen werden.
Siehe auch
- Datenschürfung (data mining)
- Häufigkeitsverteilung
- Kontingenztafel
- Lorenzkurve
- Schätzen und Testen
- signifikante Stellen eines Messergebnisses
- Versuchsplanung
Literatur
- Bol, Georg: Deskriptive Statistik. Oldenbourg Verlag 2004, ISBN 3486576127.
- Burkschat, M.; Cramer, E.; Kamps, U.: Beschreibende Statistik. Grundlegende Methoden. Springer, Berlin 2004, ISBN 3-540-03239-8.
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Deskriptive_Statistik, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
