Das Kefk Network Wiki befindet sich im Testbetrieb.
Streudiagramm
Aus Kefk.
Ein Streudiagramm (engl. Scatterplot) ist die graphische Darstellung von beobachteten Wertepaaren zweier statistischer Merkmale. Diese Wertepaare werden in ein kartesisches Koordinatensystem eingetragen, wodurch sich eine Punktwolke ergibt. Die Darstellung der Punkte kann durch verschiedene kleine Symbole erfolgen.
Man erhofft sich durch das Muster der Punkte im Streudiagramm Informationen über die Abhängigkeitsstruktur der beiden Merkmale.
Beispiele
Als Ergebnisse der Mikrozensus-Befragung im Mai 2003 durch das statistische Bundesamt sind die durchschnittlichen Gewichte von Männern nach Altersklassen gegeben. Für das Streudiagramm der Gewichte nach Alter wurden die Altersklassen durch die Klassenmitten ersetzt.
Bild:StreuDat.png Daten: Durchschnittliches Gewicht von Männern nach Alter (Quelle:© Statistisches Bundesamt, Wiesbaden 2004) | Bild:Scatterplot.png Streudiagramm: Durchschnittliches Gewicht von Männern nach Alter (Quelle der Daten:© Statistisches Bundesamt, Wiesbaden 2004) |
Ein weiteres Beispiel zeigt die Streudiagramme einer Vorlesungsevaluation. Es wurden Noten von 1 bis 4 vergeben.
Bild:StreuJit.png Jittered Scatterplot. Evaluation einer Statistik-Vorlesung. "Stoff verständlich" versus "Gesamtnote" | Bild:StreuSonne.png Sonnenblumen-Streudiagramm. Evaluation einer Statistik-Vorlesung. "Stoff verständlich" versus "Gesamtnote" |
Besonderheiten
Es sind im allgemeinen nur metrisch skalierte Daten für Streudiagramme geeignet. Beobachtungen ordinalskalierter Merkmale überlagern sich, wenn gleiche Werte mehrfach vorliegen. Es gibt jedoch auch Möglichkeiten, ordinalskalierte Merkmale in Streudiagramme darzustellen:
- Durch Sonnenblumen: Es wird an jedem Koordinatenpaar ein Kreis eingetragen. Die Zahl der Wertepaare, die auf diesem Punkt liegen, wird durch Striche an den Kreis dargestellt, so dass sich eine stilisierte Sonnenblume ergibt.
- Durch einen Jittered Scatterplot ("Verwackeltes Streudiagramm"): Es werden auf die Daten kleine Zufallszahlen addiert, so dass die Werte leicht auseinander gezogen werden und eine Punktwolke ergeben. Man muss sich allerdings im Klaren sein, dass die Werte eigentlich übereinanderliegen. Man könnte sie als "pseudometrisch" bezeichnen.
Als Beispiel wurde die Evaluation einer Statistikvorlesung verwendet. Es wurden Streudiagramme bezüglich "Der vermittelte Vorlesungsstoff ist gut verständlich" und "Gesamte Beurteilung der Vorlesung Betriebsstatistik" erstellt. Bei dem Jittered Scatterplot wurde auf die Werte eine gleichverteilte Zufallszahl im Intervall [-0,3;0,3] addiert.
