Das Kefk Network Wiki befindet sich im Testbetrieb.


Zusammenhangsmaß

Aus Kefk.

Wechseln zu: Navigation, Suche
[[Hilfe:Cache|Fehler beim Thumbnail-Erstellen]]: convert: unable to open image `/var/www/kefk/w/images/a/ac/Zusammenhangsmaße.png': No such file or directory.
Zusammenhangsmaße

Ein Zusammenhangs- bzw. Assoziationsmaß gibt in der Statistik die Stärke und ggf. die Richtung eines Zusammenhangs zweier Größen wieder.


Inhaltsverzeichnis

Zusammenhangsmaße vs. Testgrößen

Zusammenhangsmaße (siehe unten) sollten von Testgrößen unterschieden werden, die für einen Test auf Signifikanz verwendet werden - wie T für den T-Test, F für F-Test und Varianzanalyse oder Chi-Quadrat für den Chi-Quadrat-Test. Dabei wird eine theoretische Testgröße, die sich nach dem angestrebten Signifikanzniveau und nach der Zahl der Freiheitsgrade richtet, mittels Tabellen mit der errechneten Testgröße verglichen. Moderne Statistiksoftware (SPSS, SAS, S-Plus, R) gibt neben den Testgrößen auch immer ein exaktes Signifikanzniveau an. Dabei entspricht beispielsweise ein Wert von p = 0,0489 einer Irrtumswahrscheinlichkeit α von 4,89 Prozent.


Nichtstandardisierte Zusammenhangsmaße

Als nichtstandartisierte Zusammenhangsmaße werden werden Zusammenhangansmaße bezeichnet, die ausschließlich für Tabellen mit derselben Fallzahl vergleichbar sind. Um sie universell vergleichbar zu machen, müssen sie standardisiert werden. Das kann, auch bei demselben nichtstandardisierten Maß, auf unterschiedliche Weise geschehen, wodurch sich teilweise aus ein und demselben nichtstandardisierten Maß mehrere standardisierte Zusammenhangsmaße ergeben können. Beispiele sind:

  • metrisch/metrisch: Kovarianz
  • ordinal/ordinal: Kovarianz für Rangplätze
  • ordinal/ordinal: Die Differenz aus der jeweiligen Anzahl konkordanter und diskordanter Paare (NcNd)

Standardisierte Zusammenhangsmaße

Beispiele für standardisierte Zusammenhangsmaße sind:

Man muss beachten, dass zwei Merkmale bzw. zwei Variablen unterschiedliche Skalenniveaus besitzen können, daher bietet die obige Auflistung nur einen kleinen Überblick.

Kontingenzkoeffizient C (nach Karl Pearson)

In der Statistik drückt der Pearsonsche Kontingenzkoeffizient die Stärke des Zusammenhangs zwischen zwei (oder mehreren) qualitativen Merkmalen aus. Er basiert auf dem Vergleich von tatsächlich ermittelten Häufigkeiten zweier Merkmale mit den Häufigkeiten die man bei Unhabhängigkeit dieser Merkmale erwartet hätte.

χ2 kann grundsätzlich sehr große Werte annehmen und ist nicht auf die Bildmenge [0,1] beschränkt. Dazu wird aus dem χ2 der sogenannte Kontingenzkoeffizient nach Karl Pearson ermittelt:

C=\sqrt{\frac{\chi ^2}{\chi^2 + n}}.
Dabei ist n die Fallzahl und χ2 ein Maß für den Unterschied zwischen beobachteten und erwarteten Häufigkeiten.

Wenn k = min( | I | , | J | ) das Minimum aus der Anzahl der möglichen Merkmalausprägungen ist, dann gilt C\in \left[0,\sqrt{\frac{k-1}{k}} \right]. Daher benutzt man auch häufig den korrigierten Kontigenzkoeffizient:

C_{korr}=\sqrt{\frac{k}{k-1}} \cdot C = \sqrt{\frac{k}{k-1}} \cdot \sqrt{\frac{\chi ^2}{n+\chi ^2}}.

Ein Ckorr nahe 0 deutet dabei auf unabhängige Merkmale hin, ein Ckorr in der Nähe von 1 dagegen auf ein hohes Maß an Abhängigkeit.

Siehe auch

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Zusammenhangsma%C3%9F, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge
Andere Sprachen