13. Statistik MULTIVARIATE DATENREIHEN
ÜBERBLICK
• Einleitung
• Zusammenhangsmaße in Ordinalskala
• Spearmans Rangkorrelationskoeffizent
• Kendalls Tau
KORRELATIONSANALYSE
Ist mindestens eines der beiden Merkmale nominalskaliert, stehen zur Berechnung der Stärke des Zusammenhangs
die sogenannten Kontingenzkoeffizienten und Assoziationsmaße zur Auswahl.
Ist ein Merkmal ordinalskaliert und das andere Merkmal mindestens ordinalskaliert, steht als bekannteste
Kenngröße der Rangkorrelationskoeffizient von Spearman zur Verfügung.
Sind beide Merkmale mindestens intervallskaliert, stehen als bekannteste Kenngrößen der Korrelationskoeffizient
von Bravais-Pearson und das Bestimmtheitsmaß zur Auswahl.
ZUSAMMENHANGSMAßE IN DER ORIDINALSKALA
KORRELATION MIT HILFE VON RANGZAHLEN
Rangkorrelationen für ordinal skalierte Merkmale:
• Verwendung von Rangzahlen: Merkmal Z, Ausprägungen z1,…,zn, der Größe nach ordnen (vom größten zum
kleinsten Wert) z(1),…,z(n) und nummerieren.
• Rangzahl: R(z(i)) = i für i=1,…,n
• Bestimmen Sie die Rangfolge:
• 6 3 7 9 1 2 11 4
• 5 8 1 20 42 3 7 9 13 42
EXKURS: BINDUNGEN
Unter dem Begriff Bindung (engl. Tie) versteht man das Auftreten von mehreren gleichen Werten bei
Rangstatistiken, so dass diesen Werten kein eindeutiger Rang zugeordnet werden kann. Um dennoch eine Rangzahl
zuweisen zu können, wird solchen gebundenen Werten der Durchschnittswert der hypothetischen Ränge
zugeordnet.
Beispiel: Es werden folgende Merkmalsausprägungen gemessen:
1 8,2 2,2 -2 -1 2,2 5,3 2,2 8,1 7 5,3
Sortiert:
8,2 8,1 7 5,3 5,3 2,2 2,2 2,2 1 -1 -2
, SPEARMANS RANGKORRELATION
Spearmans Rangkorrelation wird eingesetzt, wenn…
… zwei Variablen (x, y) mindestens ordinalskaliert sind.
… eine intervallskalierte und eine ordinalskalierte Variable vorliegen.
… intervallskalierte Variablen vorliegen aber die Normalverteilungsannahme verletzt ist.
Vorsicht:
• Wenn Rangplätze mehrfach besetzt sind („Rangbindung“), sollte Spearmans Rangkorrelation nicht verwendet
werden.
• In diesem Fall empfiehlt sich die Verwendung von Kendalls τ.
RANG-KORRELATIONSKOEFFIZIENT (SPEARMANS RHO)
• Dass die Originalmessergebnisse nur über ihre Position in den jeweiligen Ranglisten, d.h. indirekt in die Berechnung
des Rang-Korrelationskoeffizienten einfließen, bedeutet eine Informationsreduktion.
• Auf der anderen Seite können dadurch nichtlineare Zusammenhänge beschrieben werden.
• Der Rang-Korrelationskoeffizient liefert Werte von –1 bis +1.
KORRELATION
Spearmansche Rangkorrelationskoeffizient rs
mit
Wert +1 schon bei monoton wachsenden Beobachtungen, d.h. es gilt für alle (xi,yi), (xj,yj): mit xi < xj ist auch yi < yj
VEREINFACHTE BERECHNUNG
Einfachere Formel für den Spearman‘schen Korrelationskoeffizienten, wenn keine Bindungen auftreten (falls alle xi
und yi verschieden sind (und di=R(xi)–R(yi)):
ÜBERBLICK
• Einleitung
• Zusammenhangsmaße in Ordinalskala
• Spearmans Rangkorrelationskoeffizent
• Kendalls Tau
KORRELATIONSANALYSE
Ist mindestens eines der beiden Merkmale nominalskaliert, stehen zur Berechnung der Stärke des Zusammenhangs
die sogenannten Kontingenzkoeffizienten und Assoziationsmaße zur Auswahl.
Ist ein Merkmal ordinalskaliert und das andere Merkmal mindestens ordinalskaliert, steht als bekannteste
Kenngröße der Rangkorrelationskoeffizient von Spearman zur Verfügung.
Sind beide Merkmale mindestens intervallskaliert, stehen als bekannteste Kenngrößen der Korrelationskoeffizient
von Bravais-Pearson und das Bestimmtheitsmaß zur Auswahl.
ZUSAMMENHANGSMAßE IN DER ORIDINALSKALA
KORRELATION MIT HILFE VON RANGZAHLEN
Rangkorrelationen für ordinal skalierte Merkmale:
• Verwendung von Rangzahlen: Merkmal Z, Ausprägungen z1,…,zn, der Größe nach ordnen (vom größten zum
kleinsten Wert) z(1),…,z(n) und nummerieren.
• Rangzahl: R(z(i)) = i für i=1,…,n
• Bestimmen Sie die Rangfolge:
• 6 3 7 9 1 2 11 4
• 5 8 1 20 42 3 7 9 13 42
EXKURS: BINDUNGEN
Unter dem Begriff Bindung (engl. Tie) versteht man das Auftreten von mehreren gleichen Werten bei
Rangstatistiken, so dass diesen Werten kein eindeutiger Rang zugeordnet werden kann. Um dennoch eine Rangzahl
zuweisen zu können, wird solchen gebundenen Werten der Durchschnittswert der hypothetischen Ränge
zugeordnet.
Beispiel: Es werden folgende Merkmalsausprägungen gemessen:
1 8,2 2,2 -2 -1 2,2 5,3 2,2 8,1 7 5,3
Sortiert:
8,2 8,1 7 5,3 5,3 2,2 2,2 2,2 1 -1 -2
, SPEARMANS RANGKORRELATION
Spearmans Rangkorrelation wird eingesetzt, wenn…
… zwei Variablen (x, y) mindestens ordinalskaliert sind.
… eine intervallskalierte und eine ordinalskalierte Variable vorliegen.
… intervallskalierte Variablen vorliegen aber die Normalverteilungsannahme verletzt ist.
Vorsicht:
• Wenn Rangplätze mehrfach besetzt sind („Rangbindung“), sollte Spearmans Rangkorrelation nicht verwendet
werden.
• In diesem Fall empfiehlt sich die Verwendung von Kendalls τ.
RANG-KORRELATIONSKOEFFIZIENT (SPEARMANS RHO)
• Dass die Originalmessergebnisse nur über ihre Position in den jeweiligen Ranglisten, d.h. indirekt in die Berechnung
des Rang-Korrelationskoeffizienten einfließen, bedeutet eine Informationsreduktion.
• Auf der anderen Seite können dadurch nichtlineare Zusammenhänge beschrieben werden.
• Der Rang-Korrelationskoeffizient liefert Werte von –1 bis +1.
KORRELATION
Spearmansche Rangkorrelationskoeffizient rs
mit
Wert +1 schon bei monoton wachsenden Beobachtungen, d.h. es gilt für alle (xi,yi), (xj,yj): mit xi < xj ist auch yi < yj
VEREINFACHTE BERECHNUNG
Einfachere Formel für den Spearman‘schen Korrelationskoeffizienten, wenn keine Bindungen auftreten (falls alle xi
und yi verschieden sind (und di=R(xi)–R(yi)):