10. Statistik Multivariate Datenreihen
Überblick:
• Kontingenztabelle
• Randhäufigkeiten
• Bedingte Verteilung bivariater Daten
• Diagramme zur Darstellung bivariater Daten
VERFAHREN DER DATENANALYSE IM ÜBERBLICK
Anzahl Variablen
Univariate Verfahren Bi- und Multivariate Verfahren
Maße Zentralen Tendenz Variabilitätsmaße Dependenzanalysen Interdependenzanalysen
Modus Spanne Kontingenztabelle Faktorenanalyse
Median Varianz Korrelation Multidim. Skalierung
Mittelwert Standardabweichung Regressionsanalyse Clusteranalyse
Conjointanalyse
Varianzanalyse
KONTINGENZMAßE
• Kontingenzmaße decken Beziehungen zwischen Variablen auf und messen die Stärke des Zusammenhangs
• die Richtung der Wirkungsweise wird nicht erfasst in dem Sinne, dass ein wachsendes X mit wachsendem Y
einhergeht
• alle Merkmale werden wie nominalskalierte Merkmale behandelt, wobei die Ordinalskaleninformationen bzw.
metrische Skaleninformationen verloren gehen
Y
nominal ordinal metrisch
X nominal
ordinal
Kontingenz
Kontingenz
Kontingenz
Rang-Korrelation
Kontingenz
Rang-Korrelation
metrisch Kontingenz Rang-Korrelation Korrelation
, KONTINGENZTABELLE
Zur Veranschaulichung und Herausarbeitung von Zusammenhängen zwischen zwei (oder auch mehreren) Variablen
dient die Kontingenztabelle (auch Kreuztabelle oder Kontingenztafel)
Es werden in einer Matrix für alle möglichen Kombinationen der Merkmalsausprägungen zweier Merkmale, die
(absoluten bzw. relativen) Häufigkeiten angegeben
Zur Darstellung des Zusammenhangs wird nur das Nominalskalenniveau bzw. Ordinalskalenniveau der Merkmale
benutzt, auch wenn die Merkmale ein höheres Messniveau aufweisen
Auf Basis der Kontingenztabelle lassen sich dann Maße für die Stärke des Zusammenhangs zwischen den beiden
Merkmalen herausarbeiten
X Y b1 … bs Summe
a1 h11 … h1s h1.
… … … … …
ar hr1 … hrs hr1.
Summe h. 1 … h.s n
Merkmal Y
b1 b2 … bm Randverteilung von x
a1 h(a1,b1) h(a1, b2) … h(a1, bm)
a2 h(a2, b1) h(a2, b2) … h(a2, bm)
…
ak h(ak, b1) h(ak, b2) … h(ak, bm)
… Randverteilung von Y
Merkmal X
Zwei Merkmale Kombinationen von Ausprägungen
• Absolute Häufigkeit: ℎ𝑖𝑗 = ℎ(𝑎𝑖,𝑏𝑗)
Überblick:
• Kontingenztabelle
• Randhäufigkeiten
• Bedingte Verteilung bivariater Daten
• Diagramme zur Darstellung bivariater Daten
VERFAHREN DER DATENANALYSE IM ÜBERBLICK
Anzahl Variablen
Univariate Verfahren Bi- und Multivariate Verfahren
Maße Zentralen Tendenz Variabilitätsmaße Dependenzanalysen Interdependenzanalysen
Modus Spanne Kontingenztabelle Faktorenanalyse
Median Varianz Korrelation Multidim. Skalierung
Mittelwert Standardabweichung Regressionsanalyse Clusteranalyse
Conjointanalyse
Varianzanalyse
KONTINGENZMAßE
• Kontingenzmaße decken Beziehungen zwischen Variablen auf und messen die Stärke des Zusammenhangs
• die Richtung der Wirkungsweise wird nicht erfasst in dem Sinne, dass ein wachsendes X mit wachsendem Y
einhergeht
• alle Merkmale werden wie nominalskalierte Merkmale behandelt, wobei die Ordinalskaleninformationen bzw.
metrische Skaleninformationen verloren gehen
Y
nominal ordinal metrisch
X nominal
ordinal
Kontingenz
Kontingenz
Kontingenz
Rang-Korrelation
Kontingenz
Rang-Korrelation
metrisch Kontingenz Rang-Korrelation Korrelation
, KONTINGENZTABELLE
Zur Veranschaulichung und Herausarbeitung von Zusammenhängen zwischen zwei (oder auch mehreren) Variablen
dient die Kontingenztabelle (auch Kreuztabelle oder Kontingenztafel)
Es werden in einer Matrix für alle möglichen Kombinationen der Merkmalsausprägungen zweier Merkmale, die
(absoluten bzw. relativen) Häufigkeiten angegeben
Zur Darstellung des Zusammenhangs wird nur das Nominalskalenniveau bzw. Ordinalskalenniveau der Merkmale
benutzt, auch wenn die Merkmale ein höheres Messniveau aufweisen
Auf Basis der Kontingenztabelle lassen sich dann Maße für die Stärke des Zusammenhangs zwischen den beiden
Merkmalen herausarbeiten
X Y b1 … bs Summe
a1 h11 … h1s h1.
… … … … …
ar hr1 … hrs hr1.
Summe h. 1 … h.s n
Merkmal Y
b1 b2 … bm Randverteilung von x
a1 h(a1,b1) h(a1, b2) … h(a1, bm)
a2 h(a2, b1) h(a2, b2) … h(a2, bm)
…
ak h(ak, b1) h(ak, b2) … h(ak, bm)
… Randverteilung von Y
Merkmal X
Zwei Merkmale Kombinationen von Ausprägungen
• Absolute Häufigkeit: ℎ𝑖𝑗 = ℎ(𝑎𝑖,𝑏𝑗)