6. Graphische Darstellungen
UNIVARIATE GRAPHISCHE DARSTELLUNGEN
Darstellungsformen für Daten:
Tabellen (z.B. Häufigkeiten, Prozent, kumulierte Prozent)
Kennwerte (z.B. Mittelwert und Standardabweichung)
univariate Darstellungen
Ziel ist immer eine übersichtliche Darstellung der tatsächlichen Daten. Es muss vermieden werden, durch
eine „geschönte“ Darstellung ein falsches Bild zu vermitteln.
univariate Darstellungen oder Diagramme: Untersuchung einzelner Variablen Interesse auf:
• Ausreißer
• Häufungen von Beobachtungen in Teilen des Wertebereichs
• Fehlen bestimmter Ausprägungen
• Verteilungsform der Variablen
Überblick:
Diagramme für Häufigkeiten und Prozentwerte
• Dot Plots
• Balkendiagramme
• Polygon
• Kreisdiagramm
Diagramme für Verteilungen
• Histogramm
• Boxplot
• Stem-and-Leaf Plot
Diagramme für Mittelwerte
• Balkendiagramme
• Liniendiagramme
DOT-PLOTS
• erhält man, wenn man für jede Beobachtung einer kontinuierlichen Variablen auf einem Zahlenstrahl an
der Variablenausprägung der Beobachtung ein Plotsymbol plottet
• stellen entlang einer Skala jeden vorkommenden Wert mit einem Kreis dar
• bieten für kleinere Fallzahlen (n<100) übersichtliche Darstellung
, STACKED DOT-PLOTS
Plotsymbole für Beobachtungen mit identischen Ausprägungen werden nebeneinander dargestellt
dies verhindert Überdrucken, schränkt aber die Anwendung für den Bereich der Fallzahlen (ca.
n<300) ein – besonders bei starken Konzentrationen auf Teile des Wertebereichs
JITTERED DOT-PLOTS
• die einzelnen Beobachtungen werden gegen gleichverteilte Zufallszahlen geplottet
• Beobachtungen mit identischer Ausprägung der interessierenden Variablen erhalten so eine
unterschiedliche Plotposition
• auch geeignet für n>500
DIAGRAMME FÜR HÄUFIGKEITEN UND PROZENTWERTE
Balkendiagramme
Häufigkeiten können über Balkendiagramme dargestellt werden
Für jeden vorkommenden Wert einer Variablen wird ein Balken verwendet
Häufig setzt man auf X-Achse die Ausprägungen der Merkmale u. auf Y-Achse die Häufigkeit des Auftretens
der Ausprägungen
Die Höhe des Balkens gibt die Anzahl der Personen an, die den entsprechenden Variablenwert aufweisen
Balkendiagramme sind vorwiegend für diskrete Variablen mit wenigen Stufen geeignet
Ausprägungen können auf allen Skalenniveaus liegen
UNIVARIATE GRAPHISCHE DARSTELLUNGEN
Darstellungsformen für Daten:
Tabellen (z.B. Häufigkeiten, Prozent, kumulierte Prozent)
Kennwerte (z.B. Mittelwert und Standardabweichung)
univariate Darstellungen
Ziel ist immer eine übersichtliche Darstellung der tatsächlichen Daten. Es muss vermieden werden, durch
eine „geschönte“ Darstellung ein falsches Bild zu vermitteln.
univariate Darstellungen oder Diagramme: Untersuchung einzelner Variablen Interesse auf:
• Ausreißer
• Häufungen von Beobachtungen in Teilen des Wertebereichs
• Fehlen bestimmter Ausprägungen
• Verteilungsform der Variablen
Überblick:
Diagramme für Häufigkeiten und Prozentwerte
• Dot Plots
• Balkendiagramme
• Polygon
• Kreisdiagramm
Diagramme für Verteilungen
• Histogramm
• Boxplot
• Stem-and-Leaf Plot
Diagramme für Mittelwerte
• Balkendiagramme
• Liniendiagramme
DOT-PLOTS
• erhält man, wenn man für jede Beobachtung einer kontinuierlichen Variablen auf einem Zahlenstrahl an
der Variablenausprägung der Beobachtung ein Plotsymbol plottet
• stellen entlang einer Skala jeden vorkommenden Wert mit einem Kreis dar
• bieten für kleinere Fallzahlen (n<100) übersichtliche Darstellung
, STACKED DOT-PLOTS
Plotsymbole für Beobachtungen mit identischen Ausprägungen werden nebeneinander dargestellt
dies verhindert Überdrucken, schränkt aber die Anwendung für den Bereich der Fallzahlen (ca.
n<300) ein – besonders bei starken Konzentrationen auf Teile des Wertebereichs
JITTERED DOT-PLOTS
• die einzelnen Beobachtungen werden gegen gleichverteilte Zufallszahlen geplottet
• Beobachtungen mit identischer Ausprägung der interessierenden Variablen erhalten so eine
unterschiedliche Plotposition
• auch geeignet für n>500
DIAGRAMME FÜR HÄUFIGKEITEN UND PROZENTWERTE
Balkendiagramme
Häufigkeiten können über Balkendiagramme dargestellt werden
Für jeden vorkommenden Wert einer Variablen wird ein Balken verwendet
Häufig setzt man auf X-Achse die Ausprägungen der Merkmale u. auf Y-Achse die Häufigkeit des Auftretens
der Ausprägungen
Die Höhe des Balkens gibt die Anzahl der Personen an, die den entsprechenden Variablenwert aufweisen
Balkendiagramme sind vorwiegend für diskrete Variablen mit wenigen Stufen geeignet
Ausprägungen können auf allen Skalenniveaus liegen