Skalenniveaus von Variablen entscheiden darüber, welche Rechenoperationen zulässig sind
(also welche statistischen Testverfahren zur Anwendung kommen können/dürfen).
diskret: Daten besitzen nur endlich/abzählbar unendlich viele Ausprägungen, Zwischenwerte
existieren nicht (bspw.: Anzahl Kinder, Baujahr)
stetig: Merkmal kann alle möglichen Werte (auf der Skala) annehmen (bspw.: Körpergröße,
Nettomiete)
quasi-stetig: bspw.: Monatsgehalt, Intelligenzquotient
quantitativ: nummerische Größen (bspw.: Nettomiete, Baujahr)
qualitativ: keine nummerische Messung (bspw.: Ja/Nein, Rangordnung aber nicht
nummerisch), sondern kategorial
Grundbegriffe:
Untersuchungsgegenstand/Beobachtungseinheit: Subjekt für das Daten gesammelt werden
(Kontingenztabelle -> Spalte)
Variable/Merkmal: Eigenschaft der BE (Kontingenztabelle -> Zeile)
Daten/Merkmalsausprägungen: konkrete Werte (Zellen)
Stichprobe/Sample: Teilmenge der Grundgesamtheit
Population/Grundgesamtheit: Menge aller potenziellen Untersuchungsobjekte
Median: Wert genau in der Mitte (50/50)
bei ungerader Anzahl: einfach mittlere Zahl nehmen
bei gerader Anzahl: beide mittleren Werte addieren und durch 2 teilen
, Formelsammlung - Blatt 2
Modus: die Ausprägung der Werte in einem Datensatz, die am häufigsten vorkommt (bspw.:
1,1,1,4,3,2,2,8 -> 1 = Modus)