1. Einführung in die inferenzstatistische Hypothesentestung
- Aufgabe der inferenzstatistischen Hypothesenprüfung: anhand von Stichprobenkennwerten Hypothesen über die
Population zu testen; Dient zur Validierung der Übertragbarkeit eines Stichprobenergebnisses auf die Population;
Mögliche Prüfungen:
• Ob zwei Zufallsstichproben aus einer identischen oder aus zwei verschiedenen Population gezogen wurden
• Prüfung statistischer Kennwerte auf deren statistische Bedeutsamkeit (Signifikanz)
• Ob eine theoriegeleitete Annahme (= Hypothese) aufrechterhalten oder verworfen wird
o Ermittlung bestimmter Irrtumswahrscheinlichkeit
- Einführendes Beispiel:
• Evaluierung des Erfolgs eines Fitnessprogramms;
o Erfolgsparameter: Durchschnittliche Zeit für den Waldlauf über eine Stecke von 3 Kilometern
o Messzeitpunkt: Vor dem Fitnessprogramm/Nach dem Fitnessprogramm (zehn Wochen)
• Evaluierung des Erfolgs über die Differenz beider Laufzeiten:
o Ergebnis 1: Laufzeit hat sich überhaupt nicht verändert. Die Differenz beider Zeiten liegt exakt bei null
o Ergebnis 2: Die Differenz der mittleren Lauzeiten liegt zwischen den beiden Messzeitpunkten bei z.B. zehn
Minuten → Durchschnittliche Fitness der Gruppe hat sich verbessert
• Weiterführende Frage:
o Ab welcher Verbesserung kann der Unterschied der beiden Zeiten noch als Zufall betrachtet werden und ab
welcher Verbesserung kann von einem Einfluss des Trainings ausgegangen werden
o Mit Hilfe der Inferenzstatistik kann exakt ermittelt werden, ab welcher Differenz der beiden Mittelwerte der
Zufall unter einen akzeptablen Grenzwert reduziert ist
1.1. Hypothesen
- Wissenschaftliche Behauptungen in Form einer Hypothese bilden den Beginn einer Studie; Diese werden anhand
wissenschaftlichen Hintergrunds mit Fachbegriffen präzisiert, um daran die Menge der relevanten Variablen zu
definieren
- Für die Einführung in statistische Hypothesen werden einfache Mittelwertsvergleiche zwischen zwei Stichproben
herangezogen
- Es werden immer grundsätzlich, einander ausschließende Hypothesen definiert:
• 1. Nullhypothese
o „Negativhypothese“ die immer behauptet, dass es keine Mittelwertsunterschiede bzw. Zusammenhänge in der
Population gibt
o Auftretende Mittelwertsunterschiede bzw. Zusammenhänge werden als Zufall bei der Stichprobenziehung an-
genommen
o Abgekürzte Schreibform der Nullhypothese: 𝐻0
o Die Nullhypothese steht komplementär zur Alternativhypothese
• 2. Alternativhypothese
o „Positivhypothese“ die besagt, dass ein Unterschied/Zusammenhang in der Population existiert
o Die Alternativhypothese sollte aus einem Theoriegebäude, Vorstudien und der Literatur abgeleitet sein
o Abgekürzte Schreibform der Alternativhypothese: 𝐻1
- Die grundlegende Idee der Inferenzstatistik:
• Es gibt für ein untersuchtes Merkmal einen bestimmten Populationsmittelwert 𝜇𝑥
• Die Mittelwerte zufällig aus der Population gezogener Stichproben 𝑥̅𝑖 streuen um diesen Populationsmittelwert
o Begründet mit den zentralen Grenzwertsatz
o Hierdurch kann eine theoretische Verteilung der Kennwerte definiert werden
o Inferenzstatistische Aussagen sind unter der Voraussetzung der Gültigkeit der 𝐻0 möglich
• Sind zwei Stichprobenmittelwerte sehr ähnlich, ist es sehr wahrscheinlich, dass diese aus einer identischen Popu-
lation stammen
o Diese beiden Stichprobenmittelwerte sind gute Schätzer für den Populationsparameter 𝜇𝑥
1
, • Sind die Stichprobenmittelwerte sehr unterschiedlich, stammen diese möglicherweise nicht aus einer identischen
Population
o Je größer die Differenz zwischen den Stichprobenmittelwerten (𝑥̅1 und 𝑥̅2 ), desto unwahrscheinlicher, dass die
beiden Stichproben aus einer identischen Population stammen
• Mit Hilfe einer Wahrscheinlichkeitsverteilung kann die bedingte Wahrscheinlichkeit für die Differenz der Stich-
probenmittelwerte bei Gültigkeit der 𝐻0 (𝑝(Differenz|𝐻0)) berechnet werden
o Der Erwartungswert für diese Wahrscheinlichkeit liegt bei null
• Liegt diese berechnete Wahrscheinlichkeit 𝑝(Differenz|𝐻0 ) unter einem gewissen Grenzwert (𝛼-Niveau), so ist
die beobachtete Differenz nicht mit der Nullhypothese zu vereinbaren
o → Stichproben stammen nicht aus einer identischen Population, sondern wahrscheinlich aus zwei unterschied-
lichen Populationen, die sich statistisch bedeutsam (= signifikant) unterscheiden
- Unterscheidung zwischen ungerichteter und gerichteter Alternativhypothese
• Bei ungerichteten Alternativhypothesen
o Angabe, dass es lediglich einen Unterschied zwischen zwei Stichprobenennwerten gibt, wobei nicht festgelegt
wird, in welcher Stichprobe ein größerer Mittelwert erwartet wird
o Exploratives Vorgehen
• Bei gerichteten Alternativhypothesen
o Angabe der „Richtung“ eines Unterschieds zwischen Stichprobenkennwerten; Vor der Datenerhebung wird
bestimmt in welcher Stichprobe der höhere Mittelwert erwartet wird
o Theoriegeleitetes Vorgehen
- Formulierung von statistischen Hypothesen
• Definition der Standardformulierung
o Es sei 𝜇1 die mittlere (…) in der Population der (…) und es sei 𝜇2 die mittlere (…) in der Population der (…);
Dann gilt:
o 𝐻0 : 𝜇1 = 𝜇2 (Nullhypothese); und
o 𝐻1 : 𝜇1 ≠ 𝜇2 (ungerichtete Alternativhypothese) oder
o 𝐻1 : 𝜇1 < 𝜇2 (gerichtete Alternativhypothese) oder
o 𝐻1 : 𝜇1 > 𝜇2 (entgegengesetzte Alternativhypothese)
❖ bei einem α-Niveau von 5%
- Beispiel
• Es sei 𝜇1 die mittlere Reaktionszeit auf akustische Reize in der Population der Frauen und es sei 𝜇2 die mittlere
Reaktionszeit auf akustische Reize in der Population der Männer; Dann gilt:
o 𝐻0 : 𝜇1 = 𝜇2
o 𝐻1 : 𝜇1 ≠ 𝜇2 , bei einem α-Niveau von 5%.
• Bestimmung der Wahrscheinlichkeit für die Gültigkeit der Nullhypothese über die Differenz beider Stichproben-
mittelwerte (Reaktionszeiten der Frauen/Männer) → Ungerichtete Alternativhypothese (keine Definition welcher
der beiden Geschlechter im Mittel bessere Leistung erbringt)
• Bei einer gerichteten Alternativhypothese muss die statistische Hypothese folgendermaßen definiert werden:
o 𝐻0 : 𝜇1 ≥ 𝜇2
o 𝐻1 : 𝜇1 < 𝜇2
• Hier wird davon ausgegangen, dass Frauen im Mittel eine niedrigere (bessere) Reaktionszeit erreichen als Männer
2
,1.2. α-Niveau
- Definition
• Das α-Niveau legt in Abhängigkeit von Stichprobengröße und zu Grunde liegender theoretischer Verteilung eine
Fläche unter der Verteilungskurve → somit einen Grenzwert für ein Konfidenzintervall fest
• Liegt der empirisch ermittelte Kennwert einer erhobenen Stichprobe außerhalb dieses Intervalls, so wird die Null-
hypothese verworfen und die Alternativhypothese angenommen
o Es wird eine obere Grenze für den vom Untersucher tolerierten Fehler angegeben, bei dem eine Nullhypothese
fälschlicherweise abgelehnt wird
o Bei jeder inferenzstatistischen Auswertung besteht immer ein Restrisiko für eine Fehlentscheidung gegen eine
gültige Nullhypothese (α-Fehler) → Irrtumswahrscheinlichkeit bleibt erhalten und wird meist auf 5% festgelegt
• Liegt die Wahrscheinlichkeit für das Auftreten eines gefundenen oder eines größeren Mittelwertsunterschieds un-
ter der Bedingung der Nullhypothese unterhalb des α-Niveaus → = statistisch bedeutsamer (signifikanter) Unter-
schied
- Das α-Niveau muss immer vor der Untersuchung statistischer Auswertung festgelegt und bei den statistischen Hy-
pothesen erwähnt werden → nachträgliches Verändern der Höhe dieses Niveaus/Richtung der Hypothese ist nicht
zulässig
• Abbildung 1:
o Theoretische Verteilungskurve möglicher Stichprobenmittelwerte
o Verteilungskurve wird durch den Standardfehler definiert und nicht durch die Streuung, die Standardabwei-
chung des Merkmals
❖ Bei größer werdender Stichprobe und konstanter Merkmalsstreuung wird die Verteilungskurve immer schma-
ler
❖ Die Grenzen des Konfidenzintervalls rücken immer näher zusammen
• Abbildung 2:
o Grafische Darstellung des α-Niveaus; Untersuchung ob zwei Stichprobenmittelwerte 𝑥̅1 und 𝑥̅2 aus einer Po-
pulation mit den Mittelwert 𝜇 stammen
o Annahme 𝜇1 = 0: Die Differenz der beiden Stichprobenmittelwerte 𝑥̅1 und 𝑥̅2 müsste gleich null sein
❖ Wenn die Differenz der beiden Stichprobenmittelwerte (𝑥̅1 - 𝑥̅2 ) so gering ist, dass sie innerhalb des Annah-
mebereichs liegt, so unterscheiden sich die beiden Stichproben nicht signifikant und stammen aus einer iden-
tischen Population mit den Mittelwert 𝜇 → die 𝐻0 ist beizubehalten
❖ Liegt die Differenz der beiden Stichprobenparameter außerhalb des Beibehaltungsbereichs der Nullhypo-
these, so wird die 𝐻0 verworfen und die 𝐻1 angenommen
❖ Verteilung + α-Niveau bestimmt jene Grenze, die die maximale Mittelwertsdifferenz für die Aufrechterhal-
tung der Nullhypothese erlauben
• Abbildung 3:
o Die Form dieser Kurve der theoretischen Stichprobenkennwertverteilung ändert sich mit zunehmenden Stich-
probenumfang
❖ Mit zunehmenden Stichprobenumfang ändert sich die Streuung der Stichprobe nur geringfügig;
𝜎
❖ Der Standardfehler des Mittelwerts (𝜎𝑥̅ = 𝑁𝑥 ) wird durch die Vergrößerung der Stichprobe immer kleiner →
√
reduziert jenes Konfidenzintervall, das den Beibehaltungsbereich für die Nullhypothese definiert
o Bei großen Stichproben kann schon eine kleine Mittelwertsdifferenz signifikant (statistisch bedeutsam) werden
3
, 4