Statistik II Formelsammlung
Mathematische Stichprobe
Bedingungen
• alle Elemente müssen gleiche Wahrscheinlichkeit haben gezogen zu werden
• unendlich große Grundgesamtheit
• Ziehen mit Zurücklegen, bei endlicher Grundgesamtheit
• (näherungsweise) bei Ziehen ohne Zurücklegen in endlicher Grundgesamtheit,
𝒏
wenn 𝑵 ≤ 𝟎, 𝟓
Approximation durch Normalverteilung
• die Merkmalssumme 𝑿𝒏 = ∑𝒏𝒊=𝟏 𝑿𝒊 ~ 𝑵(𝒏𝝁; 𝒏𝝈𝟐 )
• ̅ 𝒏 = 𝟏 ∑𝒏𝒊=𝟏 𝑿𝒊 ~ 𝑵 (𝝁; 𝟏 𝝈𝟐 )
den Stichprobenmittelwert 𝑿 𝒏 𝒏
𝟏 𝝅(𝟏−𝝅)
• den Stichprobenanteilssatz 𝑷𝒏 = ∑𝒏 𝑿 ~ 𝑵 (𝝅; )
𝒏 𝒊=𝟏 𝒊 𝒏
𝒏
→ wenn bei Ziehen ohne Zurücklegen 𝟎, 𝟎𝟓 ≤ 𝑵 ≤ 𝟎, 𝟓 gilt, müssen Varianzen mit
𝑵−𝒏
Korrekturfaktor 𝑵−𝟏 multipliziert werden (siehe S. 5)
Stichprobenauswahl (siehe S. 7)
Schätzung unbekannter Parameter
• 𝑨𝒏𝒕𝒆𝒊𝒍𝒔𝒔𝒂𝒕𝒛 𝑷𝒏 : -Erwartungswert 𝑬(𝑷𝒏 ) = 𝝅
𝝅(𝟏−𝝅) 𝒏
-Varianz 𝑽(𝑷𝒏 ) = (𝒇ü𝒓 < 𝟎, 𝟎𝟓), sonst
𝒏 𝑵
𝝅(𝟏−𝝅) 𝑵−𝒏 𝒏
𝑽(𝑷𝒏 ) = ∗ 𝑵−𝟏 (𝒇ü𝒓 𝑵 ≥ 𝟎, 𝟎𝟓)
𝒏
• ̅ 𝒏:
Mittelwert 𝑿 -Erwartungswert 𝑬(𝑿 ̅ 𝒏) = 𝝁
̅ 𝒏 ) = 𝟏 𝝈𝟐 (𝒇ü𝒓 𝒏 < 𝟎, 𝟎𝟓), sonst
-Varianz 𝑽(𝑿 𝒏 𝑵
̅ 𝒏 ) = 𝟏 𝝈𝟐 ∗ 𝑵−𝒏 (𝒇ü𝒓
𝑽(𝑿
𝒏
≥ 𝟎, 𝟎𝟓)
𝒏 𝑵−𝟏 𝑵
• Standardfehler (SE): -Wurzel aus der Varianz einer Stichprobenfunktion
(je kleiner SE, desto besser Schätzung)
• Schätzer: -Normalverteilung 𝑋 ~ 𝑁(𝜇; 𝜎 2 ):
𝝁
̂=𝑿 ̅ 𝒏 = 𝟏 ∑𝒏𝒊=𝟏 𝑿𝒊 und 𝝈
̂𝟐 = 𝟏 ∑𝒏 (𝑿𝒊 − 𝑿
𝒊=𝟏
̅ 𝒏 )𝟐
𝒏 𝒏−𝟏
-Poissonverteilung 𝑋 ~ 𝑃𝑜(𝜆):
𝝀̂ = 𝑿
̅𝒏
-Exponentialverteilung 𝑋 ~ 𝐸𝑥𝑝(𝜆):
𝟏
𝝀̂ = ̅𝒏
𝑿
-Binomialverteilung 𝑋 ~ 𝐵𝑖(𝑛; 𝜋):
𝝅
̂ = 𝑷𝒏
→ siehe S. 14f
, Intervallschätzung
• für Erwartungswert 𝝁 = 𝑬(𝑿):
𝑺𝑫 𝑺𝑫
𝑲𝟏−𝜶 (𝝁) = [𝑺𝒖 = 𝝁
̂ − 𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) ∙ ; 𝑺𝒐 = 𝝁
̂ + 𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) ∙ ]
𝟐 √𝒏 𝟐 √𝒏
𝑺𝑫 = √𝝈𝟐 wenn wahre Varianz bekannt, sonst 𝑺𝑫 = √𝝈 ̂𝟐
𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) = 𝒛(𝟏−𝜶) wenn wahre Varianz bekannt, sonst = 𝒕𝒅𝒇=𝒏−𝟏,(𝟏−𝜶)
𝟐 𝟐 𝟐
Aber! Bei (𝒏 − 𝟏) ≥ 𝟑𝟎 ist näherungsweise 𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) = 𝒛(𝟏−𝜶) nutzbar
𝟐 𝟐
𝒏
Wenn 𝒔𝟐 gegeben ist, muss 𝝈
̂ 𝟐 = 𝒏−𝟏 ∙ 𝒔𝟐 berechnet werden
𝒏 𝝈𝟐 𝑵−𝒏 𝑺𝑫
Wenn 𝑵 ≥ 𝟎, 𝟎𝟓 muss 𝑺𝑬𝑴 = √ 𝒏 ∙ 𝒏−𝟏 statt berechnet werden
√𝒏
→ siehe S. 22ff
• für Anteilswert 𝝅 = 𝑷𝒏 :
-Merkmal X muss dichotom sein (ja/nein), d.h. Bernoulliverteilt und 𝒏 ≥ 𝟑𝟎
𝑷𝒏 ∙ (𝟏 − 𝑷𝒏 ) 𝑷𝒏 ∙ (𝟏 − 𝑷𝒏 )
𝑲𝟏−𝜶 (𝝅) = [𝑷𝒏 − 𝒛𝟏−𝜶 √ ; 𝑷𝒏 + 𝒛𝟏−𝜶 √ ]
𝟐 𝒏 𝟐 𝒏
𝒏 𝑷𝒏 ∙(𝟏−𝑷𝒏 ) 𝑵−𝒏 𝑷𝒏 ∙(𝟏−𝑷𝒏 )
Wenn 𝑵 ≥ 𝟎, 𝟎𝟓 muss 𝑺𝑬𝑴 = √ ∙ 𝒏−𝟏 statt √ berechnet werden
𝒏 𝒏
→ siehe S. 25ff
• für Varianz 𝝈𝟐 :
𝒏 ∙ 𝒔𝟐 𝒏 ∙ 𝒔𝟐
𝑲𝟏−𝜶 (𝝈𝟐 ) = [ ; ]
𝝌𝟐𝒏−𝟏,(𝟏−𝜶/𝟐) 𝝌𝟐𝒏−𝟏,𝜶/𝟐
𝟏
mit 𝒔𝟐 = 𝒏 ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟐
→ siehe S. 26ff
• Varianz abschätzen? → siehe S. 28
Mathematische Stichprobe
Bedingungen
• alle Elemente müssen gleiche Wahrscheinlichkeit haben gezogen zu werden
• unendlich große Grundgesamtheit
• Ziehen mit Zurücklegen, bei endlicher Grundgesamtheit
• (näherungsweise) bei Ziehen ohne Zurücklegen in endlicher Grundgesamtheit,
𝒏
wenn 𝑵 ≤ 𝟎, 𝟓
Approximation durch Normalverteilung
• die Merkmalssumme 𝑿𝒏 = ∑𝒏𝒊=𝟏 𝑿𝒊 ~ 𝑵(𝒏𝝁; 𝒏𝝈𝟐 )
• ̅ 𝒏 = 𝟏 ∑𝒏𝒊=𝟏 𝑿𝒊 ~ 𝑵 (𝝁; 𝟏 𝝈𝟐 )
den Stichprobenmittelwert 𝑿 𝒏 𝒏
𝟏 𝝅(𝟏−𝝅)
• den Stichprobenanteilssatz 𝑷𝒏 = ∑𝒏 𝑿 ~ 𝑵 (𝝅; )
𝒏 𝒊=𝟏 𝒊 𝒏
𝒏
→ wenn bei Ziehen ohne Zurücklegen 𝟎, 𝟎𝟓 ≤ 𝑵 ≤ 𝟎, 𝟓 gilt, müssen Varianzen mit
𝑵−𝒏
Korrekturfaktor 𝑵−𝟏 multipliziert werden (siehe S. 5)
Stichprobenauswahl (siehe S. 7)
Schätzung unbekannter Parameter
• 𝑨𝒏𝒕𝒆𝒊𝒍𝒔𝒔𝒂𝒕𝒛 𝑷𝒏 : -Erwartungswert 𝑬(𝑷𝒏 ) = 𝝅
𝝅(𝟏−𝝅) 𝒏
-Varianz 𝑽(𝑷𝒏 ) = (𝒇ü𝒓 < 𝟎, 𝟎𝟓), sonst
𝒏 𝑵
𝝅(𝟏−𝝅) 𝑵−𝒏 𝒏
𝑽(𝑷𝒏 ) = ∗ 𝑵−𝟏 (𝒇ü𝒓 𝑵 ≥ 𝟎, 𝟎𝟓)
𝒏
• ̅ 𝒏:
Mittelwert 𝑿 -Erwartungswert 𝑬(𝑿 ̅ 𝒏) = 𝝁
̅ 𝒏 ) = 𝟏 𝝈𝟐 (𝒇ü𝒓 𝒏 < 𝟎, 𝟎𝟓), sonst
-Varianz 𝑽(𝑿 𝒏 𝑵
̅ 𝒏 ) = 𝟏 𝝈𝟐 ∗ 𝑵−𝒏 (𝒇ü𝒓
𝑽(𝑿
𝒏
≥ 𝟎, 𝟎𝟓)
𝒏 𝑵−𝟏 𝑵
• Standardfehler (SE): -Wurzel aus der Varianz einer Stichprobenfunktion
(je kleiner SE, desto besser Schätzung)
• Schätzer: -Normalverteilung 𝑋 ~ 𝑁(𝜇; 𝜎 2 ):
𝝁
̂=𝑿 ̅ 𝒏 = 𝟏 ∑𝒏𝒊=𝟏 𝑿𝒊 und 𝝈
̂𝟐 = 𝟏 ∑𝒏 (𝑿𝒊 − 𝑿
𝒊=𝟏
̅ 𝒏 )𝟐
𝒏 𝒏−𝟏
-Poissonverteilung 𝑋 ~ 𝑃𝑜(𝜆):
𝝀̂ = 𝑿
̅𝒏
-Exponentialverteilung 𝑋 ~ 𝐸𝑥𝑝(𝜆):
𝟏
𝝀̂ = ̅𝒏
𝑿
-Binomialverteilung 𝑋 ~ 𝐵𝑖(𝑛; 𝜋):
𝝅
̂ = 𝑷𝒏
→ siehe S. 14f
, Intervallschätzung
• für Erwartungswert 𝝁 = 𝑬(𝑿):
𝑺𝑫 𝑺𝑫
𝑲𝟏−𝜶 (𝝁) = [𝑺𝒖 = 𝝁
̂ − 𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) ∙ ; 𝑺𝒐 = 𝝁
̂ + 𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) ∙ ]
𝟐 √𝒏 𝟐 √𝒏
𝑺𝑫 = √𝝈𝟐 wenn wahre Varianz bekannt, sonst 𝑺𝑫 = √𝝈 ̂𝟐
𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) = 𝒛(𝟏−𝜶) wenn wahre Varianz bekannt, sonst = 𝒕𝒅𝒇=𝒏−𝟏,(𝟏−𝜶)
𝟐 𝟐 𝟐
Aber! Bei (𝒏 − 𝟏) ≥ 𝟑𝟎 ist näherungsweise 𝑸𝒖𝒂𝒏𝒕𝒊𝒍(𝟏−𝜶) = 𝒛(𝟏−𝜶) nutzbar
𝟐 𝟐
𝒏
Wenn 𝒔𝟐 gegeben ist, muss 𝝈
̂ 𝟐 = 𝒏−𝟏 ∙ 𝒔𝟐 berechnet werden
𝒏 𝝈𝟐 𝑵−𝒏 𝑺𝑫
Wenn 𝑵 ≥ 𝟎, 𝟎𝟓 muss 𝑺𝑬𝑴 = √ 𝒏 ∙ 𝒏−𝟏 statt berechnet werden
√𝒏
→ siehe S. 22ff
• für Anteilswert 𝝅 = 𝑷𝒏 :
-Merkmal X muss dichotom sein (ja/nein), d.h. Bernoulliverteilt und 𝒏 ≥ 𝟑𝟎
𝑷𝒏 ∙ (𝟏 − 𝑷𝒏 ) 𝑷𝒏 ∙ (𝟏 − 𝑷𝒏 )
𝑲𝟏−𝜶 (𝝅) = [𝑷𝒏 − 𝒛𝟏−𝜶 √ ; 𝑷𝒏 + 𝒛𝟏−𝜶 √ ]
𝟐 𝒏 𝟐 𝒏
𝒏 𝑷𝒏 ∙(𝟏−𝑷𝒏 ) 𝑵−𝒏 𝑷𝒏 ∙(𝟏−𝑷𝒏 )
Wenn 𝑵 ≥ 𝟎, 𝟎𝟓 muss 𝑺𝑬𝑴 = √ ∙ 𝒏−𝟏 statt √ berechnet werden
𝒏 𝒏
→ siehe S. 25ff
• für Varianz 𝝈𝟐 :
𝒏 ∙ 𝒔𝟐 𝒏 ∙ 𝒔𝟐
𝑲𝟏−𝜶 (𝝈𝟐 ) = [ ; ]
𝝌𝟐𝒏−𝟏,(𝟏−𝜶/𝟐) 𝝌𝟐𝒏−𝟏,𝜶/𝟐
𝟏
mit 𝒔𝟐 = 𝒏 ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟐
→ siehe S. 26ff
• Varianz abschätzen? → siehe S. 28