STATISTIK SCHÄTZUNGSVERFAHREN
Schätzverfahren:
• Parameter (Erwartungswert oder Standardabweichung)
• Verteilung einer unbekannten Grundgesamtheit ... wird mittels Stichprobe geschätzt!
Beispiel: Schätzung des Anteils roter Kugeln in einer Urne mit roten und grünen Kugeln.
Sind z.B. unter 50 gezogenen Kugeln 10 bzw. 20% rot, so verwendet man diesen Anteil als Schätzwert für den Anteil
roter Kugeln in der Grundgesamtheit.
STICHPROBENKENNWERTEVERTEILUNGEN
verschiedene Stichprobenkennwerte z.B. Mittelwert, Median, Varianz ("Punktschätzer")
Meist interessieren nicht die Werte für die konkrete Stichprobe, sondern für die zugrundeliegenden Population
Die Kennwerte aus einer Stichprobe werden daher als Schätzer für die entsprechenden Populationskennwerte
verwendet
Wir erwarten: Je größer eine (repräsentative) Stichprobe, desto genauer ist die Schätzung
1. Aus einer Population immer wieder Stichproben ziehen für jede Stichprobe ein neuer Mittelwert.
Also: viele Stichproben viele Mittelwerte
2. Verteilung der verschiedenen Mittelwerte betrachten
Verteilung=Stichprobenkennwertverteilung des Mittelwerts (dadurch erfährt man dann in welchem Bereich
sich der tatsächliche Mittelwert befindet)
x
x
x
µ
STANDARDFEHLER
Diese „Verteilung der der Mittelwerte“ ist selbst wieder normalverteilt (wenn das Merkmal normalverteilt ist).
Mittelwert der Stichprobenkennwerteverteilung = Mittelwert in der Population.
Streuung der Stichprobenkennwerteverteilung = Standardfehler (des Mittelwerts)
• Standardfehler gibt an, wie nah ein empirischer Stichprobenmittelwert am wahren Populationsmittelwert liegt
• Dieser Standardfehler des Mittelwertes kann auch aus einer einzigen Stichprobe geschätzt werden:
, STANDARDFEHLER
Beispiel: Unter den Mitarbeiter einer großen Firma soll die Leistungsmotivation bestimmt werden. Es werden 10
Mitarbeiter zufällig ausgewählt und getestet.
Es ergibt sich Mittelwert von 60 bei einer geschätzten Populationsvarianz von 90.
Wie groß ist der Standardfehler dieses Mittelwerts?
Wie groß wäre der Standardfehler bei σ²=250 und N=10?
Wie groß wäre der Standardfehler bei σ²=90 und N=90?
Der Standardfehler ist die Standardabweichung der Stichprobenkennwerteverteilung.
Da die Stichprobenkennwerteverteilung normalverteilt ist, kann die Wahrscheinlichkeit dafür berechnet werden,
dass der Mittelwert in einem bestimmten Intervall liegt.
Mit P=0.68 ist der Populationsmittelwert höchstens einen Standardfehler vom Stichprobenmittelwert entfernt
Beispiel:
• Wenn dann gilt mit p=0.68 für den Populationsmittelwert : 57 < µ < 63
Notation: P( Bedingung ) = p mit p ∈ [0, 1]
Beispiel: P( 57 < µ < 63) = 0.68
STANDARDFEHLER FÜR WEITERE KENNWERTE
Kennwert Standardfehler
Relative Häufigkeit (p)
Median
Arithmetisches Mittel
Standardabweichung
SCHÄTZVERFAHREN
1. Punktschätzung
Angabe eines einzigen Wertes für den zu schätzenden Parameter aufgrund der Ergebnisse der Stichprobe,
z.B. Realisation x als Schätzwert für den Parameter μ der Grundgesamtheit.
Nachteil: Kaum zu erwarten, dass eine Zufallsgröße genau mit Mittelwert der Grundgesamtheit
übereinstimmt, daher unrealistisch.
2. Intervallschätzung
Berechnung eines Intervalls (Konfidenzintervall), in dem der zu schätzende Parameter aufgrund der
Ergebnisse der Stichprobe mit der Wahrscheinlichkeit (1 - α) liegt
Schätzverfahren:
• Parameter (Erwartungswert oder Standardabweichung)
• Verteilung einer unbekannten Grundgesamtheit ... wird mittels Stichprobe geschätzt!
Beispiel: Schätzung des Anteils roter Kugeln in einer Urne mit roten und grünen Kugeln.
Sind z.B. unter 50 gezogenen Kugeln 10 bzw. 20% rot, so verwendet man diesen Anteil als Schätzwert für den Anteil
roter Kugeln in der Grundgesamtheit.
STICHPROBENKENNWERTEVERTEILUNGEN
verschiedene Stichprobenkennwerte z.B. Mittelwert, Median, Varianz ("Punktschätzer")
Meist interessieren nicht die Werte für die konkrete Stichprobe, sondern für die zugrundeliegenden Population
Die Kennwerte aus einer Stichprobe werden daher als Schätzer für die entsprechenden Populationskennwerte
verwendet
Wir erwarten: Je größer eine (repräsentative) Stichprobe, desto genauer ist die Schätzung
1. Aus einer Population immer wieder Stichproben ziehen für jede Stichprobe ein neuer Mittelwert.
Also: viele Stichproben viele Mittelwerte
2. Verteilung der verschiedenen Mittelwerte betrachten
Verteilung=Stichprobenkennwertverteilung des Mittelwerts (dadurch erfährt man dann in welchem Bereich
sich der tatsächliche Mittelwert befindet)
x
x
x
µ
STANDARDFEHLER
Diese „Verteilung der der Mittelwerte“ ist selbst wieder normalverteilt (wenn das Merkmal normalverteilt ist).
Mittelwert der Stichprobenkennwerteverteilung = Mittelwert in der Population.
Streuung der Stichprobenkennwerteverteilung = Standardfehler (des Mittelwerts)
• Standardfehler gibt an, wie nah ein empirischer Stichprobenmittelwert am wahren Populationsmittelwert liegt
• Dieser Standardfehler des Mittelwertes kann auch aus einer einzigen Stichprobe geschätzt werden:
, STANDARDFEHLER
Beispiel: Unter den Mitarbeiter einer großen Firma soll die Leistungsmotivation bestimmt werden. Es werden 10
Mitarbeiter zufällig ausgewählt und getestet.
Es ergibt sich Mittelwert von 60 bei einer geschätzten Populationsvarianz von 90.
Wie groß ist der Standardfehler dieses Mittelwerts?
Wie groß wäre der Standardfehler bei σ²=250 und N=10?
Wie groß wäre der Standardfehler bei σ²=90 und N=90?
Der Standardfehler ist die Standardabweichung der Stichprobenkennwerteverteilung.
Da die Stichprobenkennwerteverteilung normalverteilt ist, kann die Wahrscheinlichkeit dafür berechnet werden,
dass der Mittelwert in einem bestimmten Intervall liegt.
Mit P=0.68 ist der Populationsmittelwert höchstens einen Standardfehler vom Stichprobenmittelwert entfernt
Beispiel:
• Wenn dann gilt mit p=0.68 für den Populationsmittelwert : 57 < µ < 63
Notation: P( Bedingung ) = p mit p ∈ [0, 1]
Beispiel: P( 57 < µ < 63) = 0.68
STANDARDFEHLER FÜR WEITERE KENNWERTE
Kennwert Standardfehler
Relative Häufigkeit (p)
Median
Arithmetisches Mittel
Standardabweichung
SCHÄTZVERFAHREN
1. Punktschätzung
Angabe eines einzigen Wertes für den zu schätzenden Parameter aufgrund der Ergebnisse der Stichprobe,
z.B. Realisation x als Schätzwert für den Parameter μ der Grundgesamtheit.
Nachteil: Kaum zu erwarten, dass eine Zufallsgröße genau mit Mittelwert der Grundgesamtheit
übereinstimmt, daher unrealistisch.
2. Intervallschätzung
Berechnung eines Intervalls (Konfidenzintervall), in dem der zu schätzende Parameter aufgrund der
Ergebnisse der Stichprobe mit der Wahrscheinlichkeit (1 - α) liegt