INHALT
Einführung 3
Definition 3
Statistik als Teilgebiet der Stochastik 3
Zufallsexperiment 3
Vereinfachter Ablauf einer statistischen Analyse in der Pharmazie 3
Deskriptive Statistik 4
Merkmale 4
Lagemaße 4
Streuungsmaße 4
Verhalten der Lage- und Streuungsmaße bei linearen Transformationen 4
Variationskoeffizient 4
Geordnete Statistik 5
Lagemaße & Streuungsmaße 5
Abhängigkeitsmaß: Pearsons Korrelationskoeffizient 5
Grafische Darstellung 6
Streudiagramme 6
Boxplots 6
Histogramme 6
Lineare Regression 7
Grundlagen der Stochastik 8
Wahrscheinlichkeitsbegriffe 8
Ereignisse und Mengenlehre 8
Verknüpfung von Ereignissen: Venn-Diagramm 8
Wahrscheinlichkeitsmaße 8
Kombinatorik & Verteilungen 10
Kombinatorische Kenngrößen 10
Aus dem Urnenmodell abgeleitete Verteilungen 10
Bedingte Wahrscheinlichkeit und Unabhängigkeit 12
Bedingte Wahrscheinlichkeit 12
Rechenregeln 12
Begriffe aus der Testdiagnostik 13
Stochastische Unabhängigkeit 13
Diskrete Zufallsvariablen 14
Definition von Zufallsvariablen 14
Verteilungen einer diskreten Zufallsvariablen 14
Zähldichten 14
Verteilungsfunktionen 15
Kenngrößen von Diskreten Zufallsvariablen 16
Zufallsvektoren 18
, Gemeinsame Verteilungen 18
Unabhängige Zufallsvariablen 18
Kovarianz und Korrelation 18
Grenzwertsätze 20
Gesetz der großen Zahlen 20
Tschebyscheff-Ungleichung 20
Normalverteilung 20
Zentraler Grenzwertsatz 22
Normalapproximation 22
Schätzen von Parametern 23
Schätzverfahren 23
Konfidenzintervalle 24
Statistische Tests 27
Grundlagen 27
Signifikanztests 28
,EINFÜHRUNG
DEFINITION
Unter der Statistik versteht man die Lehre und Anwendung von Methoden zur Erhebung, Aufbereitung, Analyse und Interpre-
tation empirischer Daten. Sie lässt sich auffassen als Wissenschaft zur Analyse der Relation zwischen Realität und Theorie.
STATISTIK ALS TEILGEBIET DER STOCHASTIK
Mathematische
Modellierung von zufälligen
Wahrscheinlichkeitstheorie
Vorgängen und Analyse
deren Gesetzmäßigkeiten
Stochastik
deskriptive Statistik
Statistik
induktive Statistik
ZUFALLSEXPERIMENT
Ein Zufallsexperiment ist der Prototyp eines zufälligen Vorgangs, er ist durch folgende Eigenschaften gekennzeichnet:
1. Es sind verschiedene Ergebnisse möglich, es tritt aber nur ein Ergebnis auf
2. Das Ergebnis vor Ablauf ungewiss
3. Es ist (prinzipiell) unter den gleichen Bedingungen beliebig oft wiederholbar
Beispiele für Zufallsexperimente sind der einfache Münzwurf, das Zahlenlotto oder das Würfeln.
VEREINFACHTER ABLAUF EINER STATISTISCHEN A NALYSE IN DER PHARMAZIE
Ausgangspunkt
•Vermutung über einen realen Sachverhalt
Versuchsplanung
•Festlegung einer Erhebung, mit welcher Aussagen über den Sachverhalt getroffen
werden können
Wahrscheinlichkeitstheoretische Modellierung
•Formulierung relevanter Hypothesen in einem mathematischen Modell der zu
erhebenden Daten und Bewertung möglicher Augänge im Hinblick auf die Hypothesen
Datenerhebung (nach Vorgabe der Versuchsplanung)
Vergleich: Theorie vs. Wirklichkeit (induktive Statistik)
, DESKRIPTIVE STATISTIK
Ziel der deskriptiven Statistik ist es, erhobene Daten durch Kenngrößen und Grafiken zusammenzufassen und anschaulich
darzustellen.
MERKMALE
unterscheiden ordnen verrechnen
nominal/qualitativ ja nein nein
ordinal ja ja nein
quantitativ ja ja ja
diskrete Merkmale: besitzen endliche oder abzählbare Anzahl von möglichen Ausprägungen
stetige Merkmale: können beliebig viele Ausprägungen annehmen, nicht abzählbar
pseudodiskrete Merkmale: stetige Merkmale erscheinen auf den ersten Blick diskret, nachdem ihre Ausprägungen „dis-
kret“ gemacht worden sind → werden jedoch wie stetige Merkmale behandelt
QUALITATIVE & QUANTITATIVE MERKMALE IM VERGLEICH
qualitative Merkmale quantitative Merkmale
Darstellungsmöglichkeiten Diagramme Diagramme & Boxplots
Lage- & Streuungsmaße
statistische Kenngrößen Modus
Modus
LAGEMAßE
MODUS ARITHMETISCHES MITTEL
𝑛
Bei dem Modus handelt es sich um die am meisten vorkommende 1
Ausprägung einer Variable im Zufallsexperiment. 𝑥 = ∑ 𝑥𝑖
𝑛
𝑖=1
Problem: nicht robust gegen Ausreißer
STREUUNGSMAßE
EMPIRISCHE VARIANZ EMPIRISCHE STANDARDABWEICHUNG
𝑛
1 Die empirische Standardabweichung ist für die Beurteilung der Streuung 𝑠 = √𝑠 2
2
𝑠 = ∑(𝑥𝑖 − 𝑥)² aussagekräftiger als die empirische Varianz.
𝑛−1
𝑖=1
VERHALTEN DER LAGE- UND STREUUNGSMAßE BEI LINEAREN TRANSFORMATIONEN
Werden die Daten xi, …, xn mit a ≠ 0 zu y = a∙xi + b transformiert (z.B.: Umrechnung von Meter in Zentimeter mit a = 100 und
b = 0), so gilt für die transformierten Daten y1, …, yn:
arithmetisches Mittel: empirische Varianz: empirische Standardabweichung:
y = ax + b sY2 = a²sX2 sY = |a|sX
Die empirische Varianz sowie die empirische Standardabweichung sind skalenabhängig.
VARIATIONSKOEFFIZIENT
s
Um die Variation zweier Merkmale miteinander vergleichen zu können, verwendet man den Varia- CV = 𝑚𝑖𝑡 𝑥̅ ≠ 0
x
tionskoeffizienten. Darunter versteht man das Verhältnis zwischen der Streuung und dem Mittel-
wert, er berechnet sich demnach wie rechts angegeben.