ist eine Funktion, die die kumulative Verteilungsfunktion (CDF) einer Stichprobe
approximiert. Sie ist eine Schätzung der wahren CDF einer Zufallsvariablen, die
aufgrund der begrenzten Anzahl von Beobachtungen nicht direkt bestimmt werden
kann.
Die empirische Verteilungsfunktion wird durch das Aufsummieren der relativen
Häufigkeiten der Beobachtungen in der Stichprobe gebildet. Dabei wird jedem Wert
der Stichprobe eine relative Häufigkeit zugewiesen, die angibt, wie oft dieser Wert in
der Stichprobe auftritt. Diese Häufigkeiten werden dann aufsummiert, um die
empirische Verteilungsfunktion zu erhalten.
Die empirische Verteilungsfunktion ist eine Schritt-förmige Funktion, bei der jeder
Sprungpunkt einem beobachteten Wert der Zufallsvariablen entspricht. Sie hat den
Wert 0 am kleinsten beobachteten Wert und den Wert 1 am größten beobachteten
Wert.
Die empirische Verteilungsfunktion hat viele Anwendungen in der Statistik und
Datenanalyse. Sie wird oft verwendet, um die Verteilung von Daten zu untersuchen,
um statistische Tests durchzuführen oder um Schätzungen von Parametern der
zugrunde liegenden Verteilung durchzuführen. Sie kann auch verwendet werden, um
die Wahrscheinlichkeit eines bestimmten Wertes oder Intervalls zu berechnen oder
um die Abweichung der empirischen Verteilung von der theoretischen Verteilung zu
messen.
Die empirische Verteilungsfunktion kann einfach graphisch dargestellt werden, indem
man die beobachteten Werte auf der horizontalen Achse und die kumulativen
relativen Häufigkeiten auf der vertikalen Achse aufträgt. Diese Darstellung wird als
empirische Verteilungsfunktion oder Ogive bezeichnet.
Insgesamt ist die empirische Verteilungsfunktion eine wichtige Methode in der
Statistik und Datenanalyse, die es ermöglicht, Aussagen über die Verteilung von Daten
zu treffen, auch wenn die zugrunde liegende Verteilung unbekannt oder komplex ist.
Eine wichtige Eigenschaft der empirischen Verteilungsfunktion ist, dass sie eine
konsistente Schätzung der wahren Verteilungsfunktion darstellt, d.h. sie konvergiert in
der Wahrscheinlichkeit gegen die tatsächliche Verteilungsfunktion, wenn die
Stichprobengröße gegen unendlich geht. Diese Eigenschaft ist besonders nützlich, da
sie es ermöglicht, statistische Tests durchzuführen und Schätzungen von Parametern
der wahren Verteilung zu machen, ohne die genaue Form der Verteilung zu kennen.
Eine weitere wichtige Anwendung der empirischen Verteilungsfunktion ist die
Berechnung von Quantilen. Ein Quantil ist ein Wert, bei dem eine bestimmte
proportionale Aufteilung der Daten erfolgt, z.B. das 25. oder das 75. Perzentil. Das k-
te empirische Quantil wird durch die Bestimmung des Werts x_k berechnet, bei dem