Empirische Verteilung (Wahrscheinlichkeitsverteilung)

Die empirische Verteilung ist eine spezielle Wahrscheinlichkeitsverteilung in der Stochastik, einem Teilgebiet der Mathematik. Sie gehört zu den diskreten Wahrscheinlichkeitsverteilungen und stellt eine Beziehung zwischen der deskriptiven Statistik und der Wahrscheinlichkeitstheorie her. So ist der Erwartungswert der empirischen Verteilung das arithmetische Mittel der zugrundeliegenden Stichprobe, ebenso wie die Verteilungsfunktion der empirischen Verteilung die empirische Verteilungsfunktion ist.

Definition

Bearbeiten

Gegeben sei ein Vektor  . Es bezeichne   das Dirac-Maß auf  , das gegeben ist durch

 .

Dann heißt die Wahrscheinlichkeitsverteilung auf den reellen Zahlen, gegeben durch

 

die empirische Verteilung von   auf den reellen Zahlen.[1] Es ist also

 .

Dabei bezeichnet   die Mächtigkeit der Menge, also die Anzahl ihrer Elemente und   enthält die Indizes der Elemente des Vektors  , die in   enthalten sind. Anschaulich wird somit zuerst gezählt, wie viele Komponenten des Vektors   in der Menge   enthalten sind. Diese Zahl, geteilt durch die Gesamtzahl der Komponenten, ist dann die Wahrscheinlichkeit der Menge  .

Die empirische Verteilung kann auch auf allgemeineren Grundräumen   definiert werden, dann ist  .[2] Dieser Artikel behandelt aber weiterhin den Fall  .

Wahrscheinlichkeitsfunktion

Bearbeiten

Sind alle Komponenten von   verschieden, ist also   für  , so entspricht die Wahrscheinlichkeitsfunktion der empirischen Verteilung der einer diskreten Gleichverteilung auf   und ist gegeben durch

 

Tritt eine Komponente  -mal auf, so ist der Wert der Wahrscheinlichkeitsfunktion dort entsprechend  .

Verteilungsfunktion

Bearbeiten

Die Verteilungsfunktion der empirischen Verteilung ist die empirische Verteilungsfunktion und damit gegeben durch

 .

Hierbei ist   die Indikatorfunktion der Menge  .

Eigenschaften

Bearbeiten

Gegeben sei eine Zufallsvariable  , welche gemäß der empirischen Verteilung (mit  ) verteilt ist. Dann sind die wahrscheinlichkeitstheoretischen Kennzahlen von   wie Erwartungswert und Quantile genau die korrespondierenden Kennzahlen der deskriptiven Statistik der Stichprobe   wie das arithmetisches Mittel und die empirischen Quantile.

Erwartungswert

Bearbeiten

Der Erwartungswert der empirischen Verteilung ist das arithmetische Mittel von   (siehe Gewichtetes arithmetisches Mittel als Erwartungswert), also

 

Die Varianz der empirischen Verteilung ist die (unkorrigierte) empirische Varianz, also

 .

Hierbei bezeichnet   das arithmetische Mittel bzw. den Erwartungswert.

Median und Quantile

Bearbeiten

Der Median (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung entspricht dem Median der Stichprobe  , ebenso entsprechen die Quantile der empirischen Verteilung den empirischen Quantilen.

Der Modus (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung entspricht dem Modus der Stichprobe  .

Weitere Streumaße

Bearbeiten

Des Weiteren gilt:

Einzelnachweise

Bearbeiten
  1. Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 116, doi:10.1515/9783110215274.
  2. Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, S. 237, doi:10.1007/978-3-642-36018-3.