Dirichlet-Verteilung

Familie von Wahrscheinlichkeitsverteilungen

Die Dirichletverteilung (nach Peter Gustav Lejeune Dirichlet) ist eine Familie von stetigen, multivariaten Wahrscheinlichkeitsverteilungen.[1]

Beispiele einer Dirichlet-Verteilung mit K=3 für verschiedene Parametervektoren α. Im Uhrzeigersinn von oben links: α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4).

Sie ist die multivariate Erweiterung der Beta-Verteilung und die konjugierte A-priori-Verteilung der Multinomialverteilung in der bayesschen Statistik. Ihre Dichtefunktion beschreibt die Verteilung der Wahrscheinlichkeiten für K verschiedene, exklusive Ereignisse. Sie wird durch einen Parametervektor gesteuert, wobei jeder Parameter das Vorwissen über die Häufigkeit des -ten Ereignisses widerspiegelt. Konkret entspricht der Parameter der Anzahl der angenommenen „Beobachtungen“ oder „Erfolge“ für das -te Ereignis. Höhere Werte von deuten auf eine größere Zuversicht in die Wahrscheinlichkeit des entsprechenden Ereignisses hin.[2]

Veranschaulichung

Bearbeiten

Die Multinomialverteilung gibt die Wahrscheinlichkeiten   bis   für K unterschiedliche Ereignisse an, also z. B. wie wahrscheinlich es ist, in einem Wurf eine Eins, Zwei, Drei, Vier, Fünf oder Sechs zu würfeln. Im Gegensatz dazu gibt die Dirichlet-Verteilung an, wie wahrscheinlich eine solche Verteilung auftritt. Im Falle einer Würfelfabrik könnte die Dirichlet-Verteilung also angeben, wie wahrscheinlich die Verteilungen der Würfelergebnisse bei den fabrizierten Würfeln sind. Funktionieren die Maschinen der Würfelfabrik korrekt, wäre die Wahrscheinlichkeit für alles andere als die uniforme Verteilung (alle Augenzahlen sind gleich wahrscheinlich) sehr gering. Das entspräche einem Parametervektor   mit gleichen und sehr hohen Elementen wie etwa  . Hingegen würde   bedeuten, dass die Maschinen Würfel fabrizieren, bei denen die Augenzahl Eins doppelt so häufig vorkommt wie jede andere Augenzahl. Und dies fast ausnahmslos, da die Werte wiederum sehr hoch sind und damit die Varianz niedrig. Wären die Werte in   aber z. B. alle  , dann würden Würfel hergestellt werden, die eine starke Tendenz zu einer Augenzahl haben. Welche die bevorzugte Augenzahl eines Würfels ist, wäre dabei zufällig, da alle Werte in   gleich sind. Je kleiner die Werte, desto ausgeprägter wäre die Unfairness der meisten Würfel, und desto seltener wären Würfel ohne eine bevorzugte Augenzahl.

Dichtefunktion

Bearbeiten

Die Dirichletverteilung der Ordnung K ≥ 2 mit den Parametern   und dem Parametervektor   hat folgende Dichtefunktion:

 

Die normierende Konstante   ist die multivariate Betafunktion an der Stelle  , welche durch Werte der Gammafunktion an den Stellen   dargestellt werden kann:

 

Die Dichtefunktion ist keine Dichte bezüglich des K-dimensionalen Lebesgue-Maßes, sondern eine Dichtefunktion bezüglich des (K-1)-dimensionalen Lebesgue-Maßes im durch die Restriktion   definierten (K-1)-dimensionalen Teilraum. Durch die Ersetzung   erhält man die (K-1)-dimensionale Dichtefunktion

 

Bei einer Verwendung der Dirichlet-Verteilung als A-priori-Verteilung für eine Multinomialverteilung sind die Vektoren   mit positiver Dichte alternative Werte für den Parametervektor einer Multinomialverteilung.

Bearbeiten
Commons: Dirichlet-Verteilung – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

Bearbeiten
  1. Samuel Kotz, Narayanaswamy Balakrishnan, Norman L. Johnson: Continuous multivariate distributions. 1: Models and applications. 2. ed Auflage. Wiley, New York Weinheim 2000, ISBN 978-0-471-18387-7.
  2. Ingram Olkin, Herman Rubin: Multivariate Beta Distributions and Independence Properties of the Wishart Distribution. In: The Annals of Mathematical Statistics. Band 35, Nr. 1, März 1964, ISSN 0003-4851, S. 261–269, doi:10.1214/aoms/1177703748 (projecteuclid.org).