Kolmogorow-Verteilung

Wahrscheinlichkeitsverteilung

Die Kolmogorow-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die als Grenzverteilung einer Teststatistik des Kolmogorow-Smirnow-Anpassungstests für einen über alle Grenzen wachsenden Stichprobenumfang auftritt.

Definition

Bearbeiten

Eine stetige Zufallsvariable   heißt Kolmogorow-verteilt, falls sie die Verteilungsfunktion

 

hat.[1][2] Die zugehörige Wahrscheinlichkeitsverteilung heißt Kolmogorow-Verteilung.

Eigenschaften

Bearbeiten
 
Kolmogorow-Verteilungsfunktion (rot) und   (blau)

Eine alternative Summendarstellung der Verteilungsfunktion[3][4] ist

 

Diese alternative Darstellung ist für numerische Berechnungen in bestimmten Fällen günstiger.[3]

Für eine Kolmogorow-verteilte Zufallsvariable   gilt

 

Die Zufallsvariable   hat den Erwartungswert

 

und die Varianz

 [3]

Anwendung

Bearbeiten

Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die  -Quantile der Kolmogorow-Verteilung für   sind näherungsweise  .[5]

Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für   verwendet wird,

 

Das  -Quantil   der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung  . Dies führt zur Näherungsformel

 ,

die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmen. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.[6] Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation   der Kolomogorow-Verteilung verwendet. Wie der Vergleich der Funktionen   und   in der Abbildung zeigt, ist die Approximation   zur Quantilbestimmung nur für hinreichend kleine Werte von  , z. B. für  , anwendbar. Insbesondere ist die Approximation   keine Verteilungsfunktion.

Theoretischer Hintergrund

Bearbeiten

Die reellwertigen Zufallsvariablen   seien stochastisch unabhängig und identisch verteilt mit der stetigen Verteilungsfunktion  .

 
wobei
 
die zufällige empirische Verteilungsfunktion bezeichnet, nicht von   ab.   ist also bezüglich der Klasse aller stetigen Verteilungsfunktionen eine verteilungsfreie Statistik.
  • Außerdem konvergiert die Folge   in Verteilung gegen die Kolmogorow-Verteilung, es gilt daher
 .

  ist die Teststatistik des Kolmogorov-Smirnov-Anpassungstest für den Stichprobenumfang  . Sie heißt auch Kolmogorow-Smirnow-Statistik. Es gibt Tabellen für Quantile der Verteilung von  .[7]

Für große Stichprobenumfänge können die Quantile der Kolmogorow-Verteilung verwendet werden.[5] Es gibt eine Tabelle für Werte der Verteilungsfunktion der Kolomogorov-Verteilung.[8]

Literatur

Bearbeiten
A. Kolmogorov: On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 106–113, doi:10.1007/978-1-4612-4380-9_10 (Übersetzt aus dem Italienischen von Quirino Meneghini, 1990).
  • P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Kolmogorow-Verteilung, S. 188–189, 627.
  • M. A. Stephens: Introduction to Kolmogorov (1933) On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 93–105, doi:10.1007/978-1-4612-4380-9_9.

Einzelnachweise und Anmerkungen

Bearbeiten
  1. Die leicht abweichende Darstellung
     
    findet sich im Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188. In dieser Form wurde die Verteilungsfunktion auch durch Kolmogorow in der Originalarbeit angegeben: A. Kolmogoroff: Sulla determinazione empirica di una legge di distribuzione. In: Giornale dell’Istituto italiano degli attuari. Band IV, Nr. 1, 1933, S. 83–91, S. 91 (italienisch, sbn.it). Diese ist äquivalent zur oben angegebenen Form.
  2. Eine - vermutlich fehlerhafte – Darstellung der Verteilungsfunktion   mit   anstelle von   findet sich in den beiden folgenden Quellen: Andererseits findet sich die in der Definition angegebene Form der Verteilungsfunktion mit dem Faktor 2 im Exponenten auch in diesen Quellen:
  3. a b c Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188.
  4. William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
  5. a b Z. B. Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung. S. 627.
  6. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik. Methodensammlung mit R. 17. Auflage. Springer Spektrum, Berlin / Heidelberg 2018, ISBN 978-3-662-62293-3, S. 496, doi:10.1007/978-3-662-62294-0.
  7. Z. B. Lexikon der Stochastik: Tafel XIII A: Kolmogorow-Test: Quantile  . S. 625–626.
  8. N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, JSTOR:2236278. Diese Tabelle wurde zuerst abgedruckt in N. Smirnov: On the estimation of the discrepancy between empirical curves of distribution for two independent samples. In: Bulletin Mathématique de l'Université Moscou. Band 2, Nr. 2, 1939. Die Tabelle ist wiederabgedruckt auf S. 143 in Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-89871-684-9).