Verschiebungssatz (Statistik)

(Weitergeleitet von Satz von König-Huyghens)

Der Verschiebungssatz (auch Satz von Steiner oder Steinerscher Verschiebungssatz genannt) beschreibt, wie sich die Eigenschaften einer Variablen oder Zufallsvariablen ändern, wenn zu dieser Variable eine Konstante addiert wird. Er besagt, dass sich durch Addition einer Konstante zu einer Variablen oder Zufallsvariablen bestimmte Charakteristika der Verteilung dieser Variable auf vorhersagbare Weise ändern.

Wird zu einer Zufallsvariablen eine Konstante addiert und diese modifizierte Variable als bezeichnet, dann ändern sich bestimmte Momente von auf vorhersagbare Weise. Die Momente von können durch eine einfache Formel berechnet werden, die die Momente von und die hinzugefügte Konstante berücksichtigt.

Der Verschiebungssatz ermöglicht es die Effekte von konstanten Verschiebungen auf die Verteilung von Variablen oder Zufallsvariablen zu verstehen. Diese Erkenntnis hat viele Anwendungen in der Statistik und Wahrscheinlichkeitstheorie, zum Beispiel bei der Berechnung von durchschnittlichen Werten und Varianzen von veränderten Variablen oder Zufallsvariablen.

Verschiebungssatz

Bearbeiten

Der Verschiebungssatz für Zufallsvariablen   besagt:

 

Dabei ist  , das  te Moment der Zufallsvariablen  ,  , das  te Moment der Zufallsvariablen  .   ist der Binomialkoeffizient   über  .

Insbesondere für den Fall   gilt

 .

Für die Varianz einer Zufallsvariablen   gilt mit  , d. h.  :

 .

Empirische Variante

Bearbeiten

Für die empirische Version des Verschiebungssatz für   Beobachtungswerten mit   müssen die theoretischen durch die empirischen Momente ersetzt werden, also   bzw.   und dann gilt:

 

Analog zu den Zufallsvariablen kann man für   ableiten mit  :

 .

Beispiel mit n Beobachtungswerten

Bearbeiten

Der Verschiebungssatz wird zunächst am einfachsten Fall vorgeführt: Es seien beispielsweise die Werte   aus einer Stichprobe gegeben. Es wird die Summe der Abweichungsquadrate dieser Werte gebildet:

 

wobei

 

das arithmetische Mittel der Zahlen ist. Der Verschiebungssatz ergibt sich aus[1]

 
 .

Rechenbeispiel

Bearbeiten

Im Rahmen der Qualitätssicherung werden fortlaufend Kaffeepakete gewogen. Für die ersten vier Pakete erhielt man die Werte (in g)  

 

Das durchschnittliche Gewicht beträgt

 

Es ist

 

Für die Anwendung des Verschiebungssatzes berechnet man

 

und

 
 

Damit kann beispielsweise die (korrigierte) empirische Varianz als „durchschnittliches“ Abweichungsquadrat bestimmt werden:

 

im Beispiel

 

Wird die Stichprobe um ein weiteres Paket erweitert, so reicht es zur Neuberechnung der Stichprobenvariation mit Hilfe des Verschiebungssatzes, lediglich die Werte für   und   neu zu berechnen. Beim fünften Paket werde das Gewicht 510 g gemessen. Dann gilt:

 
  sowie
 

Die Stichprobenvarianz der neuen, größeren Stichprobe ist dann

 

Anwendungen

Bearbeiten

Summe der quadratischen Abweichungen

Bearbeiten

Für die Summe der quadratischen Abweichungen von   Beobachtungswerten   und deren arithmetisches Mittel   gilt:

 .

Damit kann man   berechnen, ohne das Mittel   bereits vorab zu kennen und ohne alle Stichprobenwerte speichern zu müssen.

Bei der Berechnung mit Gleitkommazahlen kann es jedoch zu einer numerischen Auslöschung kommen, wenn   erheblich größer ist als die Varianz, die Daten also nicht zentriert sind.[2] Daher bietet sich die Verwendung dieser Formel primär für analytische Betrachtungen an, nicht für die Verwendung mit realen Daten. Eine mögliche Abhilfe[3] ist, vorab eine Näherung   für das Mittel zu bestimmen und damit zu berechnen:

 .

Falls die Näherung   nahe genug an dem echten Mittel   liegt, ist die Genauigkeit mit dieser Formel gut. Weitere numerisch stabilere Berechnungsmethoden finden sich in der Literatur.[3][2]

Stichprobenkovarianz

Bearbeiten

Die Summe der Abweichungsprodukte zweier Merkmale   und   ist gegeben durch

 

Hier ergibt der Verschiebungssatz

 

Die korrigierte Stichprobenkovarianz berechnet sich dann als „durchschnittliches“ Abweichungsprodukt

 

Zufallsvariable

Bearbeiten

Die Varianz einer Zufallsvariablen

 

lässt sich mit dem Verschiebungssatz auch angeben als[4]

 

Dieses Resultat wird auch als Satz von König-Huygens bezeichnet. Es ergibt sich aus der Linearität des Erwartungswertes:

 

Eine allgemeinere Darstellung des Verschiebungssatzes ergibt sich aus:

 .
  • Man erhält bei einer diskreten Zufallsvariablen   mit den Ausprägungen   und der dazugehörigen Wahrscheinlichkeit   dann für
 
Mit der speziellen Wahl   ergibt sich   und die obige Formel
 
  • Für eine stetige Zufallsvariable   und der dazugehörigen Dichtefunktion   ist
 
Man erhält hier mit dem Verschiebungssatz
 

Kovarianz

Bearbeiten

Die Kovarianz zweier Zufallsvariablen   und  

 

lässt sich mit dem Verschiebungssatz als

 

angeben.

Für diskrete Zufallsvariablen erhält man für

 

entsprechend zu oben

 

mit   als gemeinsamer Wahrscheinlichkeit, dass   und   ist.

Bei stetigen Zufallsvariablen ergibt sich mit   als gemeinsamer Dichtefunktion von   und   an der Stelle   und   für die Kovarianz

 

entsprechend zu oben

 

Geschichte

Bearbeiten

Die Herkunft der Bezeichnung Satz von Steiner für den Verschiebungssatz ist unklar. Eine direkte Verbindung des Verschiebungssatzes zu dem Werk des Mathematikers Jacob Steiner besteht nicht.

Einzelnachweise

Bearbeiten
  1. Hans-Friedrich Eckey, Reinhold Kosfeld, Christian Dreger: Statistik: Grundlagen — Methoden — Beispiele, S. 86
  2. a b Erich Schubert, Michael Gertz: Numerically stable parallel computation of (co-)variance. In: Proceedings of the 30th International Conference on Scientific and Statistical Database Management - SSDBM '18. ACM Press, Bozen-Bolzano, Italy 2018, ISBN 978-1-4503-6505-5, S. 1–12, doi:10.1145/3221269.3223036 (acm.org [abgerufen am 7. Dezember 2019]).
  3. a b Tony F. Chan, Gene H. Golub, Randall J. LeVeque: Algorithms for computing the sample variance: analysis and recommendations. In: The American Statistician Vol. 37, No. 3 (Aug., 1983), S. 242–247
  4. Ansgar Steland: Basiswissen Statistik, S. 116