Benutzer:Pelz-Guenter/Konzentrationsellipse

Beispiel: (aus Arens "Mathematik", S.1245)

Bei 10 Objekten seien jeweils die Länge x1 (in cm) und das Gewicht x2 (in kg) gemessen worden (die "2" ist eine Nummer)

Messwerte
x1 x2
1,0 1,41
2,0 1,56
2,0 2,19
4,0 2,79
5,0 3,04
6,0 2,23
9,0 3,74
9,0 3,84
9,0 2,80
13,0 4,18


X = () ist eine zweidimensionale Zufallsvariable.

Die Erwartungswerte und Varianzen der Teilvariablen sind: μ(x1)=6 ; μ(x2)=2,78 ; σ2(x1)=13,8 ; σ2(x2)=0,81

Zu den Varianzen kommt noch die Kovarianz cov() = = 2,792 hinzu. (- Mit hochgestellten Indizes sind die Teilvariablen nummeriert, die tiefgestellten Indizes kennzeichnen die Werte der jeweiligen Teilvariablen. -)


Alle Varianzen und Kovarianzen werden in der Kovarianzmatrix C zusammenfasst:

C =

Die Varianzan stehen in der Hauptdiagonalen und sind ebenfalls als "Kovarianzen" notiert, denn für jede Teilvariable gilt: cov() = σ2() , i=1,2 .


Damit C = und C-1 =


In Bezug auf den Mittelpunkt ( μ(x1) / μ(x2) ) = ( 6 / 2,78 ) der Punktwolke kann im Diagramm nun eine "Konzentrationsellipse" eingezeichnet werden:

 Ԑk =


Die Rechnung ergibt für k=2 :

(Für das Zeichnen empfiehlt es sich, eine Hauptachsentranformation durchzuführen.)


Die mehrdimensionale Tschebyscheffsche Ungleichung besagt, dass außerhalb dieser Konzentrationsellipse ( k=2 ) höchstens 50% der Stichproben-Tupel liegen.


Einzelnachweise (Quellen)

- T. Arens und andere, Mathematik, Spektrun Akademischer Verlag, 2008, ISBN 978-3-8274-1758-9


Die (eindimensionale) Tschebyscheffsche Ungleichung besagt, dass für eine (eindimensionale) Zufallsvariable X mit dem Erwartungswert μ und der Varianz σ2 die Wahrscheinlichkeit, dass X einen Wert außerhalb des Intervalls (μ-kσ , μ+kσ) annimmt, höchstens gleich 1/k2 beträgt.

  1 - P(μ-kσ ≤ X ≤ μ+kσ) ≤ 

z.B. k=2 : 1 - P( μ-2σ ≤ X ≤ μ+2σ ) , d.h. außerhalb des 2σ-Intervalls sind bei einer Stichprobe höchstens 25% der Werte von X zu erwarten.

Für eine mehrdimensionale Zufallsvariable X = () kommen zu den Varianzen σ2() noch die Kovarianzen cov() = , i,j=1...n hinzu. (- Mit hochgestellten Indizes sind die Teilvariablen nummeriert, die tiefgestellten Indizes kennzeichnen die Werte der jeweiligen Teilvariablen. N ist der Stichprobenumfang -)


Alle Varianzen und Kovarianzen werden in der Kovarianzmatrix C zusammengefasst:

C =

Die Varianzan stehen in der Hauptdiagonalen und sind ebenfalls als "Kovarianzen" notiert, denn für jede Teilvariable gilt: cov() = σ2() , i=1,...,n .


Beispiel: (aus Arens "Mathematik", S.1245)

Bei 10 Objekten seien jeweils die Länge x1 (in cm) und das Gewicht x2 (in kg) gemessen worden (die "2" ist eine Nummer)

Messwerte
x1 x2
1,0 1,41
2,0 1,56
2,0 2,19
4,0 2,79
5,0 3,04
6,0 2,23
9,0 3,74
9,0 3,84
9,0 2,80
13,0 4,18

Rechnung ergibt: μ(x1)=6 ; μ(x2)=2,78 ; σ2(x1)=13,8 ; σ2(x2)=0,81 und cov(x1,x2)=2,972

Damit C = C-1 =

In Bezug auf den Mittelpunkt ( μ(x1) / μ(x2) ) = ( 6 / 2,78 ) der Punktwolke kann im Diagramm eine "Konzentrationsellipse" eingezeichnet werden:

 Ԑk =


Die Rechnung ergibt für k=2 :

(Für das Zeichnen empfiehlt es sich, eine Hauptachsentransformation durchzuführen.)


Die mehrdimensionale Tschebyscheffsche Ungleichung besagt nun, dass außerhalb dieser Konzentrationsellipse ( k=2 ) höchstens 50% der Stichproben-Tupel liegen. Das ist (wie im Eindimensionalen) eine grobe Abschätzung; im Beispiel liegen alle Messpunkte innerhalb der Ellipse.


Allgemein: Ist X = () eine n-dimensionale Zufallsvariable, die auf den "Mittelpunkt" (μ(x1) / ... / μ(xn) ) zentriert wurde, so gilt für die zentrierte Variable die

 Mehrdimensionale Tschebyscheffsche Ungleichung:
 1 - P( ) ≤ 

im Beispiel: n=2 , k=2  : 1 - P( ) = 0,5


Es stellen sich zwei Fragen:

1) Wie ergibt sich die Gleichung der Konzentrations-"Ellipse" (n=3: -Ellipsoid. n=4: ... ) ?

2) Wie beweist man die Mehrdimensionale Tschebyscheffsche Ungleichung ?


zu 1)

Anfang des 20. Jahrhunderts berechnete Harlow Shapley (1885 - 1972) die Ausdehnung der Milchstraße und die Lage der Galaktischen Ebene im Raum. Dazu benötigte er die (euklidischen) Koordinaten x1, x2, x3 einer repräsentativen Auswahl von N "Objekten" in Bezug auf ein fest gewähltes Koordinatensystem.

Ist ax1 + bx2 + cx3 - d = 0 | a2+b2+c2=1 die Hessesche Normalform der gesuchten Galaktischen Ebene, so lässt sich von jedem "Objekt" der Abstand von dieser Ebene "berechnen". Im Sinne der "Methode der kleinsten Quadrate" ist dann die Ebene (Koeffizienten a,b,c und d) so zu bestimmen, dass der Mittelwert der quadratischen Abstände minimal wird:


    soll minimal werden ( mit der Nebenbedingung  a2+b2+c2=1 )

Der Mittelpunkt der "Objektwolke" P() mit (Mittelwerte) soll von der gesuchten Ebene den Abstand 0 = haben.

Damit lässt sich der Koeffizient d eliminieren und man erhält

    soll minimal werden (mit der Nebenbedingung  a2+b2+c2=1 )

Die weitere Rechnung wird erleichtert, wenn man zur Vektor- und Matrizenschreibweise übergeht. Die Rechnung ist dann ohne weiteres auch auf höhere Dimensionen erweiterbar.

=() ; =() Die Vektorpfeile sind weggelassen; Vektoren werden als 3x1-Matrix (in der Transponierten als 1x3-Matrix) behandelt.

Die Koeffizienten der Ebene werden zu einem "Ebenenvektor" (Normalenvektor) eT = (a|b|c) zusammen gefasst.

Damit:

  (eT(xk-xp))2   soll minimal werden (mit der Nebenbedingung |e| = a2+b2+c2=1 )  


Mit den Rechenregeln für Matrizen (insbesondere (AB)C = A(BC) und (AB)T = BTAT erhält man

(eT (xk-xp) )2 = [ eT (xk-xp) ][ eT (xk-xp) ] = [ eT (xk-xp) ][ (xk-xp )T e ]T - in der letzten eckigen Klammer steht eine 1x1-Matrix, so dass das "T" weggelassen werden kann -

= [ eT (xk-xp) ][ (xk-xp )T e ] = eT [ (xk-xp) (xk-xp )T ] e = eT [ (xk-xp) (xk-xp )T ] e

In der letzten eckigen Klammer steht die Kovarianzmatrix C :

(xk-xp) (xk-xp )T = () =

Zusammen mit "" ist das die Matrix C .


Also:

 (a|b|c) C    soll minimal werden (mit der Nebenbedingung  a2+b2+c2=1 ) 

Man hat es jetzt mit einer Quadratischen Form zu tun und deren Minimum über der Einheitsspähre.

Nach der Theorie der "Quadratic Forms on the Unit Sphere" (siehe z.B. (2) S. 158 ff.) ergibt sich das Minimum als (normierter) Eigenvektor zum kleinsten Eigenwert der Matric C .

Beispiel (Übungsaufgabe) : Man bestimme die "Galaktische Ebene" zu den 5 Punkten (2/3/2) (1/4/3) (3/0/2) (2/4/0) (1/0/3) .

Lösung: eT = (0,82 | 0,21 | 0,53) und damit E: 0,82x1 + 0,21x2 + 0,53x3 - 3,0 = 0


Nach dem gleichen Verfahren (Eigenwerte bestimmen, Eigenvektoren berechnen) werden aber auch die Achsen der Ellipsoid-Schar ( x1 | x2 | x3 ) C = k2 bestimmt. Dabei liefert der Eigenvektor zum kleinsten Eigenwert die größte Halbachse des Ellipsoids. Das ist aber nach den obigen Ausführungen die Richtung des Ebenenvektors (Normalenvektor), der senkrecht auf der "Galaktischen Ebene" steht. Für ein "Konzentrations-Ellipsoid" müssen kürzeste und längste Halbachse also noch getauscht werden. Das leistet aber gerade die inverse Matrix C-1 . (Hinweis zur Begründung: Ist λ ein Eigenwert von C , so ist 1/λ ein Eigenwert von C-1) .

 Definition Konzentrationsellipsoid-Schar ( n=3 )
 Ԑk = { (x1,x2,x3) | ( x1 | x2 | x3 ) C-1  = k2 }


zu 2)

Der Beweis der Mehrdimensionalen Tschebyscheffschen Ungleichung (siehe auch (1), Bonusmaterial zu Kap. 38) kann für n=2 durch pures Ausrechnen des Erwartungswerts der zentrierten Variablen U = ( x1 | x2 ) C-1  ; μ(x1) = μ(x2) = 0 erfolgen:

Mit C-1 =  : E(U) =


Da die Teilvariablen zentriert sind (Erwartungswerte 0) gilt: E((xi)2)=σ2((xi)=cov(xi,xi) und E(x1x2)=cov(x1,x2) und man erhält:


E(U) = == = 2 (!)


Andererseits ist E(U)= - ui sind die (nicht-negativen Werte) von U , wenn x die Werte annimmt.


Nach Vorgabe von k2 unterteilt man die Summe in

E(U)= +

Damit ist E(U) ≥ > k2 = k2 P(U>k2)

Es folgt P(U>k2)=


Damit ist die 2-dimensionale Ungleichung gezeigt: 1 - P( U ≤ k2 ) = P ( U > k2 ) ≤ .


Das Berechnen der inversen Kovarianzmatrix C-1 gestaltet sich mit zunehmender Dimension immer aufwändiger.


Es zeigt sich, dass die Berechnung der inversen Kovarianzmatrix entbehrlich ist, wenn man zu einem unscheinbaren, hier aber sehr mächtigen Satz über die "Spur" von Matrizen greift (die Spur einer quadratischen Matrix ist die Summe der Einträge in der Hauptdiagonalen):


Satz: Ist A eine nxm- und B eine mxn-Matrix, so ist sowohl AB als auch BA quadratisch und es gilt: Spur(AB) = Spur(BA)


Damit: E(U) = E(Spur( xTC-1x )) - das ist trivial, da in der Klammer insgesamt eine 1x1-Matrix steht. -

= E(Spur( xT [ C-1x ] )) = E(Spur( [ c-1x ] xT )) = E(Spur ( C-1 [ xxT ] ))


Mit xxT = und E ( xxT ) = C


also E(U) = Spur( C-1C ) = Spur( In ) = n

- In ist die n-dimensionale Einheitsmatrix -


Wie oben (Unterteilung der Summe E(U) ) führt man den Beweis zu Ende: 1 - P( U ≤ k2 ) = P ( U > k2 )


Beispiel 2 :

Anfang des 20. Jahrhunderts berechnete Harlow Shapley (1885 - 1972) die Ausdehnung der Milchstraße und die Lage der Galaktischen Ebene im Raum. Dazu benötigte er die (euklidischen) Koordinaten x1, x2, x3 einer repräsentativen Auswahl von N "Objekten" in Bezug auf ein fest gewähltes Koordinatensystem.

Ist ax1 + bx2 + cx3 - d = 0 | a2+b2+c2=1 die Hessesche Normalform der gesuchten Galaktischen Ebene, so lässt sich von jedem "Objekt" der Abstand von dieser Ebene "berechnen". Im Sinne der "Methode der kleinsten Quadrate" ist dann die Ebene (Koeffizienten a,b,c und d) so zu bestimmen, dass der Mittelwert der quadratischen Abstände minimal wird:


    soll minimal werden ( mit der Nebenbedingung  a2+b2+c2=1 )

Der Mittelpunkt der "Objektwolke" P() mit (Mittelwerte) soll von der gesuchten Ebene den Abstand 0 = haben.

Damit lässt sich der Koeffizient d eliminieren und man erhält

    soll minimal werden (mit der Nebenbedingung  a2+b2+c2=1 )

Die weitere Rechnung wird erleichtert, wenn man zur Vektor- und Matrizenschreibweise übergeht. Die Rechnung ist dann ohne weiteres auch auf höhere Dimensionen erweiterbar.

=() ; =() Die Vektorpfeile sind weggelassen; Vektoren werden als 3x1-Matrix (in der Transponierten als 1x3-Matrix) behandelt.

Die Koeffizienten der Ebene werden zu einem "Ebenenvektor" (Normalenvektor) eT = (a|b|c) zusammen gefasst.

Damit:

  (eT(xk-xp))2   soll minimal werden (mit der Nebenbedingung |e| = a2+b2+c2=1 )  


Mit den Rechenregeln für Matrizen (insbesondere (AB)C = A(BC) und (AB)T = BTAT erhält man

(eT (xk-xp) )2 = [ eT (xk-xp) ][ eT (xk-xp) ] = [ eT (xk-xp) ][ (xk-xp )T e ]T - in der letzten eckigen Klammer steht eine 1x1-Matrix, so dass das "T" weggelassen werden kann -

= [ eT (xk-xp) ][ (xk-xp )T e ] = eT [ (xk-xp) (xk-xp )T ] e = eT [ (xk-xp) (xk-xp )T ] e

In der letzten eckigen Klammer steht die Kovarianzmatrix C :

(xk-xp) (xk-xp )T = () =

Zusammen mit "" ist das die Matrix C .


Also:

 (a|b|c) C    soll minimal werden (mit der Nebenbedingung  a2+b2+c2=1 ) 

Man hat es jetzt mit einer Quadratischen Form zu tun und deren Minimum über der Einheitsspähre.

Nach der Theorie der "Quadratic Forms on the Unit Sphere" (siehe z.B. (2) S. 158 ff.) ergibt sich das Minimum als (normierter) Eigenvektor zum kleinsten Eigenwert der Matric C .


Übungsaufgabe: Man bestimme die "Galaktische Ebene" zu den 5 Punkten (2/3/2) (1/4/3) (3/0/2) (2/4/0) (1/0/3) .

Lösung: eT = (0,82 | 0,21 | 0,53) und damit E: 0,82x1 + 0,21x2 + 0,53x3 - 3,0 = 0


Einzelnachweise (Quellen)

(1) T. Arens und andere, Mathematik, Spektrum Akademischer Verlag, 2008, ISBN 978-3-8274-1758-9

(2) R. Kurth, Introduction to Stellar Statistics, Pergamon Press, 1967, Library of Congress Catalog Card 66-24821


Kategorie:Zufallsvariable Kategorie:Wahrscheinlichkeitsrechnung Kategorie:Ungleichung (Stochastik) Kategorie:Satz (Mathematik)