In der multivariaten Statistik ist die verallgemeinerte Varianz neben der totalen Varianz eine Kennzahl für die Gesamtstreuung eines multivariaten (mehrdimensionalen) Datensatzes (mit Variablen ). Bei Vergleich der verallgemeinerten Varianzen zweier unterschiedlicher Grundgesamtheiten ist es möglich, dass eine Grundgesamtheit eine größere verallgemeinerte Varianz aufweist als die andere, aber dennoch eine geringere totale Varianz.

Die verallgemeinerte Varianz ist definiert durch die Determinante der Kovarianzmatrix. Das Konzept der verallgemeinerten Varianz wurde durch Samuel Stanley Wilks eingeführt.

Definition

Bearbeiten

Für die Kovarianzmatrix in der Grundgesamtheit   ist die verallgemeinerte Varianz definiert als ihre Determinante, d. h.:[1]

 .

Im Gegensatz dazu ist die verallgemeinerte Stichprobenvarianz gegeben durch  . Hierbei stellt   die Stichproben-Kovarianzmatrix dar.

Geometrische Interpretation

Bearbeiten

Die verallgemeinerte Stichprobenvarianz hat eine geometrische Interpretation. Die Erweiterung einer Ellipse auf mehr als zwei Dimensionen wird als Hyperellipsoid bezeichnet. Ein p-dimensionaler Hyperellipsoid  , der bei   zentriert ist und auf   basiert, um den Abstand zum Zentrum zu standardisieren, enthält einen Teil der Beobachtungen   in der Stichprobe. Der Ellipsoid   hat Achsen, die proportional zu den Quadratwurzeln der Eigenwerte der Stichproben-Kovarianzmatrix sind. Es kann gezeigt werden, dass das Volumen des Ellipsoids proportional zu   ist.[1]

Einzelnachweise

Bearbeiten
  1. a b Alvin C. Rencher: Methods of multivariate analysis. Vol. 492. John Wiley & Sons, 2003. S. 73.