Verallgemeinerte Varianz
In der multivariaten Statistik ist die verallgemeinerte Varianz neben der totalen Varianz eine Kennzahl für die Gesamtstreuung eines multivariaten (mehrdimensionalen) Datensatzes (mit Variablen ). Bei Vergleich der verallgemeinerten Varianzen zweier unterschiedlicher Grundgesamtheiten ist es möglich, dass eine Grundgesamtheit eine größere verallgemeinerte Varianz aufweist als die andere, aber dennoch eine geringere totale Varianz.
Die verallgemeinerte Varianz ist definiert durch die Determinante der Kovarianzmatrix. Das Konzept der verallgemeinerten Varianz wurde durch Samuel Stanley Wilks eingeführt.
Definition
BearbeitenFür die Kovarianzmatrix in der Grundgesamtheit ist die verallgemeinerte Varianz definiert als ihre Determinante, d. h.:[1]
- .
Im Gegensatz dazu ist die verallgemeinerte Stichprobenvarianz gegeben durch . Hierbei stellt die Stichproben-Kovarianzmatrix dar.
Geometrische Interpretation
BearbeitenDie verallgemeinerte Stichprobenvarianz hat eine geometrische Interpretation. Die Erweiterung einer Ellipse auf mehr als zwei Dimensionen wird als Hyperellipsoid bezeichnet. Ein p-dimensionaler Hyperellipsoid , der bei zentriert ist und auf basiert, um den Abstand zum Zentrum zu standardisieren, enthält einen Teil der Beobachtungen in der Stichprobe. Der Ellipsoid hat Achsen, die proportional zu den Quadratwurzeln der Eigenwerte der Stichproben-Kovarianzmatrix sind. Es kann gezeigt werden, dass das Volumen des Ellipsoids proportional zu ist.[1]