Punktbiseriale Korrelation

Zusammenhangsmaß

Als punktbiseriale Korrelation wird der Korrelationskoeffizient für den Zusammenhang zwischen einem intervallskalierten Merkmal und einem dichotomen (bernoulliverteilten) Merkmal bezeichnet. Es handelt sich nicht um eine eigenständige Maßzahl, sondern um einen Spezialfall des gewöhnlichen Korrelationskoeffizienten nach Pearson, der in diesem Fall berechnet werden kann als

,

wobei die Quadratsumme, den Stichprobenumfang, den Anteil der Untersuchungseinheiten mit der in D erfassten Eigenschaft und den Anteil der Untersuchungseinheiten ohne die in D erfasste Eigenschaft bezeichnet.

Herleitung aus der Pearson-Korrelation

Bearbeiten

Der Einfachheit halber wird angenommen, dass das dichotome Merkmal   die Werte 0 und 1 annimmt, sodass der Mittelwert in   gleich   ist. Nach der allgemeinen Formel berechnet sich die Korrelation zwischen   und   über

 .

Man kann nun eine Fallunterscheidung treffen:   Untersuchungseinheiten sind D=1 und liegen mit   über dem Mittelwert in D, die übrigen   Untersuchungseinheiten sind D=0 und liegen mit   unter dem Mittelwert in D. Damit gilt

 ,

was sich über

 

zur obigen Gleichung vereinfachen lässt.

Anwendung in gängiger Statistiksoftware

Bearbeiten

SPSS und R verwenden automatisch die punktbiseriale Rechenweise, wenn die Befehle CORRELATE bzw. cor, cor.test angefordert werden und eine der Variablen nur zwei Ausprägungen (z. B. die Werte 0 und 1) hat, die auch als berechnungsrelevant angesehen werden (−7 oder 99 z. B. können in SPSS als fehlende Werte markiert und somit ignoriert werden).

Literatur

Bearbeiten
  • Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage. Springer, Berlin u. a. 2005, ISBN 3-540-21271-X.
  • J. Cohen, P. Cohen, S. G. West, L. S. Aiken: Applied Multiple Regression / Correlation Analysis For The Behavioral Sciences. London 2003, ISBN 0-8058-2223-2.