Die Bonferroni-Korrektur ist ein Verfahren der mathematischen Statistik zur Adjustierung der Signifikanzniveaus der Einzeltests bei multiplen Testen, um der Alphafehler-Kumulierung entgegenzuwirken und für die Durchschnittshypothese ein vorgegebenes Signifikanzniveau einzuhalten. Die Adjustierung vermindert die Signifikanzniveaus der Einzeltests und damit tendenziell die Anzahl der Ablehnungen richtiger Nullhypothesen (falsch-positiver Befunde in biometrischer Terminologie), so dass die verbleibenden Ablehnungen von Nullhypothesen mit einer höheren statistischen Signifikanz verbunden sind. Die Bonferroni-Methode (nach Carlo Emilio Bonferroni) umfasst neben der Bonferroni-Korrektur ein ähnliches Vorgehen zur Anpassung der Konfidenzniveaus bei der Konstruktion simultaner Konfidenzintervalle für einen mehrdimensionalen Parametervektor.

Adjustierte Signifikanzniveaus

Bearbeiten

Zu   statistischen Tests mit den Nullhypothesen   kann die Durchschnittshypothese   gebildet werden. Die Hypothesen   heißen in diesem Zusammenhang Elementarhypothesen und   heißt Globalhypothese. Ein Test für die Nullhypothese   kann auf den Tests für die einzelnen Elementarhypothesen aufgebaut werden, da die Nullhypothese   genau dann falsch ist, wenn mindestens eine der Elementarhypothesen falsch ist. Eine mögliche Testprozedur besteht also darin,   genau dann abzulehnen, wenn mindestens eine der Hypothesen   abgelehnt wird. Ein vorgegebenes globales Signifikanzniveau   für den Test von   kann im Allgemeinen nicht eingehalten werden, wenn dieses als Signifikanzniveau für jeden der Einzeltests verwendet wird, da es dann zur so genannten Alphafehler-Kumulierung kommen kann.

Um das gewünschte globale Signifikanzniveau   für den Test der Globalhypothese   einzuhalten, besteht die Bonferroni-Korrektur darin, für die einzelnen Tests das lokale Signifikanzniveau

 

vorzugeben. Die so angepassten Signifikanzniveaus

 

für die Einzeltests werden auch adjustierte Signifikanzniveaus genannt. Die Verwendung der adjustierten Signifikanzniveaus führt dazu, das für den Test der Globalhypothese das Signifikanzniveau   gültig ist.

Adjustierte p-Werte

Bearbeiten

Bei einer klassischen Testdurchführung erfolgt die Ablehnung einer Nullhypothese, falls eine Teststatistik im Ablehnbereich (kritischen Bereich) liegt, der vom vorgegebenen Signifikanzniveau abhängt. Bei einer  -Wert-basierten Testdurchführung, die typisch für die Anwendung statistischer Software ist, wird ein berechneter  -Wert mit dem vorgegebenen Signifikanzniveau verglichen und die Nullhypothese wird abgelehnt, falls der  -Wert kleiner als das vorgegebene Signifikanzniveau ist.

Bei einer  -Wert-basierten Testdurchführung wird die Bonferroni-Korrektur durchgeführt, indem die  -Werte der Einzeltests mit den adjustierten Signifikanzniveaus verglichen werden, dabei wird die  -te Nullhypothese abgelehnt, falls   gilt.

Alternativ können adjustierte  -Werte

 

für die Einzeltests gebildet werden, die um den Faktor   größer sind als die ursprünglichen  -Werte, und diese mit dem globalen Signifikanzniveau verglichen werden. Die  -te Nullhypothese wird abgelehnt, falls   gilt.

Beide Vorgehensweisen führen zu denselben Testentscheidungen, da die beiden Regeln   und   äquivalent sind.

Beispiel

Bearbeiten

Gegeben seien die p-Werte   dreier Hypothesentests, die eine Hypothesenfamilie bilden. Unter Vernachlässigung der multiplen Testung und alleiniger Betrachtung lokaler Signifikanzniveaus   erfolgt die Ablehnung der Nullhypothesen 1 und 2, da   und  , während die dritte Hypothese nicht abgelehnt wird, da  . Berücksichtigt man jedoch die Bonferroni-Korrektur (mit  ), so erfolgt nur noch die Ablehnung der Nullhypothese 1, da   und  .

Theoretischer Hintergrund

Bearbeiten

Die Globalhypothese   wird genau dann abgelehnt, wenn mindestens eine Elementarhypothesen abgelehnt wird. Das Ereignis   kann als Vereinigung der Ereignisse   für   dargestellt werden. Mit der ersten Bonferroni-Ungleichung, die auch Boolesche Ungleichung heißt, ergibt sich die Ungleichung

 

Betrachtet man den Fall, dass   richtig ist, und damit auch die Hypothesen   richtig sind, und beschränkt für diesen Fall die Wahrscheinlichkeiten  , die dann Fehlerwahrscheinlichkeiten 1. Art sind, jeweils durch das lokale Signifikanzniveau   nach oben, so ist   durch

 

nach oben beschränkt.

Die Bonferroni-Korrektur kann sehr konservativ sein. Deshalb wurden genauere Methoden entwickelt, die den  -Fehler weniger konservativ kontrollieren und das Signifikanzniveau der multiplen Testprozedur weiter ausschöpfen (siehe Alphafehler-Kumulierung). Im Vergleich zur allgemein anwendbaren Bonferroni-Methode ergibt sich, allerdings nur unter einschränkenden Voraussetzungen, mit der Šidák-Korrektur ein verbessertes Verfahren.

Literatur

Bearbeiten
  • H. Abdi: Encyclopedia of Measurement and Statistics. Hrsg.: N. J. Salkind. Sage, Thousand Oaks, CA 2007, Bonferroni and Sidak corrections for multiple comparisons (utdallas.edu [PDF]).
Bearbeiten