Kritischer Wert (Statistik)
Ein kritischer Wert ist in der Testtheorie und bei der Anwendung statistischer Tests eine Stelle, die den Ablehnbereich (kritischen Bereich) vom Annahmebereich (Nicht-Ablehnungsbereich) eines statistischen Tests trennt. Bei vielen in der Anwendung verbreiteten statistischen Testverfahren ist der Ablehnbereich ein Intervall oder die Vereinigung von zwei Intervallen, so dass es einen oder zwei kritische Werte gibt.[1][2]
Beispiel: einseitiger t-Test
BearbeitenBei einem einseitigen Einstichproben-t-Test mit der Nullhypothese und der Gegenhypothese ist der Ablehnbereich
und der Annahmebereich ist das Komplement
Der Berührungspunkt zwischen dem Ablehnbereich und dem Annahmebereich ist der kritische Wert. Hier ist der kritische Wert das -Quantil der t-Verteilung mit Freiheitsgraden.
Liegt die Prüfgröße , das ist eine Realisierung der Teststatistik , im Ablehnbereich, ist also größer als der kritische Wert, so wird die Nullhypothese dieses Tests zugunsten der Gegenhypothese abgelehnt, anderenfalls nicht abgelehnt. Die nebenstehende Abbildung verdeutlicht dies.
Bei einer Testdurchführung, die auf dem p-Wert basiert, ist der p-Wert genau dann kleiner als das vorgegebene Signifikanzniveau , wenn die Prüfgröße im Ablehnbereich liegt, das bedeutet hier, dass größer als der kritische Wert ist.
Beispiel: zweiseitiger t-Test
BearbeitenBei einem zweiseitigen Einstichproben-t-Test mit der Nullhypothese und der Gegenhypothese setzt sich der Ablehnbereich
aus zwei Teilintervallen zusammen und der Annahmebereich ist das Komplement
Dabei bezeichnet das -Quantil der t-Verteilung mit Freiheitsgraden. Es gibt in diesem Fall die zwei kritischen Werte und , die den Ablehnbereich vom Annahmebereich trennen. Die Nullhypothese dieses Tests wird abgelehnt, wenn die Prüfgröße im Ablehnbereich liegt, wenn also entweder oder gilt.
In der zweiten Abbildung ist, zusammengesetzt aus zwei blauen Teilflächen, die Fehlerwahrscheinlichkeit 1. Art (engl.: chance of Type I error), d. h. die Ablehnwahrscheinlichkeit bei Richtigkeit der Nullhypothese, für den Fall einer zweiseitigen Alternativhypothese dargestellt. Die rot schraffierte Fläche unter der roten Dichtefunktion über dem Ablehnbereich verdeutlicht eine Fehlerwahrscheinlichkeit 2. Art und damit einen Wert der Trennschärfe (Power) des Tests. Ein zweiter, in diesem Fall sehr kleiner, Teil der Fehlerwahrscheinlichkeit 2. Art wird durch die Fläche unter der roten Dichtefunktion über dem linken Teil des Ablehnbereichs beigetragen, ist aber in dieser Graphik nicht sichtbar.
Häufig, wie auch in den beiden angegebenen Beispielen von Ablehnbereichen, kann im Fall einer einfachen Nullhypothese der Ablehnbereich so gewählt werden, dass das vorgegebene Signifikanzvniveau und die Fehlerwahrscheinlichkeit 1. Art übereinstimmen, und kann im Fall einer zusammengesetzten Nullhypothese der Ablehnbereich so gewählt werden, dass das vorgegebene Signifikanzvniveau die Fehlerwahrscheinlichkeiten 1. Art nach oben beschränkt und zugleich das Maximum oder Supremum dieser Fehlerwahrscheinlichkeiten 1. Art ist.
Einzelnachweise
Bearbeiten- ↑ Ludwig Fahrmeir, Christian Heumann, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik – Der Weg zur Datenanalyse. 9., überarbeitete und ergänzte Auflage. Springer Spektrum, Berlin / Heidelberg 2023, ISBN 978-3-662-67525-0, S. 413, 469, doi:10.1007/978-3-662-67526-7.
- ↑ Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik – Lehr- und Handbuch der angewandten Statistik. 15., überarbeitete und wesentlich erweiterte Auflage. Oldenbourg, München 2009, ISBN 978-3-486-59028-9, S. 134, 1023, doi:10.1524/9783486710540.