Ein gleichmäßig bester Test (GB-Test), gleichmäßig trennschärfster Test, gleichmäßig schärfster Test, gleichmäßig mächtigster Test, oder kurz bester Test ist ein spezieller statistischer Test in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Gleichmäßig beste Tests zeichnen sich dadurch aus, dass die Wahrscheinlichkeit für einen Fehler 1. Art immer unter einer vorgegebenen Grenze liegt, gleichzeitig aber die Wahrscheinlichkeit für ein Fehler 2. Art kleiner ist als die jedes weiteren Tests, der ebenfalls die vorgegebene Grenze für den Fehler 1. Art einhält. Nachteil an gleichmäßig besten Tests ist, dass sie im Gegensatz zu anderen Klassen von optimalen Schätzern wie strengen Tests und Maximin-Tests nur unter sehr eingeschränkten Rahmenbedingungen existieren.

Teils findet sich auch die Bezeichnung als UMP-Test, die aus dem Englischen von Uniform Most Powerful (gleichmäßig trennschärfster bzw. gleichmäßig mächtigster) abgeleitet ist.

Definition

Bearbeiten

Gegeben sei ein Statistisches Modell   sowie eine disjunkte Zerlegung von   in Nullhypothese   und Alternative  . Sei   die Menge aller statistischen Tests zum Niveau  , das heißt alle Statistiken

 ,

für die

 

gilt. Sei

 

die Gütefunktion des Tests  . Der Test   heißt dann ein gleichmäßig bester Test (oder gleichmäßig trennschärfster Test) zum Niveau  , wenn für alle weiteren   die Trennschärfe von   größer ist als die Trennschärfe von  . Es gilt also

 .

Alternativ kann ein gleichmäßig bester Test auch definiert werden als derjenige Test, dessen Gütefunktion auf der Alternative mit der einhüllenden Gütefunktion (englisch envelope power function) von   übereinstimmt.

Existenz

Bearbeiten

Gleichmäßig beste Tests müssen im Allgemeinen nicht existieren. Wichtigstes Hilfsmittel zur Herleitung von Existenzaussagen und zur Konstruktion von gleichmäßig besten Tests ist das Neyman-Pearson-Lemma, das teils auch das Fundamentallemma der mathematischen Statistik genannt wird.

Einfache Hypothesen

Bearbeiten

Für Tests mit einfachen Hypothesen, also einer einelementigen Nullhypothese und einer einelementigen Alternative liefert das Neyman-Pearson-Lemma die Existenz eines gleichmäßig besten Tests zu einem vorgegebenen Niveau  . Dieser Test ist der Neyman-Pearson-Test, ein Likelihood-Quotienten-Test. Einzige zusätzliche Voraussetzung ist die Existenz der Wahrscheinlichkeitsdichtefunktionen von Nullhypothese und Alternative.

Nach dem Lemma von Stein konvergiert die Trennschärfe des Neyman-Pearson-Tests mit exponentieller Geschwindigkeit bei wachsender Stichprobengröße gegen  .

Einseitige Tests

Bearbeiten

In einparametrigen Modellen mit monotonem Dichtequotient in   existiert ein gleichmäßig bester einseitiger Test zu einem vorgegebenen Niveau  , also ein Test bei dem Nullhypothese und Alternative von der Form

 

sind. Dabei ist   und   eine vorgegebene Zahl aus  . Der Test ist dann gegeben durch

 .

Dabei sind   so zu wählen, dass die Bedingung   erfüllt ist. Des Weiteren ist die Gütefunktion monoton. Bei einem Vertauschen von Nullhypothese und Alternative kehren sich die kleinergleich/größergleich-Zeichen um.

Eine große Verteilungsklasse mit monotonem Dichtequotient ist die einparametrische Exponentialfamilie (wenn die Parameterfunktion   monoton ist oder die Familie in natürlicher Parametrisierung vorliegt).

Das Ergebnis über beste einseitige Tests leitet sich direkt aus dem Neyman-Pearson-Lemma ab: Aufgrund der Monotonie des Dichtequotienten ist der Test von   gegen   für alle   ein gleichmäßig bester Test, somit ist   ein gleichmäßig bester Test von   gegen  . Da man zeigen kann, dass die Gütefunktion monoton ist, hält der Test für alle   das Niveau   ein und ist somit ein gleichmäßig bester Test zum Niveau   von   gegen  .

Weitere Aussagen

Bearbeiten

Weitere Existenzaussagen erhält man beispielsweise durch die Einschränkung auf kleinere Klassen von Tests wie unverfälschte Tests, für diese lassen sich Aussagen beispielsweise mithilfe von ähnlichen Tests herleiten.

Verwandte Begriffe

Bearbeiten

Der zum gleichmäßig besten Test duale Begriff für Konfidenzbereiche (im Sinne der Dualität von Tests und Konfidenzbereichen) ist der gleichmäßig bester Konfidenzbereich.

Bearbeiten

Literatur

Bearbeiten