Diskussion:Zweistichproben-t-Test

Vorgeschichte

Letzter Kommentar: vor 3 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Der Inhalt dieses Artikel wurde 2011 aus dem Artikel t-Test ausgelagert, allerdings wurden die betreffenden Diskussionen nicht mitgeführt. Ältere Diskussionen bis 2011 finden sich daher auf der Seite Diskussion:T-Test.--Sigma^2 (Diskussion) 09:31, 24. Aug. 2021 (CEST)Beantworten

Abhaengige Stichproben

Letzter Kommentar: vor 3 Jahren7 Kommentare4 Personen sind an der Diskussion beteiligt

MMn ist der Titel des Abschnitts "Zweistichproben-t-Test für abhängige Stichproben" falsch, und der Abschnitt gehoert nicht hier, Zwar handelt es sich um zwei Stichproben, aber der Test bezieht sich auf die eine Stichprobe der Differenzen. Nijdam 21:43, 12. Nov. 2011 (CET)Beantworten

Was macht denn der Test für "abhängige Stichproben"? In beiden Fällen wird

\mu _{X}-\mu _{Y}

betrachtet; man könnte den Abschnitt für abhängige Stichproben auslagern, aber macht das Sinn? --Sigbert 15:13, 13. Nov. 2011 (CET)Beantworten

Es handelt prinzipiell um dem T-Test fuer eine Stichprobe, naemlich die Stichprobe der Differenzen. MMn gehoert der Fall dort besprochen zu werden.Nijdam 20:23, 13. Nov. 2011 (CET)Beantworten

Mir ist ein grober Fehler aufgefallen: Die Formel für die Berechung der Freiheitsgrade ist falsch. Dort wird mit sx und sy gerechnet. Richtig wäre aber jeweils die VARIANZ. (nicht signierter Beitrag von 89.13.15.58 (Diskussion) 13:43, 29. Nov. 2011 (CET)) Beantworten

Hast recht, habe es korrigiert. Nijdam 17:02, 29. Nov. 2011 (CET)Beantworten

Ich zeigre noch auf meine Bemerkungen oben: der "Zweistichproben-t-Test für abhängige Stichproben" ist wesentlich nur ein Test für gepaarte Beobachtungen. Nijdam (Diskussion) 14:39, 19. Jun. 2012 (CEST)Beantworten

Der Test für so genannte "abhängige Stichproben" muss entweder als t-Differenzentest einen eigenen Artikel bekommen, wie in der englischsprachigen Wikipedia (https://en.wikipedia.org/wiki/Paired_difference_test) oder er muss als Abschnitt in den Artikel Einstichproben-t-Test. Zwar wird in einigen Anwendungsbereichen von "abhängigen Stichproben" gesprochen, es handelt sich aber um e i n e Stichprobe aus e i n e r Grundgesamtheit, bei der z w e i Merkmale an denselben Einheiten beobachtet werden. Nijdam hat grundsätzlich recht, auch wenn in seiner ersten Äußerung falsch konzediert "handelt es sich um zwei Stichproben". Nein es handelt sich eben n i c h t um zwei Stichproben, sondern um e i n e (zweidimensionale) Stichprobe, weswegen die Differenzen gebildet werden können. Die aus dem Anwenderbereich kommende schlechte Begrifflichkeit "abhängige Stichproben" (ähnlich problematisch und üblich für denselben Sachverhalt: "gebundene Stichproben", "gepaarte Stichproben") führt dann dazu, dass der t-Differenzentest unter der Überschrift Zweistichproben-Test landet, wo er nichts zu suchen hat. --Sigma^2 (Diskussion) 18:15, 23. Aug. 2021 (CEST)Beantworten

Beispiel 2

Letzter Kommentar: vor 12 Jahren8 Kommentare2 Personen sind an der Diskussion beteiligt

MMn soll es im Beispiel 2 um einen einseitigen Test handeln. Nijdam (Diskussion) 14:35, 19. Jun. 2012 (CEST)Beantworten

Im Beispiel werden ja beide Varianten (ein- und zweiseitig) erwähnt. Denkst du, dass hier nur der einseitige sinnvoll ist? -- HilberTraum (Diskussion) 17:19, 19. Jun. 2012 (CEST)Beantworten

Unbedingt, denn um eine neue Therapie zur Senkung des Cholesterinspiegels zu testen, möchte man nur sicher sein ob tatsächlich eine Senkung stattfindet. Also ist die alternative Hypothese einseitig. Nijdam (Diskussion) 12:53, 20. Jun. 2012 (CEST)Beantworten

Das würde aber heißen, dass man eine mögliche Erhöhung des Cholesterinspiegels schon vor dem Test völlig ausschließt. Ich denke gerade bei Medikamenten schadet es nicht, wenn man da etwas vorsichtig ist, vgl. Paradoxe Reaktion. -- HilberTraum (Diskussion) 07:33, 21. Jun. 2012 (CEST)Beantworten

Nein, nein, ich erwarte besseres von dir. Es ist nur die Frage was man "beweisen" möchte. Nijdam (Diskussion) 09:01, 21. Jun. 2012 (CEST)Beantworten

Man findet sicher leicht noch bessere Quellen, aber auf die Schnelle mal hier etwas zu Einlesen. -- HilberTraum (Diskussion) 09:20, 21. Jun. 2012 (CEST)Beantworten

Ich verstehe nicht worauf du deutest. Von einer neuen Therapie zur Senkung des Cholesterinspiegels mochte man doch versuchen zu zeigen das sie tatsächlich das Cholesterinspiegel senkt, oder? Die Nullhypothese ist also sie senkt den Cholesterinspiegel nicht. Sie wird nur abgelehnt wenn eine signifikante Senkung festgestellt wird. Nijdam (Diskussion) 23:28, 21. Jun. 2012 (CEST)Beantworten

Man könnte mal im Medizin-Portal nachfragen, wie das in der Praxis gemacht wird, aber nach meinem (theoretischen) Wissen sind zweiseitige Tests bei Medikamenten absolut üblich (oder sogar vorgeschrieben?). Man testet, ob das neue Medikament überhaupt eine Wirkung hat und schaut dann erst auf die Richtung. Begründet wird das damit, dass das Medikament genauso gut auch eine verschlechternde Wirkung haben könnte. Mathematisch könnte man das gleiche natürlich auch mit einem einseitigen Test mit angepasstem

\alpha

machen, aber ich denke man will so mehr "Symmetrie" in die Interpretation bringen. -- HilberTraum (Diskussion) 09:04, 22. Jun. 2012 (CEST)Beantworten

Notation

Letzter Kommentar: vor 12 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Die Notation in den Formeln finde ich einigermaßen irritierend. Folende Schreibweisen würde ich vorschlagen:

Stichproben

$n_{1}$	Fallzahl der ersten Stichprobe
$n_{2}$	Fallzahl der zweiten Stichprobe
${\bar {x}}_{1}$	Mittelwert der ersten Stichprobe
${\bar {x}}_{2}$	Mittelwert der zweiten Stichprobe
$s_{1}$	Standardabweichung der ersten Stichprobe
$s_{2}$	Standardabweichung der zweiten Stichprobe
${\hat {\sigma }}_{1}^{2}$	Aus der ersten Stichprobe geschätzte Grundgesamtheitsvarianz
${\hat {\sigma }}_{2}^{2}$	Aus der zweiten Stichprobe geschätzte Grundgesamtheitsvarianz
${\hat {\sigma }}^{2}$	Aus beiden Stichproben geschätzte gemeinsame Grundgesamtheitsvarianz

Grundgesamtheiten

$\mu _{1}$	Mittelwert der Grundgesamtheit der ersten Stichprobe
$\mu _{2}$	Mittelwert der Grundgesamtheit der zweiten Stichprobe
$\sigma _{1}$	Standardabweichung der Grundgesamtheit der ersten Stichprobe
$\sigma _{2}$	Standardabweichung der Grundgesamtheit der zweiten Stichprobe
$\sigma _{1}^{2}$	Varianz der Grundgesamtheit der ersten Stichprobe
$\sigma _{2}^{2}$	Varianz der Grundgesamtheit der zweiten Stichprobe
$\sigma ^{2}$	Varianz der gemeinsamen Grundgesamtheit beider Stichproben

Sonstiges

$\omega$	Mittelwertdifferenz, auf die getestet wird. Normalerweise gleich null gesetzt. Kann deshalb auch weggelassen werden.
$\mathrm {df}$	Freiheitsgrade

Dann sind:

Testgröße t bei gleichen Varianzen

\mathrm {t} ={\frac {\left({\bar {x}}_{1}-{\bar {x}}_{2}\right)-\omega }{\sqrt {{\displaystyle {\frac {{\hat {\sigma }}_{1}^{2}\cdot \left(n_{1}-1\right)+{\hat {\sigma }}_{2}^{2}\cdot \left(n_{2}-1\right)}{n_{1}+n_{2}-2}}}\cdot \left({\displaystyle {\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}\right)}}}

bzw., was numerisch identisch ist:

\mathrm {t} ={\frac {\left({\bar {x}}_{1}-{\bar {x}}_{2}\right)-\omega }{\sqrt {\displaystyle {\frac {{\hat {\sigma }}_{1}^{2}\cdot \left(n_{1}-1\right)+{\hat {\sigma }}_{2}^{2}\cdot \left(n_{2}-1\right)}{n_{1}+n_{2}-2}}}}}\cdot {\sqrt {\frac {n_{1}\cdot n_{2}}{n_{1}+n_{2}}}}

mit $\mathrm {df} =n_{1}+n_{2}-2$ Freiheitsgraden

Testgröße t bei ungleichen Varianzen (Welch-Korrektur)

\mathrm {t} ={\frac {\left({\bar {x}}_{1}-{\bar {x}}_{2}\right)-\omega }{\sqrt {\displaystyle {\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}

mit

\mathrm {df} ={\frac {1}{\displaystyle {\frac {c^{2}}{n_{1}-1}}+{\frac {\left(1-c\right)^{2}}{n_{2}-2}}}}

Freiheitsgraden, wobei

c={\frac {\displaystyle {\frac {s_{1}^{2}}{n_{1}}}}{\displaystyle {\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}

ist. Vergleiche dazu auch Clauß/Ebner (1968), 184-194 und Borz (2005), 140-143 sowie folgende Webseiten:

http://eswf.uni-koeln.de/lehre/stathome/statcalc/v2401.htm

Effektstärke

Viele Grüße --Jake2042 (Diskussion) 07:02, 25. Jul. 2012 (CEST)Beantworten

Literatur

Borz,Jürgen, (6)2005: Statistik für Human- und Sozialwissenschaftler. Heidelberg: Springer

Clauß, Günter und Heinz Ebner, 1968: Grundlagen der Statistik für Psychologen, Pädagogen und Soziologen. Berlin: Volk und Wissen

Normalverteilungsnotation

Letzter Kommentar: vor 9 Jahren3 Kommentare3 Personen sind an der Diskussion beteiligt

Als Parameter der Normalverteilung werden normalerweise Erwartungswert und Varianz angegeben, also $X_{i}\sim N(\mu _{X};\sigma ^{2})$ . Im Artikel steht hingegen $X_{i}\sim N(\mu _{X};\sigma )$ . Absicht? Gleiches im Artikel Einstichproben-t-Test.--93.131.229.131 19:52, 22. Jun. 2015 (CEST)Beantworten

Ja, ich denke auch, dass das überall auf Varianzen vereinheitlicht werden sollte. -- HilberTraum (d, m) 08:26, 24. Jun. 2015 (CEST)Beantworten

Gleicher Meinung. Nijdam (Diskussion) 23:01, 25. Jun. 2015 (CEST)Beantworten

Beispiel 1

Letzter Kommentar: vor 3 Jahren3 Kommentare3 Personen sind an der Diskussion beteiligt

Es wird vom 0.975-Quantil gesucht, aber von einer Konfidenz von 95% gesprochen. Ich vermute, hier ist ein Fehler, aber verfüge selbst nur über Halbwissen. Könnte das ein sachkundiger Benutzer ändern oder im Fall dass ich falsch liege in einem Halbsatz kurz erwähnen, warum die Zahlen verschieden sind? --80.146.228.74 10:23, 10. Aug. 2017 (CEST)Beantworten

Das stimmt schon so, wie es im Beispiel steht: Das Signifikanzniveau

\alpha =5\,\%

wird zu gleichen Teilen auf die

2{,}5\,\%

„zu großen“ und die

2{,}5\,\%

„zu kleinen“ Werte verteilt. Darum heißt es auch „zweiseitiger“ Test. Grüße -- HilberTraum (d, m) 19:42, 10. Aug. 2017 (CEST)Beantworten

Es ist problematisch, den Begriff "Konfidenz" im Zusammenhang mit statistischen Tests zu verwenden, da es ein Begriff aus dem Bereich der Intervallschätzung (Konfidenzintervalle und -bereiche) ist. Im Bereich der statistischen Test wird vom Signifikanzniveau und Signifikanz gesprochen. Das Ergebnis des Tests kann z.B. so zusammengefasst werden: "Die Düngemittel unterscheiden sich in ihrer Wirkung signifikant (bei einem vorgegebenen Signifikanzniveau von 5%)." --Sigma^2 (Diskussion) 09:59, 24. Aug. 2021 (CEST)Beantworten

Notation " ${\mathrm {t} }(x,y)$ " wird ohne Referenz oder Erklärung verwendet

Letzter Kommentar: vor 3 Jahren2 Kommentare1 Person ist an der Diskussion beteiligt

Im Abschnitt "Zweistichproben-t-Test für unabhängige Stichproben" wird in einer Formel die Notation t(x, y) verwendet. Diese Funktion wird nicht eingeführt. Offensichtlich ist es was anderes als der weiter oben definierte t-Wert. Es wäre schön, wenn ein/e Wissende/r eine Erklärung ergänzen würde, so dass ich das Schritt für Schritt nachrechnen kann (idealerweise ohne Vorwissen über t-Tests, denn sonst müsste ich diesen Artikel ja nicht aufrufen). Nachdem ich den Wikipedia-Artikel "t-Verteilung" angesehen habe (der in einem anderen Kontext weiter oben verlinkt ist), vermute ich, es handelt sich um das x-Intervall einer t-Verteilung mit der Breite y (oder "Freiheitsgrade"???, was auch immer das ist). Die Notation dort ist aber t(x;y) (mit Semikolon!), daher bin ich verwirrt.

Der - leider unsignierte - Einwand ist bezogen auf die Notation richtig. Erstens sollte eine Notation bei der ersten Verwendung erklärt werden. Zweitens sollte sie im Artikel einheitlich verwendet werden (t(x,y) versus t(x;y)). Drittens sollte sie möglichst mit der Notation im Artikel t-Verteilung übereinstimmen oder es sollte wenigstens die Entsprechung der abweichenden Notationen erklärt werden, wenn diese Einheitlichkeit nicht möglich ist. --Sigma^2 (Diskussion) 10:41, 24. Aug. 2021 (CEST)Beantworten

Erster Punkt ist erledigt. Dritter Punkt ist im Sinne des zweiten Halbsatzes erledigt. Der zweite Punkt ist noch schlimmer, da im Artikel neben