Diskussion:t-Test
2004-2009
BearbeitenSollen die Tests noch im Einzelnen beschrieben werden? --Philipendula 23:23, 12. Jun 2004 (CEST)
- na klar :) kann sein, dass ich das am wochenende mache, aber versprechen möchte ich es nicht --Andre M. 19:31, 12. Jan 2005 (CET)
Was soll eigentlich ein T-Test im eigentlichen Sinne sein? Nulli 17:22, 4. Mai 2007 (CEST)
Ist das eigentlich richtig, daß für die Standardabweichung mal S(groß) und mal s(klein) benutzt wird? Marder 11:36, 2. Okt. 2007 (CEST)
- Wenn einmal (S) die Schätzfunktion als Zufallsvariable und einmal die konkrete Realisation (s) gemeint ist, ja. --Philipendula 12:20, 2. Okt. 2007 (CEST)
Für Nicht-Mathematiker kryptisch und unverständlich.
Wo, wenn nicht bei WIkipedia würde man nach Statistik suchen, wenn man noch nicht viel davon gehört hat. Allerdings ist das hier von Mathematikern für Mathematiker geschrieben. Ich schließe mich meinem Vorredner an: absolut unverständlich! Als ich bei Wiki mal einen Artikel über ein neurophysiologisches Thema geschrieben habe (etwa auf Abi-Niveau) wurde der mit der Begründung gelöscht, er sei für Laien unverständlich.
Aber was ist dieser Artikel hier? Offensichtlich misst man bei Wikipedia mit zwei verschiedenen Maßstäben: dem mathematisch-computerexpertigen und dem für alles Restliche, was Mathematiker und Programmierer nicht verstehen.
Schade, denn so wird das nix mit "Die Summe des Wissens der Menscheit für jeden zugänglich" zu machen.
Ich stimme zu. Die mathematische Erklärung ist ja nicht verkehrt, aber am Anfang würde sich doch eine Erklärung, wofür der Test ist und für welche Fälle man ihn Anwenden sollte, anbieten, vielleicht sogar mit Beispiel.79.212.168.231 12:35, 16. Sep. 2009 (CEST)
t-Tests für zwei unabhängige Stichproben, Kompaktdarstellung
BearbeitenMeines Erachtens fehlt in der Kompaktdarstellung bei t-Tests für zwei unabhängige Stichproben der Faktor sowohl in der Teststatistik als auch im Prüfwert.
Des weiteren taucht hier erstmals der Wert auf, ohne ihn vorher im Beispiel zu erwähnen.
-- 88.77.159.130 11:12, 6. Mai 2009 (CEST)
- Werde es, wenn ich Zeit habe, mal untersuchen. Ich habe den Eindruck, dass sich im Laufe der Zeit in diesem Artikel viel angesammelt hat, was wohl auch nicht ausreichend kritisch gewürdigt worden ist, ev. viel Redundantes etc. Sollte man mal durchforsten. -- Philipendula 11:44, 6. Mai 2009 (CEST)
- Sollte dringend mal gemacht werden, denn die angebene Formel scheint eine Approximation für die Annahme von gleichen Varianzen zu sein. Wenn ich mir die erste Formel hier anschaue, dann kommt da bei deutlich unterschiedlichen Varianzen ein völlig anderes Ergebnis raus.
- Was mir allgemein noch aufgefallen ist: Die Beispiele hier zielen darauf ab, dass ein Unterschied mit möglichst hoher Signifikanz festgestellt werden kann. Es kann aber auch durchaus gewünscht sein, dass eine Übereinstimmung mit hoher Signifikanz festgestellt wird. Da wird das Alpha dementsprechend hoch anstatt niedrig gewählt - wobei sich beim einseitigen Test die Besonderheit ergibt, dass man nicht über 0,5 gehen darf, da der Test sonst in die andere Richtung kippt. --Jogy sprich mit mir 11:21, 9. Jul. 2009 (CEST)
- Das ist korrekt, dass angenommen wurde die Varianzen sind gleich. Im Falle ungleicher Varianzen wird am Anfang auf den Welch-Test, der als eigenes Lemma existiert, verwiesen. Deswegen ist in der Kompaktdarstellung darauf auch keine Rücksicht genommen worden. -- Sigbert 14:58, 8. Feb. 2010 (CET)
Beispiel 3
BearbeitenKönnte man hier nicht noch ergänzen, dass bei Reduktion auf einen einseitigen Test mit 97,5% Konfidenz ausgesagt werden könnte, dass B nicht besser als A ist? --195.182.50.103 10:26, 9. Jul. 2009 (CEST)
Annahmebereich?
Bearbeiten- Eigentlich soll man nur von "H0 ablehnen" und die Alternative "H0 nicht ablehenen" sprechen.
- Der Ahnnamebereich kan man nicht definieren mit Hilfe von v. H0 wird abgelehnt wenn z.B.
, d.h. usw. Wen man ubedingt vom Ahnnamebereich sprechen moechte, dann .Nijdam 18:01, 7. Feb. 2010 (CET)
- Ich habe den Annahmebereich von H0 aus der Kompaktdarstellung für ungepaarte Stichproben herausgenommen (bei den anderen war er draußen). Dieser Bereich sagt ja lediglich, dass die Wahrscheinlichkeit für H0 > α ist, das sind aber in der Regel bestenfalls wenige Prozent. Das besagt lediglich, dass die Wahrscheinlichkeit von H0 zu hoch ist, um sie mit ausreichender Sicherheit abzulehnen.
Um das wirklich zu einem Annahmebereich zu machen, müßte man α ausreichend hoch wählen.--Jogy sprich mit mir 08:58, 11. Mai 2010 (CEST) - Nachtrag: So ausgedrückt war das natürlich Unsinn. Bei einseitigen Tests ist das möglich, was natürlich einem Vertauschen von Null- und Alternativhypothese entspricht. Bei zweiseitigen Tests geht es gar nicht. --Jogy sprich mit mir 14:01, 28. Mai 2010 (CEST)
Seiten bzw. one-tailed vs. two-tailed test
BearbeitenWer mal versucht hat aus der EXCEL-Hilfe zum T-Test schlau zu werden, stößt auf die Anzahl der Seiten bzw. Schwänze. Was hat es damit auf sich? (nicht signierter Beitrag von 141.35.213.250 (Diskussion) 12:03, 18. Jun. 2010 (CEST))
- Das ist das, was hier unter einseitig (also rechts- bzw. linksseitig) und zweiseitg dargestellt wird. --Jogy sprich mit mir 18:02, 18. Jun. 2010 (CEST)
Frage zu Beispiel 1
BearbeitenBei Beispiel 1: t(0,95;9) = 1,833 --- ist das nicht 2.262?? - Andreas (nicht signierter Beitrag von 129.27.219.153 (Diskussion) 16:51, 21. Jun. 2010 (CEST))
- Nein. Du musst beachten, ob es ein einseitiger oder zweiseitiger Test ist. --Jogy sprich mit mir 18:35, 21. Jun. 2010 (CEST)
Einleitung
Bearbeiten- Test des Koeffizienten einer Regressionsanalyse bei normalverteilter Störgröße: Ist da nicht eigentlich die Lineare Regression gemeint?
- Test des Korrelationskoeffizienten zweier normalverteilter Zufallsvariablen: Müsste da nicht sowas wie unter Annahme einer bivariaten Normalverteilung stehen? Es klingt so, als ob Zufallsvariablen getestet werden.
Zweistichproben t-Test
BearbeitenZitat: "Der Zweistichproben t-Test prüft anhand der Mittelwerte zweier Stichproben, ob die Erwartungswerte zweier Grundgesamtheiten gleich, kleiner oder größer sind."
Kleiner oder größer als was frage ich mich da. Es muss doch wohl heißen "gleich oder ungleich" oder? Denn es werden ja die Erwartungswerte untereinander in Beziehung gesetzt. Nelte --83.64.176.131 15:47, 27. Sep. 2010 (CEST)
- Nein, das ist schon OK. Bei den Kompaktdarstellungen (z.B. T-Test#Kompaktdarstellung) kann man die drei Hypothesenpaare sehen:
- (größer)
- (ungleich)
- (kleiner)
- --Sigbert 17:38, 27. Sep. 2010 (CEST)
Zweistichproben t-Test
Bearbeitenzitat:
Beispiel 1
BearbeitenDer letzte Satz stört mich etwas. Die Akkus erreichen also nicht die behaupteten Laufzeiten. unter der Nullhypothese Akku hält mindestens 3.5 Stunden. Wir haben also eine einseitigen T-test, ist das richtig? (nicht signierter Beitrag von Muchajoe (Diskussion | Beiträge) 17:43, 10. Dez. 2010 (CET))
- Ja, es handelt sich um einseitige Tests.
- Wenn ich zeigen will, dass die mittlere Akkulaufzeit mindestens 3,5 Stunden ist (Herstellerangabe stimmt), dann wären die Hypothesen
- a) Std. vs. Std.
- Wenn ich zeigen will, dass die mittlere Akkulaufzeit weniger als 3,5 Stunden ist (Herstellerangabe stimmt nicht), dann wären die Hypothesen
- b) Std. vs. Std.
- Bei einem Stichprobenmittelwert muss man im Fall a) die Nullhypothese und im Fall b) die Alternativhypothese annehmen. --Sigbert 22:21, 10. Dez. 2010 (CET)
Ablehnungsbereich falsch definiert?
BearbeitenBei der Tabelle http://de.wikipedia.org/wiki/T-Test#Kompaktdarstellung in der letzten Zeile wurden eckige Klammern jeweils beim kritischen Wert gemacht. Dies ist aber falsch meiner Meinung nach, da der kritische Wert noch zum Beibehaltungsbereich gehört. Es müssten jeweils an beiden Seiten runde Klammern sein. -- Uboot85 16:29, 22. Feb. 2011 (CET)
- Korrekt, korrigiert. --Sigbert 19:08, 22. Feb. 2011 (CET)
- Konsekwent, aber ich habe immer unterrichtet dass der kritische Wert zum kritischen bereich gehoert. D.h. wenn eine Pruefgroesse der kritische Wert erreicht, ist ausreichend Beweis gegen H0 anwesend, und wird H0 abgelehnt. Wichtig ist dies nur bei diskrete Verteilungen der Pruefgroesse. Ich werde das noch weiter untersuchen. Nijdam 23:30, 22. Feb. 2011 (CET)
- Muss ich Nijdam beipflichten. Gruß--Philipendula 21:15, 23. Feb. 2011 (CET)
- Also, vor der Korrektur habe ich im Rinne Taschenbuch der Statistik nachgeschlagen und da steht der Ablehnungsbereich des T-Tests auch mit runden Klammern; also der kritische Wert gehört nicht dazu. Und so unterrichte ich es (bisher) auch :) Gruss --Sigbert 10:40, 24. Feb. 2011 (CET)
- Noch ein Link: http://web.neuestatistik.de/inhalte_web/content/MOD_32593/html/comp_32647.html (2. Definition) --Sigbert 20:42, 24. Feb. 2011 (CET)
- Ist es so?: Bei Statistiken mit stetiger Verteilung ist es mathematisch schnuppe, wenn man in dem Sinne ausschoepfen mochte, das zu vorgegebenen der Ablehnbereich moeglichst gross ist (optimaler kritischer Bereich), lehnt man bei die Nullhypothese ab. Bei Statistiken mit diskreter Verteilung kann man moeglicherweise nicht ausschoepfen und braucht einen randomisierter Test. --Erzbischof 18:01, 25. Feb. 2011 (CET)
- Es ging ja auch um den Begriff "Kritischer Wert". Da muss man wohl auch wieder zwischen diskret und stetig unterscheiden. Bei diskreten Prüfgrößen wird in der Regel der erste Wert im Ablehnungsbereich als kritischer Wert bezeichnet. Bei stetigen Variablen müsste es vom Modell her gleichgültig sein, ob der kritische Wert zum Nichtablehnungsbereich oder Ablehnungsbereich gehört. Meistens wird der aber in der Literatur zum Nichtablehnungsbereich zugeschlagen, wohl auch im Sinne der Kleinhaltung des Ablehnungsbereichs. Habe es aber auch schon anders gefunden. In diesem Sinne ist ja auch die letzte Änderung ok. --Philipendula 20:37, 25. Feb. 2011 (CET)
- Ist es so?: Bei Statistiken mit stetiger Verteilung ist es mathematisch schnuppe, wenn man in dem Sinne ausschoepfen mochte, das zu vorgegebenen der Ablehnbereich moeglichst gross ist (optimaler kritischer Bereich), lehnt man bei die Nullhypothese ab. Bei Statistiken mit diskreter Verteilung kann man moeglicherweise nicht ausschoepfen und braucht einen randomisierter Test. --Erzbischof 18:01, 25. Feb. 2011 (CET)
- Muss ich Nijdam beipflichten. Gruß--Philipendula 21:15, 23. Feb. 2011 (CET)
- Konsekwent, aber ich habe immer unterrichtet dass der kritische Wert zum kritischen bereich gehoert. D.h. wenn eine Pruefgroesse der kritische Wert erreicht, ist ausreichend Beweis gegen H0 anwesend, und wird H0 abgelehnt. Wichtig ist dies nur bei diskrete Verteilungen der Pruefgroesse. Ich werde das noch weiter untersuchen. Nijdam 23:30, 22. Feb. 2011 (CET)
- Es ist natuerlich nur ein Problem der Definierung, aber es kommt mir logisch vor den Kritischen Wert als gehoerend zum Kritischen Bereich anzumerken. Notwendig ist es nicht. Jedenfalls stimmt das nicht ueberein mit der erwaehnten Definitionen. Nijdam 21:10, 25. Feb. 2011 (CET)
- Mathematisch scheint es mir auch egal, zu welchen Bereich man den kritischen Wert zuschlaegt; aus didaktischen Gruenden (gleiche Behandlung von diskreten und stetigen Teststatistiken) wuerde ich ihn jedoch dem Nichtablehnungsbereich zuschlagen. --Sigbert 10:17, 28. Feb. 2011 (CET)
- Es ist natuerlich nur ein Problem der Definierung, aber es kommt mir logisch vor den Kritischen Wert als gehoerend zum Kritischen Bereich anzumerken. Notwendig ist es nicht. Jedenfalls stimmt das nicht ueberein mit der erwaehnten Definitionen. Nijdam 21:10, 25. Feb. 2011 (CET)
Grundidee für den t-Test über den Erwartungswert einer beliebig verteilten Grundgesamtheit
BearbeitenWarum steht dort (n>30)? Das erscheint mir doch sehr willkürlich. Notwendig ist noch nur n>1 oder? -- 85.180.78.199 10:41, 22. Mär. 2011 (CET)
- Bei n > 30 ist die Prüfgröße annähernd normalverteilt. --Philipendula 13:09, 22. Mär. 2011 (CET)
Ihr könntet mal die Texte so schreiben, dass man versteht was Phase ist. Ob ich den Wiki-Artikel lese oder ein mathematisches Fachbuch zur Hand nehme, macht echt kein Unterschied. Reine Zeitverschwendung hier. (nicht signierter Beitrag von 195.37.229.10 (Diskussion) 14:32, 5. Sep. 2011 (CEST))
Nix verstanden
BearbeitenIhr könntet mal die Texte so schreiben, dass man versteht was Phase ist. Ob ich den Wiki-Artikel lese oder ein mathematisches Fachbuch zur Hand nehme, macht echt kein Unterschied. Reine Zeitverschwendung hier. (nicht signierter Beitrag von 195.37.229.10 (Diskussion) 14:32, 5. Sep. 2011 (CEST))
- Der Kommentar ist nicht sehr hilfreich. Ich kann mir nicht vorstellen, dass der gesamte Text unverständlich ist. --Sigbert 11:30, 11. Sep. 2011 (CEST)
beispiel 2
BearbeitenIch komme auf ein t von 1,63805 anstelle eures 1,6385 !!! Falls ich richtig liegen sollte, kontrolliert doch bitte eure angaben auf korrektheit! Auch meinem vorredner kann ich zustimmen... sehr mathematisch geschrieben, nix für laien.... ihr solltet echt mal gucken dass ihr den allgemeinheits-anspruch nicht vergesst - klar soll es fachlich richtig sein, aber eben auch
allgemeinverständlich. den beitrag mit dem neurophysiologischen beispiel solltet ihr WIRKLICH als weckruf auffassen und nicht nur ignorieren! (nicht signierter Beitrag von 213.214.16.8 (Diskussion) 09:52, 9. Sep. 2011 (CEST))
- Habe für den Einstichproben-Fall versucht, den Test ohne Formeln zu erklären. Ich würde allerdings gerne ein Feedback haben, da mich das Ganze 2 Stunden gekostet hat. --Sigbert 10:37, 11. Sep. 2011 (CEST)
- Ich habe einiges ein bisschen umformuliert. Jedoch ist das Bild problematisch.
- Ich habe die Daten mit einem Dotplot auseinandergezogen, da es sonst zu einem Overplotting kommen würde. Ich wollte für das Bild so "reale" Daten wie möglich haben. Die Frage ist, ob die Grafik unverständlich ist? --Sigbert 07:21, 12. Sep. 2011 (CEST)
- Einigermassen unverstnaendlich fuer mich schon, weil etwas anders gezeigt wird als genmeint. Vielleicht ziehst du Grundgesamtheit und Stichprobe auseinander:
- Grundgesamtheit (unbekannt)
- −−−−−o−−−o−−−o−−o−−o−−o−o−o−−oo|ooooo−o−o−o−o−−o−−o−−o−−o−−−o−−−o−−−o−−−−−
- −−−−−o−−−o−−−o−−o−−o−−o−o−o−−oo|ooooo−o−o−o−o−−o−−o−−o−−o−−−o−−−o−−−o−−−−−
- Stichprobe
- −−−−−−−−−−−−−−−−−−x−−−−x−−−−x|−x−|−−−x−−−x−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- −−−−−−−−−−−−−−−−−−x−−−−x−−−−x|−x−|−−−x−−−x−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Nijdam 10:38, 12. Sep. 2011 (CEST)
- Habe die Grafik nach deinem Vorschlag umgestaltet und den Text angepasst. Noch eine Anmerkung: Jemand hat die mathematische Formulierung der Hypothesen hervorgehoben, es geht aber nicht um die mathematische Formulierung, sondern um das Verständnis wie der Test funktioniert. Deswegen wieder Rückbau :) --Sigbert 19:55, 12. Sep. 2011 (CEST)
Ich aendere den Text auch noch, weil es eigentlich die Alternativhypothese ist die man "beweisen" moechte. Und auch handelt es sich eigentlich um eine Normalverteilung. Nijdam 20:22, 12. Sep. 2011 (CEST)
Was erklaert wird ist nicht spezifisch fuer den t-Test, sondern trifft auch auf z.B den Gauss-Test zu, und eigentlich allgemein auf den Testverfahren, Nijdam 20:47, 12. Sep. 2011 (CEST)
- Der t-Test kann auch für nicht normal verteilte Grundgesamtheiten (wg. Zentralen Grenzwertsatz) angewandt werden. --Sigbert 21:00, 12. Sep. 2011 (CEST)
Nur annaehernd. 22:58, 12. Sep. 2011 (CEST)
- Die Ungenauigkeit nehme ich gerne zugunsten der Verständlichkeit in Kauf :) Ich gebe dir recht, mit dem was du unter Was erklaert .... sagst. Das liegt aber an der Struktur der Artikel zu Mittelwerttests. Es ist unklar, warum der Einstichproben- und der Zwei-Stichproben t-Test hier behandelt werden während Steiger's z-Test hier nicht behandelt wird. So wie die Seite anfängt, würde ich hier eine Verzweigung zu den einzelnen Tests erwarten. Der Einstichproben t-Test und der Zwei-Stichproben t-Test könnten ausgelagert werden und desweiteren eine neue Seite angelegt werden: Test auf Mittelwert, wo u.a. die Erklärung reinkommt. --Sigbert 13:49, 13. Sep. 2011 (CEST)
Ich traue mich, als nicht Muttersprachliche, nicht das zu schreiben, aber der Abschnitt:
- Die vorhergehende Argumentation hängt wesentlich davon ab, dass der Abstand der Mittelwerte der Stichprobe und der Grundgesamtheit μ klein ist. Der Abstand wird um so kleiner sein
- je größer der Stichprobenumfang ist bzw.
- je kleiner die Streuung der Daten der Grundgesamtheit ist.
muss anders formuliert werden. Es geht darum das die ernannte Abstaende klein sein im Vergleich zum Standardabweichung (Streuung). Deshalb auch die form der Testgroesse. Nijdam 10:42, 14. Sep. 2011 (CEST)
- Wenn es um den Abstand zwischen und geht, wäre ja vor allem folgendes wichtig: Er muss klein sein im Vergleich zu , um eine mögliche Abweichung zwischen und überhaupt aufzudecken zu können. Aber ich weiß nicht, ob das alles an dieser Stelle, die ja eine Erklärung für "Laien" sein soll, nicht eine zu komplizierte Ecke wird. Denn wir diskutieren ja eigentlich gerade darüber, wovon die Güte des Test abhängt und das wird ja (leider!) noch nicht mal im mathematischen Teil angesprochen. Bei der Konstruktion des Tests selber hat man doch erstmal nur den Fall der Nullhypothese im Auge und wählt den Ablehnungsbereich so, dass man sie nicht "aus Versehen" ablehnt. D.h. man geht sowieso vom Fall aus. -- HilberTraum 14:24, 14. Sep. 2011 (CEST)
- Du hast recht, ich nehme es raus, es hat hier nichts zu suchen. --Sigbert 22:49, 14. Sep. 2011 (CEST)
Rechtschreibung
BearbeitenMir sind einige grammatikalische Fehler aufgefallen, etwa: "Der []Test prüft [], ob der Mittelwert der Grundgesamtheit verschieden ist von eine bestimmte, unterstellte Zahl." Der Artikel sollte somit nochmal auf Fehler überprüft werden. -- Icke (nicht signierter Beitrag von 134.176.31.35 (Diskussion) 14:35, 13. Sep. 2011 (CEST))
Beispiel 1, einseitig: Frage
BearbeitenHat das einen besonderen Grund, dass bei Beispiel 1 die Richtung des einseitigen Tests jetzt genau anders herum ist? Ich fand es vorher sinnvoller: Bei einem Stichprobenmittel von 3,25 weiß man auch ohne komplizierten Test, dass man damit nicht beweisen kann, dass gilt. Interessant ist nur, ob die Abweichung nach unten signifikant ist. -- HilberTraum 09:56, 15. Sep. 2011 (CEST)
- Ich habe die Testhypothesen nur an den vorhandenen Text angepasst. Wenn du die Hypothesen umdrehen willst dann mach das :) --Sigbert 05:55, 16. Sep. 2011 (CEST)
Zweistichproben-t-Test
Bearbeitenich habe mal den Text und die Grafik aus der Einführung des Einstichproben-t-Test übernommen und angepasst. Ich frage mich, ob man noch eine zweite Grafik machen sollte in der ist? --Sigbert 07:34, 16. Sep. 2011 (CEST)
Rückführung des Zweistichproben-t-Test auf den Einstichproben-t-Test
BearbeitenIch verstehe ueberhaupt nicht was dieser Abschnitt bedeuten moechte. Da wird nichts ruekhgefuehrt, und auch sonst kann man nichts daraus lernen, was nicht schon im Artuikel steht.Nijdam 22:25, 16. Sep. 2011 (CEST)
- Dann ändere den Titel, wenn er dir nicht gefällt. Rauswerfen würde ich den Abschnitt nicht, denn da stehen da die allgemeinen Hypothesen drin und die Transformation der Teststatistik zu , so dass aus dem Zweistichproben-t-Test ein Einstichproben-t-Test bzgl. D wird. --Sigbert 07:47, 17. Sep. 2011 (CEST)
Es gibt in dem Abschnitt wenig Sinnvolles. Es stimmt auch nicht dass der Zweistichproben-t-Test auf einen Einstichproben-t-Test zurueckzufuehren ist. Wie mache ich aus die zwei Stichproben X1...Xm,Y1...Yn von unabhaengige Variablen eine Stichprobe??? Das Problem mit gepaarte Stichproben betrifft wieder keinen Zweistichproben-t-Test. Usw. Nijdam 19:46, 18. Sep. 2011 (CEST)
- Habe den Titel selbst schon geändert. Da stand nichts von Rückführung, mein Fehler. --Sigbert 22:31, 18. Sep. 2011 (CEST)
Ich habe den Abschnitt geaendert, so wie er vermutlich gemeint sei. Nijdam 22:38, 18. Sep. 2011 (CEST)
Unklarheiten im Zwei-Stichproben-t-Test
BearbeitenVorweg: Es kann sein, dass ich etwas übersehen habe, denn ich habe nicht den ganzen Artikel durchgelesen, sondern bin zu dem Abschnitt gesprungen, der mich interessiert, und habe dann nur scrollenderweise nach den Formelzeichen gesucht, die ich nicht verstanden habe. Andererseits könnte es aber auch eine Anregung für die Autoren sein, zu berücksichtigen, dass vermutlich kaum jemand diesen Artikel von vorne bis hinten durchackern wird. Etwas Redundanz wäre daher vielleicht nicht nur erlaubt, sondern sogar sinnvoll.
Jetzt zu meinen Hinweisen / Fragen:
1. Im Abschnitt "Teststatistik des Zweistichproben-t-Tests" taucht mehrfach das Zeichen [omega null] auf. Mir scheint, dass das nirgends eingeführt wird, oder?
2. Ich bekomme die zweimal (warum eigentlich?) angegebene Formel für t bzw. T (wieder: Warum die Unterscheidung?), also die Formel t = (x quer - y quer - omega null)/S Wurzel (1/m +1/n), nicht mit der Anwendung im Beispiel 2 zusammen. Dort wird offensichtlich die Formel für den Prüfwert in der Kompaktdarstellung verwendet, allerdings ohne das ominöse omega null. Konrad Lehmann 15:34, 19. Sep. 2011 (CEST)
- zu 1) ist eine beliebige Zahl. Deine Nullhypothese ist nun, dass der Abstand zwischen und genau ist. In den meisten Fällen ist . In diesen Fällen wäre also die Nullhypothese, dass der Abstand zwischen und gleich Null ist. Das heißt also, die Nullhypothese wäre . Aber der Anwender kann auch jede beliebigen anderen Abstand für die Nullhypothese nehmen.
- zu 2) Das ominöse ist im Beispiel Null. In den meisten Anwendungen gilt: .
- Der Unterschied zwischen t und T ist der folgende: T ist die Realität und t ist das, was du misst. Diese Unterscheidung ist wichtig, da über diese Unterscheidung ja die p-Werte erklärt werden. Du willst zum Beispiel wissen, ob und identisch sind. Aber du kannst nur und messen und stellst fest, diese beiden Werte unterscheiden sich. Wenn sich und unterscheiden, unterscheiden sich dann auch und ? Um diese Frage zu beantworten, muss ein t-Test durchgeführt werden. --Eulenspiegel1 02:19, 20. Sep. 2011 (CEST)
- Die letzte Bemerkung ueber die Unterschied zwischen und usw. ist leider nicht richtig. T ist eine Zufallsvariable, also mit eine Verteilung, t ist eine Auspraegung von T, dh, wenn man eine Observation (Messung) macht, und das Ergebnis sei ω, werden die Zufalsvariablen die Werte (Auspraegungen) aufweisen. Folglich weist T den Wert t=T(ω) auf. t ist die Zahl als Resultat der Messung von T. Gleicherweis ist die Auspraegung von , also . Und analog fuer . Es geht also um die Unterschied zwischen Funktion (zB T, oder ) und Funktionswert (t, oder ). Was man wissen moechte ist ob vielleicht die Mittelwerte der Grundgesamtheite und unterschiedlich sind. Diese Mittelwwerte sind ganz andere Groesse als die Mittelwerte der Stichproben. Es sind die Erwartungswerte der Zufallsvariablen, und deshalb Parametern der Verteilung.Nijdam 08:58, 20. Sep. 2011 (CEST)
Danke Euch beiden für die prompte, hilfreiche Erläuterung. Trotzdem bleibt der zweite Punkt noch ungeklärt: In der Erklärung im Text ("Teststatistik des Zweistichproben-t-Tests") wird eine Formel für den Prüfwert t vorgestellt, die dann im Beispiel nicht verwendet wird. Da wird stattdessen die Formel für v (vermutlich eher ein ) aus der Tabelle benutzt. Das erscheint mir unklar.
Und: Taucht vorher im Text mal auf? Sollte man seine Bedeutung nicht an geeigneter Stelle erklären? Konrad Lehmann 14:18, 20. Sep. 2011 (CEST)
- Inzwischen taucht auf :) Leider ist die Notation im Artikel uneinheitlich, da verschiedene Autoren dazu beigetragen haben. Das sollte mal vereinheitlicht werden ... --Sigbert 06:42, 21. Sep. 2011 (CEST)
- Ich hab mal die Notationen und Formelschreibweisen etwas vereinheitlicht, jetzt sollte (hoffentlich) das meiste konsistent sein. -- HilberTraum 13:07, 21. Sep. 2011 (CEST)
Restrukturierung
BearbeitenIch schlage folgende Umbau der Seite vor:
- Einstichproben-t-Test und Zweistichproben-t-Test werden ausgelagert auf eigene Seiten
- Die Seite t-Test bekommt mehr den Charakter einer Aufzählung verschiedener T-Tests
- Eine weitere Seite Test auf Mittelwert beschreibt überblicksartig alle Tests auf Mittelwerte bzw. Median
Begründung: Zum einen wird die Seite meist eher unter dem interessierenden Teilaspekt gelesen (siehe Kommentar im vorherigen Abschnitt). Zum anderen finde ich die Behandlung verwandter Tests (Einstichproben-t-Test und Zweistichproben-t-Test) auf einer Seite nicht sinnvoll. Warum wird z.B. die ANOVA hier nicht auch behandelt? --Sigbert 07:08, 21. Sep. 2011 (CEST)
- So eine Aufteilung von t-Test halte ich für eine gute Idee, denn langsam wird der Artikel ziemlich unübersichtlich (und es fehlen ja noch Dinge wie Gütefunktion/Wahl der Stichprobengröße ...). Eine Seite Test auf Mittelwert wie vorgeschlagen stelle mir allerdings etwas schwierig vor: Dort müssten dann so unterschiedliche Sachen wie ANOVA, Wilcoxon-Test, Vorzeichentests usw. besprochen und verglichen werden. -- HilberTraum 13:44, 21. Sep. 2011 (CEST)
- Man muss ja nicht mit dem schwierigsten anfangen (Test auf Mittelwert), aber ein Grundlage habe ich ja schon Benutzer:Sigbert/Liste_statistischer_Tests und wir haben ja auch einen umfangreichen Entscheidungsbaum in Posterform (aus Signifikanztest). --Sigbert 20:33, 21. Sep. 2011 (CEST)
- Oha, das pdf sieht etwas heftig aus, aber deine Liste ist sicher eine schöne Grundlage für so einen Artikel. Nur mit dem Lemma müsste man nochmal überlegen: Meinem Sprachgefühl nach geht "Test auf XY" nur, wenn getestet wird, ob XY vorliegt oder nicht. Aber Test auf Lageparameterunterschiede ist schon sehr sperrig. -- HilberTraum 17:31, 22. Sep. 2011 (CEST)
- Man muss ja nicht mit dem schwierigsten anfangen (Test auf Mittelwert), aber ein Grundlage habe ich ja schon Benutzer:Sigbert/Liste_statistischer_Tests und wir haben ja auch einen umfangreichen Entscheidungsbaum in Posterform (aus Signifikanztest). --Sigbert 20:33, 21. Sep. 2011 (CEST)
Habe die Auslagerung beantragt: Wikipedia:Importwünsche/Importupload#Import_von_de:t-Test_nach_Benutzer:sigbert.2FEinstichproben-t-Test und Wikipedia:Importwünsche/Importupload#Import_von_de:t-Test_nach_Benutzer:sigbert.2FZweistichproben-t-Test. --Sigbert 16:39, 23. Sep. 2011 (CEST)
t-Test Default Beschreiben
BearbeitenDER "t-Test" ist der Zweistichproben-t-Test, und sollte in diesem Artikel beschrieben werden. Es gibt weitere t-Tests, auf die man unbedingt weiterhin hinweisen sollte. Man sollte hier aber auf keinen Fall so tun, als gäbe es keinen Default in der üblichen statistischen Sprache. Wenn in einer naturwissenschaftlichen Publikation t angegeben ist ohne weitere Erläuterungen (dependent, one-sample), dann ist es immer der 2-Stichproben-t-Test (ich kann das nur für mehrere tausend wissenschaftliche Artikel, mehrer Dutzen Statistik-Bücher und ca. 1 Dutzend Statistikprogramme aussagen, aber immerhin. Doppelter t-Test oder Zweistichprobent-test oder two-sample-t habe ich noch in keiner Publikation gelesen).
Weitere Punkte: So wie der Z-Test hier angehängt ist, macht er keinen Sinn, das sucht kein Mensch unter t-Test.
- Welch-Test heisst alternativ t-Test für unterschiedliche Varianzen. Satterthwaite habe ich noch nicht gelesen (obwohl ich hier belesen bin, s.o).
- Es gibt hier keinen Bezug zur Anova. Man sollte m.E. unbedingt sagen, dass t der einfachste Fall von einfaktorieller Anova ist. (By the way: hier erkennt man, warum t immer der Zweistichproben-t-Test ist, WEIL er eine Anova für 2 MW ist).
- Es gibt den t-Test als multiplen Test bei vielen Statistikprogrammen als post-hoc-Test-Variante. Ist nicht Bonferroni-korrigiert, aber eine Einsatzweise, die man in dieser Aufstellung auch einen Absatz lang erläutern sollte.
- Da ich Statistikkurse geben, verstehe ich, was die Autoren sagen wollen, aber Leute, die hier nachschauen, verstehen nicht, was hier gemeinst ist. Z.B. ist in der Tat Normalverteilung Voraussetzung, oder eine hohe n-Zahl wegen dem zentralen Grenzwertsatz. Gerade über letzteres gibt es Meinungsverschiedenheiten (also: ab welchem n, liegt meines Wissens zwischen 10 und 30, je nach Autor; man sollte hier zumindest ein leeres=ortes Link reintun, aber ich denke, dass diese Zahl nicht für alle Tests gleich ist, man sollte sie also für t beschreiben inkl. Literaturangaben, das würde wirklich weiterhelfen). Das Konzept, d.h. was damit gemeint ist, wird dem interessierten Laien nicht klar.
Also: eigentlich eine schöne, übersichtliche Aufstellung, abgerundet durch eine nette Geschichte. Man sollte sie aber näher an Statistikbücher bzw. übliche Anwendungssprache bringen. PPilz (Diskussion) 16:05, 1. Apr. 2015 (CEST)
- Sorry, aber für mich ist DER t-Test ist der Einstichproben t-test, genauer der Welch-Test (soviel zum Default).
- Satterthwaite habe ich auch schon gelesen.
- ANOVA hat ein F-verteilte Teststatistik, deswegen gehört sie erstmal nicht hierher; allerdings wäre es sinnvoll, wenn es irgendwo eine Übersicht der Tests gäbe
- Der t-Test als Post-Hoc Test anders als der Zweistichproben t-test (die Varianzen werden aus allen Gruppen geschätzt)
- --Sigbert (Diskussion) 09:03, 12. Dez. 2016 (CET)
- Zu 1.: Aber der Welch-Test ist doch ein Zweistichproben-t-Test, dann wäre doch der der Default, oder? -- HilberTraum (d, m) 20:19, 12. Dez. 2016 (CET)
Undurchsichtige Diskussionsseite
BearbeitenDie Diskussionsseite ist schwer zu durchschauen, da Teile des Artikels t-Test in neue Artikel ausgelagert wurden, aber die entsprechenden Diskussionen nicht mitgeführt wurden. Nach einer Durchschau der oben stehenden Diskussionbeiträge sieht es für mich so aus, dass sich alle oben stehenden Diskussionspunkte nicht auf die Seite in der jetzigen Form beziehen. --Sigma^2 (Diskussion) 20:53, 23. Aug. 2021 (CEST)
Zum aktuellen (August 2021) Artikel t-Test
BearbeitenBetrifft "Satterthwaite-Test":
1. Ich habe "Satterthwaite-Test" für den Welch-Test noch nie gelesen - und lese seit langem Statistik-Literatur. Es ist aber denkbar, dass im Rahmen neuerer Untersuchungen Satterthwaite aus Prioritäsgründen in einigen Quellen (welchen?) eine Mitbegründerrolle für den Welch-Test zugesprochen wird.
2. Mit Sicherheit wurde allerdings der falsche Satterthwaite zugeordnet. Es gibt die Welch-Satterthwaite-Gleichung (https://en.wikipedia.org/wiki/Welch%E2%80%93Satterthwaite_equation), die auf B.L. Welch (1947) und F.E. Satterthwaite (1946) zurückgeht und die dem Welch-Test zugrundeliegende Abschätzung des Parameters einer Chi-Quadrat-Verteilung betrifft, falls die Varianzen verschieden sind. Dieser F.E. Satterthwaite aber ist n i c h t mit dem Ökonomen Marc Satterthwaite identisch. Außerdem findet sich auf der Seite (https://en.wikipedia.org/wiki/Mark_Satterthwaite), auf die verwiesen wird, keinerlei Hinweis auf statistische Tests. --Sigma^2 (Diskussion) 21:54, 23. Aug. 2021 (CEST)