Diskussion:Wilcoxon-Vorzeichen-Rang-Test

Die Ergebnisse in der Tabelle sind so eindeutig, daß keinerlei statistisches Prüfverfahren nötig ist, um sie auszuwerten. Ein Blinder sieht, was die Kühe lieber fressen ;-) Wäre es nicht sinnvoller, das Beispiel so zu gestalten, daß die Überlegenheit des Prüfverfahrens über das bloße Auge einsichtig wird? --Sigune 16:18, 26. Jun 2006 (CEST)

Ja, schon :-) könnte es mal ändern. --Keimzelle talk 20:21, 26. Jun 2006 (CEST)

Werte - Differenz - (?) - Rang

Bearbeiten

Leider erschliesst es sich dem Leser nicht so ganz, wie man von der Differenz auf den Rang kommt - man erfährt lediglich, dass einem Wert ein vom Betrag abhängiger Rang zugeordet wird. Den Teil zur Ermittlung des Ranges bzw. von T+ versteht man also nur, wenn man sich mit dem Inhalt des Artikels sowieso schon auskennt - diese Konstellation würde Wikipedia aber total überflüsig machen. Bitte etwas neulingsfreundlicher, auch Nichtstatistiker müssen/wollen sich einen Einblick verschaffen - Vielen Dank!

Ich dachte, das wurde genug deutlich erklärt. Die grösste Differenz (ohne Berücksichtigung des Vorzeichens) erhält den höchsten Rang... und dann kann man entweder die Ränge der positiven Differenzen oder der negativen Differenzen zum Tplus oder zum Tminus zusammenzählen.--Keimzelle talk 17:17, 6. Dez. 2006 (CET)Beantworten

Das Beispiel ist falsch berechnet

Bearbeiten

Wenn T die Rangsumme sein soll, so fehlt ein Wert (2). In der Berechnung von z ist die Stichprobengröße (N = 6) zwar richtig mit einbezogen worden, allerdings wurde mit der falschen Rangsumme weitergerechnet. Richtig wäre eine Rangsumme von T=21, so dass man einen Z-Wert von 2,20139816 erhält.

Nein, denn man rechnet für T+ nur diejenigen Ränge zusammen, deren Differenz ein positives Vorzeichen haben; daher wird der 2er von "-1" nicht mitgezählt. In Bärlocher, Biostatistik steht das ganze auch ein wenig anders, da bekommen die Ränge das Vorzeichen der Differenz; nachdem ich mit der Rechnung hier ganz glücklich war, weiß ich nun aber auch nicht mehr weiter. Ich finde den Einwand oben berechtigt, ein enzyklopädischer Artikel muss besser verständlich sein. Sebastian 17:19, 12. Nov. 2008 (CET)Beantworten


Woher kommt die Formel für Erwartungswert und Varianz bei der Approximation mit Normalverteilung

Bearbeiten

anderer Anmerker: Ich versteh nicht woher in der Formel zum z die 4 ( im Zähler) und die 24 ( im Nenner ) kommen.

meine Frage: wie kommst du in der Formel für z auf den Erwartungswert N*(n+1)/4 und die Standardabweichung(N*(N+1)(2N+1)/24? (nicht signierter Beitrag von 78.53.202.158 (Diskussion | Beiträge) 11:52, 24. Jan. 2010 (CET)) Beantworten

Die Summe der Ränge von 1 bis n ist gerade  . Unter Gültigkeit der Nullhypothese muss   gelten, d.h. für   folgt  . Für die Varianz kann man das bestimmt analog ableiten. --Sigbert 13:57, 12. Feb. 2011 (CET)Beantworten

Vergleich mit Vorzeichentest nicht schlüssig?

Bearbeiten

Hypothese H0: Kühe bevorzugen Heu und Stroh gleich häufig, also p=0,5 (p=wahrscheinlichkeit) Gegenhypothese H1= Kühe bevorzugen Heu und Stoh nicht gleich häufig, also p != 0,5 (ungleich)

Beim Vorzeichentest kann bei dieser geringen Stichprobenanzahl ja nicht mit einer Normalverteilung approximiert werden. Also kommt eine Binominalverteilung mit Erwartungswert=p*n=0,5*n und Varianz=n*p*(1-p)=0,25*n zum Einsatz.

Das macht dann laut Vertafelung der Verteilungsfunktion der Binominalfunktion (n=6, k=5) eine Wahrscheinlichkeit von 98,44%, dass 5 oder weniger Kühe Stoh bevorzugen.

Das implizite Signifikanzniveau liegt damit bei (1-0,9844)*2, da es ein zweiseitiger Test ist, was 3,12% entspricht.

Damit kann zu Alpha=5% die Nullhypothese abgelehnt werden, dass Heu und Stoh gleich wahrscheinlich sind.

Beide Tests (Vorzeichen und Wilcoxon) kommen danach meiner Ansicht in nach in diesem Beispiel zum selben Ergebnis (trotz der geringen Stichprobe). Was soll dieser Paragraph also aussagen? Verstehe ihn nicht ganz. (nicht signierter Beitrag von 78.53.202.158 (Diskussion | Beiträge) 11:52, 24. Jan. 2010 (CET)) Beantworten

  • Das Beispiel ist generell sehr unglücklich gewählt. Durch die Anpassung an die Notation im theoretischen Teil und Überarbeitung zeigt sich z.B. dass die Nullhypothesen nicht abgelehnt werden können. Besser wäre ein Beispiel in dem die Nullhypothese sowohl im zwei- als auch in einem einseitigen Test abgelehnt wird.
  • Die Stärke des Wilcoxon-Vorzeichen-Rang-Test liegt ja darin, dass durch die Ränge der Differenzen auch indirekt die Größe der Differenzen berücksichtigt werden. In dem Beispiel gibt es jedoch überhaupt nur sechs mögliche Differenzen: -5, -3, -1, +1, +3 und +5 (und damit auch nur sechs mögliche Rangwerte). Beim Vorzeichentest werden nur die Vorzeichen der Differenzen berücksichtigt: -1 bei negativem Vorzeichen und +1 bei positiven Vorzeichen. Um einen Unterschied zwischen den beiden Tests zu erhalten, wäre es besser die Differenz von zwei stetigen Variablen (statt wie im Beispiel von zwei diskreten Variablen) zu betrachten.
  • Bei nur sechs Beobachtungen gibt es nur ein Signifikanzniveau in der Tabelle bei dem die Ablehnung der Nullhypothese möglich ist. Denn ein kritischer Wert von 0 kann nicht mehr unterschritten werden, d.h. die Nullhypothese kann nicht mehr abgelehnt werden; es spielt also keine Rolle, wo sich die Rinder befunden haben. Deswegen wird im Bortz vermutlich auch ein Beispiel mit n=8 durchgerechnet.
Grüsse --Sigbert 18:25, 12. Feb. 2011 (CET)Beantworten

Beispiel einseitig oder zweiseitig?

Bearbeiten

Hallo,

wenn ich es richtig verstehe, dann stellt dein landwirtschaftliches Beispiel einen einseitigen Test dar (hypothese Heu > Stroh), richtig? Ich krieg nicht ganz voreinander, welche Auswirkungen es auf das Testverfahren hat, ob ich zweiseitig (besteht ein signifikanter Unterschied zwischen Stroh und Heu?) oder einseitig testen möchte.

In meinem konkreten Fall geht es darum, Daten zur Grundwasserneubildung heute und unter dem Einfluss des Klimawandels auf Unterschiede zu testen. Dabei interessiert uns zum einen darum, zu testen ob überhaupt ein Unterschied besteht. Zum anderen wollen wir aber natürlich auch wissen, in welche Richtung dieser Unterschied ggf. signifikant wäre.

Vielleicht kannst du ja bei Gelegenheit mal Stellung nehmen?

-- Geosusi 12:32, 10. Feb. 2011 (CET)Beantworten

Beim zweiseitigen Test, wie im Beispiel, führen zu grosse positive kleine Werte der Teststatistik W zur Ablehnung der Nullhypothese. Bei einem einseitigen Test müsste die Teststatistik W gleich   oder   sein, je nachdem welches einseitige Hypothesenpaar man wählt. --Sigbert 13:49, 12. Feb. 2011 (CET)Beantworten

Schwer verständlich

Bearbeiten

Ohne weiteres, mathematisches Vorwissen ist dieser Artikel nur sehr schwer zu erfassen. Es fehlt eine weitesgehend ohne mathematische Fachbegriffe auskommende allgemeine Beschreibung/Erläuterung/Einleitung. (nicht signierter Beitrag von 90.186.4.127 (Diskussion) 18:11, 16. Okt. 2011 (CEST)) Beantworten

Warum unterscheided sich die Erklärung inhaltlich vond er Englischen Version? Welche ist richtig?

Bearbeiten

In der Englischen version wird nur eine Teststatistik berechnet, und zwar als summe aller Ränge, wobei jeder Rang mit dem Vorzeichen der zugehörigen Differenz multipliziert wird.

Hier werden die positiven addiert, unabhängig davon die negativeen, dann nimm den kleineren Wert der beiden.

Beide Verfahren unter dem selben Namen.... (nicht signierter Beitrag von 37.49.102.13 (Diskussion) 20:10, 20. Feb. 2013 (CET))Beantworten

Teststatistik, ungeklärter Faktor I?

Bearbeiten

In der Teststistik wird das in der summe verwendete I nicht erklärt/eingführt. Was ist das für ein Faktor? --141.20.21.97 12:59, 29. Okt. 2014 (CET)Beantworten

Ich hab mal einen Satz dazugeschrieben, aber meiner Meinung nach sollte man versuchen, die Formeln insgesamt etwas laientauglicher zu formulieren. Grüße -- HilberTraum (d, m) 13:28, 29. Okt. 2014 (CET)Beantworten

Missverständliche Schreibweise

Bearbeiten

Die originale Teststatistik, wie sie von Wilcoxon beschrieben wurde und wie sie hier wiedergegeben wird (min(W+,W-)), wird im Allgemeinen mit "T" bezeichnet. Dies wird in allen englischsprachigen und in fast allen deutschsprachigen Lehrbüchern, die ich angesehen habe, so gehandhabt. Dieser T-Wert muss kleiner als der tabellierte Wert sein. Die andere Rechenmethode (siehe englische Wikipedia), bestimmt einen "W"-Wert, der größer als der Schwellenwert sein muss.

Ich würde daher dringend empfehlen, die Schreibweise ("T") oder die Rechenmethode (summe(W+,W-)) anzupassen. (nicht signierter Beitrag von 46.223.195.92 (Diskussion) 22:46, 7. Jan. 2020 (CET))Beantworten

Fehler im Korrekturterm der Formel für die Varianz bei Bindungen

Bearbeiten

Siehe Abschnitt Teststatistik > Bindungen zwischen Rängen.

Bei Bindungen zwischen Rängen enthält die Formel für die Varianz einen zusätzlichen Summanden als Korrekturterm. Im Artikel wurde der Summand angegeben als  . Jedoch ist   die Zahl der Datenpaare (oder ggf. die Zahl der Datenpaare mit Differenz > 0); korrekt wäre es, jede Gruppe nur einmal zu berücksichtigen. Ich habe die Darstellung gerade (nach meiner Einschätzung) richtiggestellt, sie entspricht nun der englischen Wikipedia, den dort angegebenen Quellen, und der Art und Weise, wie R und die Python-Bibliothek scipy rechnen. @Sigbert, Du hattest am 12. Dezember 2010 die vorherige Darstellung in diesem Artikel ergänzt. Schau gerne einmal über meine Änderungen drüber. Auf den ersten Blick scheint am Beispiel nichts geändert werden zu müssen, vielleicht habe ich aber etwas übersehen. --Steelpanspieler (Diskussion) 23:07, 7. Sep. 2022 (CEST)Beantworten

Du hast vollkommen recht. -Sigbert (Diskussion) 08:11, 2. Jan. 2023 (CET)Beantworten