Diskussion:Run-Test
R oder r
BearbeitenIn dem Beitrag wird die Variable R oder r für die Zahl der Runs benutzt. Vielleicht sollte man nur eine einzige Variable verwenden.
- Die Zufallsvariable "Zahl der Runs einer Urliste" wird groß geschrieben. Die konkrete Ausprägung von R wird klein geschrieben. Z.B. P(R = r). --Philipendula 15:33, 16. Apr 2005 (CEST)
- Gibt es dafür eine Quelle? Wenn ja, bitte im Artikel angeben (mit der obigen Begründung). Ein Artikel sollte lesbar sein, ohne die Diskussionsseite konsultieren zu müssen. Ich lese hier von dieser Regel zum ersten Mal.--SiriusB 12:14, 19. Sep. 2007 (CEST)
Grenzen für z
BearbeitenMit welchem Tabellenwert wird dann z verglichen ? Was ist der kritische Wert für Z ? Das ist leider nicht erklärt .
The z-score column is compared to a standard normal table. That is, at the 5% significance level, a z-score with an absolute value greater than 1.96 indicates non-randomness.
Der Z-Wert wird mit einer Standard Normalwert Tabelle verglichen. Bei p = 0,05 zeigt ein z-Wert mit einem absoluten Wert größer als 1,96 die Nichtzufälligkeit an. Ist das so korrekt ?
Mfg Rho
Nicht ganz. Es sollen nicht zu viele Runs auftreten, aber auch nicht zu wenig. Der Artikel bedarf eigentlich einer kleinen Überarbeitung. Man testet die Hypothese: Die Entnahme aus einer dichotomen Grundgesamtheit erfolgte zufällig. Wenn die Prüfgröße z zwischen -1,96 und 1,96 liegt, wird diese Hypothese bei einem Signifikanzniveau von 0,05 nicht abgelehnt. Grundsätzlich gilt, dass H0 nicht abgelehnt wird, wenn z im Intervall
- liegt, mit z(1-a/2) als Quantil der Standardnormalverteilung.
- Ich habe nicht richtig gelesen: Das mit dem Absolutwert stimmt natürlich!!
- Gruß --Philipendula 01:35, 21. Nov 2004 (CET)
Normalapproximation
BearbeitenIch habe überall nur Hinweise gefunden, dass erst ab n1,n2 > 20 die Zahl der Runs approximativ normalverteilt ist. Das Beispiel mit n=20 habe ich mal drin gelassen, vielleicht belehrt mich jemand eines Besseren. --Philipendula 15:27, 21. Nov 2004 (CET)
Frage von 128.176.114.42
BearbeitenIST HIER DER Kolmogorow-Smirnow-Test GEMEINT? DER HAT SCHON EINEN ARTIKEL!
- Ja, danke. Habe das geändert. --Philipendula 00:34, 13. Jan 2005 (CET)
Das Beispiel aus der Politik
BearbeitenFunktioniert der Run-Test hier überhaupt? Es ist doch von vorneherein klar, dass alle 11 (n1=5 von einer, n2=6 von der anderen Partei, damit n1 & n2 von vorneherein bekannt und fest) reden sollen. Damit liegt der 11. fest, wenn der 10. gezogen ist. Für den RT müssen aber doch aus einer "dichotomen Grundgesamtheit" n Elemente gezogen werden. D.h. n1 und n2 wären nicht von vorneherein bekannt und fest. Sprich das der RT funktioniert für Münzwürfe, aber nicht für das Politikerbeispiel, oder ist es genau andersherum? AlterVista 16:22, 4. Nov 2005 (CET)
- Hmm, Dichotomie meint hier doch nur, dass jedem Ereignis (hier: die Auswahl des Redners) einer von zwei möglichen Werten (die Zugehörigkeit zu einer der zwei Parteien) zugeordnet wird. Genau wie beim Münze werfen; dort weißt Du im übrigen auch nicht vorher, wie oft Kopf oder Zahl fallen werden.--SiriusB 13:01, 19. Sep. 2007 (CEST)
- Es geht darum, ob die Rednerliste zufällig erzeugt wurde oder ob beispielsweise möglicherweise die Angehörigen der Partei A zum größten Teil am Anfang auftreten durften. --Philipendula 13:05, 19. Sep. 2007 (CEST)
- Das Beispiel zeigt die Schwäche des Tests bei kleinen Stichproben. Zwei Runs sind das Minimum, was man überhaupt bekommen kann, und elf Runs das Maximum. D.h. bei Ablehnen der Nullhypothese ist die Nichtzufälligkeit eigentlich schon mit bloßen Auge sichtbar. -- Sigbert 12:47, 18. Nov. 2009 (CET)
- Es geht darum, ob die Rednerliste zufällig erzeugt wurde oder ob beispielsweise möglicherweise die Angehörigen der Partei A zum größten Teil am Anfang auftreten durften. --Philipendula 13:05, 19. Sep. 2007 (CEST)
K-S-Test mächtiger als Run-Test?
BearbeitenDer Kolmogorov-Smirnov-Test testet doch nicht die Reihenfolge der Stichproben, sondern deren kumulative Verteilung. Bei einem binären Experiment (als z.B. Kopf oder Zahl) wäre der K-S-Test sogar sinnlos, da sich alle Stichproben auf zwei Werte verteilen (statt wie im Idealfall alle unterschiedlichen Wertes zu sein). So wie ich das verstehe, ist der Run-Test keineswegs weniger mächtig, sondern testet einen völlig anderen Aspekt einer Verteilung und i.d.R. auch völlig andere Verteilungen.--SiriusB 11:59, 19. Sep. 2007 (CEST)
- Es geht ja um die Zufälligkeit. So kann man mit dem Chiquadrattest auf Gleichverteilung testen, was ja auch auf Zufälligkeit hindeuten kann. --Philipendula 12:20, 19. Sep. 2007 (CEST)
- Aber eine Verteilung kann der Normalverteilung im K-S-Test sehr ähnlich sein, aber wenn man die Reihenfolge betrachtet, stellt man z.B. fest, dass die Werte in auf-, absteigender oder sonst einer auffälligen Reihenfolge gezogen wurden. Wenn man eine Münze 1000x wirft und 501x Kopf und 499x Zahl erhält, dann würde man anhand eines zusammenfassenden Tests sofort auf eine Zufallsverteilung schließen. Dabei fällt dann völlig unter den Tisch, dass die 501x Kopf und 499x Zahl alle auf je einen Run (also insgesamt r=2) verteilt sind. Von daher halte ich die Aussage, der Run-Test sei weniger mächtig, für falsch, denn in diesem Beispiel wäre der K-S-Test gar nicht anwendbar (der setzt doch voraus, dass alle Werte unterschiedlich sind); aus der Häufigkeit der Ergebnisse (welcher Test wäre das genau?) ergibt sich ein völliger Einklang mit der Zufälligkeit, einzig der Run-Test zeigt die totale Regelmäßigkeit auf. Im Moment sehe ich tatsächlich kein Beispiel, wo man den Run-Test überhaupt durch einen K-S-Test ersetzen könnte (und umgekehrt). In etwa, wie man einen Zollstock auch nicht durch ein Thermometer ersetzen kann.--SiriusB 12:51, 19. Sep. 2007 (CEST)
- Dann wirf es raus. Ich hatte es bei "meinem" größeren Umbau [1] stehen lassen, weil ich zu faul war, drüber nachzudenken. --Philipendula 13:01, 19. Sep. 2007 (CEST)
- Zu klären wäre ggf., ob eine Anwendung des K-S-Test auf die Reihenfolgenverteilung sinnvoll (und dann ggf. mächtiger) wäre. Man könnte z.B. die Kopf- und die Zahl-Würfe getrennt über die Wurf-Nummer auftragen (der wird dann quasi zum "Wert"), und dann schauen, ob das Ganze einer Gleichverteilung (mit Normierung 50%) entspricht. Allerdings könnte ich mir vorstellen, dass dieser Test zu falschen Ergebnissen führt, weil er die größte Übereinstimmung nicht bei zufälliger Verteilung, sondern bei alternierender Abfolge haben könnte. Dritte Möglichkeit: Man bestimmt die Verteilung der Run-Längen und testet, ob sie mit der theoretisch zu erwartenden Verteilung (welcher? z.B. Poisson?) vereinbar ist. Hierfür bietet sich der Kuiper-Test an, der mit dem K-S-Test eng verwandt ist. Interessant finde ich, dass auch im englischen Artikel behauptet wird, der K-S-Test sei "more powerful", aber ohne Begründung. Bis zur Klärung nehme ich die Passage mal raus.--SiriusB 16:51, 19. Sep. 2007 (CEST)
- Jo, danke. Ich bin sowieso kein Freund davon, immer auf Biegen und Brechen Vergleiche anzugeben. --Philipendula 17:02, 19. Sep. 2007 (CEST)
- Zu klären wäre ggf., ob eine Anwendung des K-S-Test auf die Reihenfolgenverteilung sinnvoll (und dann ggf. mächtiger) wäre. Man könnte z.B. die Kopf- und die Zahl-Würfe getrennt über die Wurf-Nummer auftragen (der wird dann quasi zum "Wert"), und dann schauen, ob das Ganze einer Gleichverteilung (mit Normierung 50%) entspricht. Allerdings könnte ich mir vorstellen, dass dieser Test zu falschen Ergebnissen führt, weil er die größte Übereinstimmung nicht bei zufälliger Verteilung, sondern bei alternierender Abfolge haben könnte. Dritte Möglichkeit: Man bestimmt die Verteilung der Run-Längen und testet, ob sie mit der theoretisch zu erwartenden Verteilung (welcher? z.B. Poisson?) vereinbar ist. Hierfür bietet sich der Kuiper-Test an, der mit dem K-S-Test eng verwandt ist. Interessant finde ich, dass auch im englischen Artikel behauptet wird, der K-S-Test sei "more powerful", aber ohne Begründung. Bis zur Klärung nehme ich die Passage mal raus.--SiriusB 16:51, 19. Sep. 2007 (CEST)
- Dann wirf es raus. Ich hatte es bei "meinem" größeren Umbau [1] stehen lassen, weil ich zu faul war, drüber nachzudenken. --Philipendula 13:01, 19. Sep. 2007 (CEST)
- Aber eine Verteilung kann der Normalverteilung im K-S-Test sehr ähnlich sein, aber wenn man die Reihenfolge betrachtet, stellt man z.B. fest, dass die Werte in auf-, absteigender oder sonst einer auffälligen Reihenfolge gezogen wurden. Wenn man eine Münze 1000x wirft und 501x Kopf und 499x Zahl erhält, dann würde man anhand eines zusammenfassenden Tests sofort auf eine Zufallsverteilung schließen. Dabei fällt dann völlig unter den Tisch, dass die 501x Kopf und 499x Zahl alle auf je einen Run (also insgesamt r=2) verteilt sind. Von daher halte ich die Aussage, der Run-Test sei weniger mächtig, für falsch, denn in diesem Beispiel wäre der K-S-Test gar nicht anwendbar (der setzt doch voraus, dass alle Werte unterschiedlich sind); aus der Häufigkeit der Ergebnisse (welcher Test wäre das genau?) ergibt sich ein völliger Einklang mit der Zufälligkeit, einzig der Run-Test zeigt die totale Regelmäßigkeit auf. Im Moment sehe ich tatsächlich kein Beispiel, wo man den Run-Test überhaupt durch einen K-S-Test ersetzen könnte (und umgekehrt). In etwa, wie man einen Zollstock auch nicht durch ein Thermometer ersetzen kann.--SiriusB 12:51, 19. Sep. 2007 (CEST)
Signifikanzniveau
BearbeitenWo kommt dieses alpha her?
Das hat der liebe Gott in die Welt gesetzt.Das legt man fest. -- Philipendula 11:45, 9. Jan. 2009 (CET)
Zweiseitig?
Bearbeiten@Philipendula: Weil untersucht wird ob Supi vorgezogen wurde, ist der Test einseitig. Grosse Werte von r zeichnen zwar darauf hin das vermutlich kein Zufall am Ergebnis zur Grunde liegt, aber bedeuten nicht das eine der beide Partien vorgezogen wurde. Im Gegenteil sogar. Einverstanden? Nijdam 13:39, 22. Jan. 2010 (CET)
- Dann muss aber irgendwo bekannt gemacht werden, dass der Test einseitig ist. Ich wäre dafür, ihn zweiseitig zu lassen, und lieber die Aufgabenstellung so zu verändern, dass die Zufälligkeit angezweifelt worden ist. So ist das für Anfänger einfacher. Leute, die von Testen Ahnung haben, werden ohnehin in ein Lehrbuch gucken. -- Philipendula 13:21, 23. Jan. 2010 (CET)
Was ist ein Run?
Bearbeitenwird im Artikel nicht erklärt. Der Artikel ist so nur für Leute verständlich, die eigentlich schon wissen worum es geht --213.142.124.72 21:09, 27. Apr. 2010 (CEST) PS: Ich weiß jetzt was ein Run ist, aber fühle mich nicht kompetent genug diesen Artikel zu überarbeiten.
- Es steht doch oben: Es werden nun alle benachbarten Ergebnisse gleicher Ausprägung zu einem Lauf oder Run zusammengefasst. Gruß -- Philipendula 09:57, 28. Apr. 2010 (CEST)
Fehler in "ungerader" Formel?
BearbeitenIch bin zwar nur ein Laie, aber ich denke die hier gegebene Formel ist falsch.
Sollte das nicht eher so ausssehen?
Liefert "in der derzeitigen Form" völlig falsche Ergebnisse.
--80.123.56.19 17:29, 19. Okt. 2011 (CEST)
- Entfernt: mein Fehler. Nijdam 23:21, 20. Okt. 2011 (CEST)
Öhrm, ... bin mich nicht sicher ob du ganz "siehst" was ich meine. Die Formel um n Elemente in r _nichtleere_-Gruppen zu unterteilen ist: . Das trifft bei der "geraden Formel" zu, bei der "Ungeraden" wie gesagt nicht. --128.131.213.205 13:42, 20. Okt. 2011 (CEST)
- Gegeben n1 a-Kugel und n2 b-Kugel. Ungerade Anzahl r Runs: q+1 a-Gruppen und q b-Gruppen, oder q a-Gruppen und q+1 b-Gruppen mit r=2q+1. Wieviel Moeglichkeiten um n1 ueber q+1 nicht leere a-Gruppen zu verteilen? Lege einen Kugel in jeder Gruppe, und verteile die uebrigen. Das macht man durch die uebrige Kugeln aneinander zu legen und mit q Zeichen, zB x zu separieren. (zB: aaaxxxaxaaaxx...xaa). Es gibt Insgesamt n1-q-1 a's und q x's, Man waehlt die Nummer der Plaetze der a's oder der x's. Das kann auf n1-q-1+q=n1-1 ueber q Weisen. Die n2 b-Kugel werden analog auf n2-1 ueber q-1 Weisen verreilt. Oder es gibt q a-Gruppen n1-1 ueber q-1 Moeglichkeiten, und q+1 b-Gruppen: n2-1 ueber q Moeglichkeiten. Nijdam 22:39, 20. Okt. 2011 (CEST)
- Beispiel; n1=1 a's und n2=2 b's. Moeglichkeiten: r=2 aabb bbaa r=3 abba baab r=4 abab baba; P(R=2)=2/6; P(R=3)=2/6 en P(R=4)=2/6, Nijdam 23:21, 20. Okt. 2011 (CEST)
Beispiel
BearbeitenIm Beispiel ist nicht angegeben, auf Basis welcher vorgegebenen Fehlerwahrscheinlichkeit 1. Art ('α') Nullhypothesen abgelehnt werden oder nicht abgelehnt werden Das Beispiel ist in dieser Form ungeeignet--Sigma^2 (Diskussion) 13:42, 16. Okt. 2022 (CEST)