Diskussion:Hypothese (Statistik)
Zum Archiv |
Wie wird ein Archiv angelegt? |
Verständnisprobleme
BearbeitenIrgendwie verstehe ich das noch nicht so ganz. Vielleicht kann ja jemand im Text noch folgende Frage beantworten: Wieso unterteilt man in zwei disjunkte Klassen, wo ich doch eine ganz konkrete Vermutung über die Wahrscheinlichkeitsverteilung treffe. Entweder mein X ist normalverteilt oder eben nicht. Wieso muss ich da zwei Klassen bilden? Vielen Dank! 128.176.114.42 19:21, 12. Jan 2005 (CET)
- Gemeint ist wohl der Parameterraum. ZB: Ho: mü => 0; H1: mü < 0. Es wäre eh mal angesagt, alle Test-Stubs zu einem schönen Artikel zu vereinen. --Philipendula 01:00, 13. Jan 2005 (CET)
"Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen." Den Satz versteh ich irgendwie nicht. --Sagehorn 20:56, 8. Dez. 2011 (CET)
- Ich auch nicht. Nijdam 12:04, 9. Dez. 2011 (CET)
- Ich habe versucht, diesen Satz umzuformulieren, damit klarer wird, was mit diesem Satz wohl gemeint war. --Kogwiss 14:57, 24. Jan. 2012 (CET)
Beipiele für Nullhypothesen
BearbeitenDas Beispiel im ersten Absatz ("Wenn jemand ein Kind ist, dann ist er älter als 18 Jahre" usw.) würde ich ersetzen, ich glaube nicht, dass das eine statistische Hypothese ist. Eine statistische Hypothese ist eine Aussage über eine Verteilung einer Zufallsvariable.
Grundsätzlich wird bei der Wahl der Nullhypothese so vorgegangen:
- Man möchte den Sachverhalt untermauern also zeigen, dass der Sachverhalt wahrscheinlich zutrifft.
- Man formuliert die Nullhypothese ( ): (also nicht ).
- Falls man mit einem statistischen Test zeigen kann, dass angesichts der vorliegenden Daten sehr unwahrscheinlich ist, so kann die abgelehnt werden - das Ziel wurde erreicht. Man glaubt (mit der gegebenen Irrtumswahrscheinlichkeit) an , zumindest so lange, bis weitere (neue) Beobachtungen vorliegen und eventuell zu anderen Ergebnissen führen.
- Das ablehnen einer ist eine starke Aussage, das nicht ablehnen dagegen nur eine schwache Aussage, das heißt mit dem nicht ablehnen ist die keinesfalls als bewiesen zu betrachten (was aber eh schon im Artikel steht).
Beispiele für Null- und Alternativhypothesen wären z. B.:
Die betrachtete Verteilung ist eine Normalverteilung | Die Verteilung ist keine Normalverteilung |
Die betrachtete Verteilung ist symmetrisch. | Die Verteilung ist nicht symmetrisch. |
Der (wahre) Mittelwert der betrachteten Verteilung ist wobei irgend ein fester Wert aus ist. | Der wahre Mittelwert ist kleiner oder größer als . |
Der (wahre) Mittelwert der betrachteten Verteilung ist . | Der wahre Mittelwert ist größer als . |
Die (wahre) Varianz der Verteilung ist . | Die wahre Varianz der Verteilung ist kleiner oder größer als . |
Den letzten Satz im ersten Abstatz "Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen." verstehe ich nicht ganz.
--VincentBosch 01:12, 23. Feb. 2008 (CET)
- Ich habe versucht, diesen Satz umzuformulieren, damit klarer wird, was mit diesem Satz wohl gemeint war. --Kogwiss 14:57, 24. Jan. 2012 (CET)
Anmerkungen
BearbeitenThema: Umgekehrte Interpretation der Nullhypothese
BearbeitenFolgendes steht am Ende des ersten Abschnitts: "Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen." Während meines Studium habe ich mich sehr intensiv mit der Problematik befasst, aber eine derartige "falsch"-Interpretation der Nullhypothese habe ich in keine wissenschaftlichen Literatur gefunden. Diese Aussage sollte unbedingt mit wissenschaftlicher Literatur belegt werden -ansonsten ist meine Empfehlung, sie zu löschen.
- Antwort zum Thema: Umgekehrte Interpretation der Nullhypothese
Ich kann zwar keine wissenschaftliche Literatur liefern. Aber ich erinnere mich sehr genau, dass vor gut 20 Jahren im Gymnasium der ganze Leistungskurs bei diesem Thema Probleme hatte und sich der Eindruck durchsetzte, als Nullhypothese müsse man das wählen, was der Lehrbuch- oder Prüfungsfragenautor erwürfelt hatte.
Wir hatten sicher nicht den besten Lehrer, und heute bin ich auf die Seite gekommen weil ich genau das wieder bräuchte. Ich bin aber zu dem Schluss gekommen, dass ich ein Lehrbuch brauche - keine Kritik an der Wikipedia, denn dass braucht und soll sie nicht sein.
-- FrankKuester 16:50, 8. Jul. 2010 (CEST)
- Habe mal einen Abschnitt zur Wahl der Null- und Alternativhypothese ergänzt. Vielleich hilfts. --Sigbert 22:57, 8. Jul. 2010 (CEST)
Thema: Beispiele für Nullhypothese/Alternativhypothese
BearbeitenBitte vorsichtig sein mit dem "vereinfachen" - das Konstrukt besteht nicht aus Hypothese und Gegenhypothese, sondern weißt folgenden Zusammenhang auf: Vermutung, die man überprüfen möchte -> Nullhypothese, die es zu verwerfen gilt -> Alternativhypothese, die durch Verwerfen der Nullhypothese zwar nicht verifiziert werden kann, aber zumindest sehr wahrscheinlich ist. Auf Wunsch kann ich gerne Quellen liefern.
Beste Grüße und: Super Arbeit hier!
Ist ein Verweis auf Falsifikationismus#Wahrscheinlichkeitshypothesen sinnvoll?
Bearbeitenfragt --Zulu55 16:39, 13. Jan. 2010 (CET)
Arten von Alternativhypothesen
BearbeitenHier wird der Eindruck vermittelt, dass man alle Alternativhypothesen in die beiden Kategorien gerichtet bzw. ungerichtet einordnen kann. Das ist jedoch falsch. Zugegeben lassen sich die meisten Alternativhypothesen in eine der beiden Kategorien einordnen. Aber eben nicht alle. Es gibt noch eine Reihe von Spezialfällen. z.B.:
- die Alternativhypothese, dass sich p zwischen zwei Werten befindet. (z.B. die Alternativhypothese: "Der Durchschnitt von xyz liegt zwischen 1,7m und 1,9m.")
- oder Aussagen über zwei auseinanderliegende Zustände. (z.B. die Alternativhypothese: "Er ist entweder ein sehr guter Schüler oder ein sehr schlechter Schüler, aber auf keinen Fall mittelmäßig.", wobei man halt nicht alle seine Noten kennt, sondern nur eine Auswahl.)
- oder mehrdimensionale Aussagen.
Solche Alternativhypothesen sind zwar extrem selten, aber man kann sie nicht kategorisch ausschließen. Wenn kein Einspruch kommt, werde ich den Absatz dergestalt umschreiben, dass klar wird, dass gerichtete und ungerichtete zwar die beiden häufigsten Kategorien sind, aber eben nicht alle. (Es gibt quasi auch "halbgerichtete" Alternativhypothesen.) --Eulenspiegel1 23:39, 25. Feb. 2010 (CET)
Abgrenzung Alternativhypothese / Nullhypothese
BearbeitenMir scheint der Artikel einen Widerspruch zu enthalten: Im Einführungsabsatz grenzt er Nullhypothese (=kein Zusammenhang) und Alternativhypothese (=der Annahme entgegengesetzter Zusammenhang) voneinander ab, unter "Nullhypothese" beinhaltet diese nur noch "häufig" die Gleichheit von Sachverhalten (ist das Nichthäufige dann die Alternativhypothese?), und unter "Arten von Hypothesen" steht dann ganz klar: "Die Nullhypothese lautet dann entsprechend entweder, dass beide Populationen gleich sind oder einen Unterschied in die entgegengesetzte Richtung aufweisen." Geklärt werden müsste also, ob die Alternativhypothese Element der Nullhypothese ist oder etwas anderes. Die Literatur ist sich dazu auch nicht ganz einig, was wohl an den zwei möglichen Bedeutungen des "Null" in der Nullhypothese liegt: "Null Zusammenhang" oder "Null Bestätigung für die Hypothese". Bei letzterem wäre die Alternativhypothese auch Element der Nullhypothese... P.S.: Mein erster Beitrag bei wikipedia. Bitte um Feedback, wenn ich irgendwas falsch gemacht habe...
-- Maulwurfn 10:44, 15. Apr. 2011 (CEST)
- Der Versuch einer Antwort:
- Mit dem Satz Häufig sagt die Nullhypothese aus, dass ein bestimmter Zusammenhang nicht besteht. wird eine Aussage über den Inhalt von Nullhypothesen gemacht. Gemeint ist er wohl so: Betrachtet man die Hypothesenpaare, dann sagt die Nullhypothese oft : "Es gibt keinen Zusammenhang zwischen..." und die dazugehörige Alternativhypothese "Es gibt einen Zusammenhang zwischen...". Es wäre vermutlich besser, wen dieser Satz gestrichen würde, weil das Häufig impliziert, dass es nicht immer so ist und dann die Frage auftaucht, wann ist es so und wann nicht?
- Nullhypothesen und Alternativhypothesen sind immer disjunkt, d.h. keine ist Teil der jeweils anderen und sie überlappen sich auch nicht,
- Ich weiss leider nicht, warum die Nullhypothese Nullhypothese heisst. --Sigbert 22:29, 15. Apr. 2011 (CEST)
Parameterraum
BearbeitenIch halte die Bezeichnung für die Parametermenge für ziemlich ungünstig, weil das doch normalerweise immer der Ergebnisraum ist. Hat das einen tieferen Grund oder wärs ok, wenn ich es einfach auf z.B. ändere? -- HilberTraum (Diskussion) 22:14, 30. Mai 2012 (CEST)
- Der Parameterraum ist der Ergebnisraum: Das Ergebnis des Experimentes ist ein Parameter. Daher ist Parameterraum und Ergebnisraum in diesem Fall synonym. --Eulenspiegel1 (Diskussion) 00:36, 1. Jun. 2012 (CEST)
- Oh, da hast du mich anscheinend völlig falsch verstanden. Ich meinte, bezeichnet doch üblicherweise die Menge, auf der die Stichprobenvariablen definiert sind. Der Testparameter ist doch kein Ergebnis, sondern ein unbekannter Parameter in der Verteilung der . -- HilberTraum (Diskussion) 08:03, 1. Jun. 2012 (CEST)
- Ich bin da mit Hilbertraum einer Meinung. Der Ergebnisraum wird üblicherweise mit Ω bezeichnet, Und ... der Parameterraum ist etwas ganz Anderes als der Ergebnisraum; da hat Eulenspiegel1 anscheinend keine Ahnung. Nijdam (Diskussion) 00:31, 2. Jun. 2012 (CEST)
- Oh, da hast du mich anscheinend völlig falsch verstanden. Ich meinte, bezeichnet doch üblicherweise die Menge, auf der die Stichprobenvariablen definiert sind. Der Testparameter ist doch kein Ergebnis, sondern ein unbekannter Parameter in der Verteilung der . -- HilberTraum (Diskussion) 08:03, 1. Jun. 2012 (CEST)
Schreibt man dies so?
BearbeitenIm Artikel steht: … die Größe des erwarteten Unterschieds oder Zusammenhangs. Koennen 'Unterschied' und 'Zusammenhang' auf diese Art zusammengezogen werden?Nijdam (Diskussion) 21:35, 16. Jan. 2014 (CET)
Beispiel zu 2.
BearbeitenDas Beispiel zu 2 stimmt nicht. Analyse:
a=P(Fehler 1. Art)
b=P(Fehler 2. Art)
Verlust L:
L=-80 wenn Kunde akzeptiert wird und solvabel ist
L=1000 wenn Kunde akzeptiert wird und nicht solvabel ist
Erwartete Verlust EL
1. H0: Kunde solvabel
- EL=1000 P(verwerf H0 nicht und H1) - 80P(verwerf H0 nicht und H0) =
- =1000 P(verwerf H0 nicht | H1)P(H1) - 80 P(verwerf H0 nicht | H0) P(H0) =
- =1000 b P(H1) -80 (1-a) P(H0) < 1000 P(H1)-80 a P(H0) = (a=0,05) 1000 {1-P(H0)} - 76 P(H0) =
- = 1000 - 1076 P(H0) =1000 - 1076 P(Kunde solvabel) = -76 +1076 P(Kunde insolvabel)
2. H0:Kunde insolvabel
- EL=-80 P(verwerf H0 und H1) + 1000 P(verwerf H0 und H0) =
- =-80 P(verwerf H0 | H1)P(H1) + 1000 P(verwerf H0 | H0) P(H0) =
- =-80 (1-b) P(H1) +1000 a P(H0) < 1000 a P(H0) = (a=0,05) 50 P(H0)= 50 P(Kunde insolvabel)
Es haengt nun davon ab wie gross P(Kunde insolvabel) ist. Nijdam (Diskussion) 17:40, 2. Feb. 2014 (CET)
Beispiel zu 2.: Ein Bankkunde will einen Kredit von 1.000 Euro von seiner Bank. Akzeptiert der Bankier den Kreditwunsch und ist der Kunde solvent, so gewinnt er die gezahlten Zinsen in Höhe von 80 Euro. Gibt der Bankier dem Kunden den Kredit und der Kunde ist insolvent, so verliert der Bankier die gesamten 1.000 Euro.
- Formuliert man die Nulhypothese wie: "Kunde ist solvent", mit einem Signifikanzniveau von 5 %, da entspricht der Fehler 1. Art gerade Bankier lehnt den Kreditwunsch ab und der Kunde ist solvent, und wissen wir, dass der Verlust beim Fehler 1. Art gleich -80 Euro × 95 % = -76 Euro ist. Beim Fehler 2. Art kennen wir die Wahrscheinlichkeit nicht, d. h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 1.000 Euro. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von maximal 1.000 Euro. Der maximal erwartete Verlust V hängt ab von der Wahrscheinlichkeit dass die Nulhypothese richtig sei, und zwar gilt: Euro.
- Formuliert man die Nulhypothese wie: "Kunde ist insolvent, mit einem Signifikanzniveau von 5 %, da entspricht der Fehler 1. Art gerade Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent, und wissen wir, dass der Verlust beim Fehler 1. Art gleich 1.000 Euro × 5 % = 50 Euro ist. Beim Fehler 2. Art kennen wir die Wahrscheinlichkeit nicht, d.h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 0 Euro. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von maximal 50 Euro. Der maximal erwartete Verlust V hängt ab von der Wahrscheinlichkeit dass die Nulhypothese richtig sei, und zwar gilt: Euro.
Die Hypothesen sollten also so gewählt werden, dass der Fehler 1. Art Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent entspricht, da dann der erwartete Verlust am geringsten ist.
- Ja, so erscheint mir das mathematisch richtig (und im Artikel falsch). Allerdings frage ich mich, ob das Beispiel überhaupt in den Artikel passt. Wo ist den hier der Test? Das ist doch eigentlich nur eine Aufgabe mit bedingten (Bayesschen) Wahrscheinlichkeiten und Abschätzung einer Verlustfunktion, aber es gibt doch gar keine Beobachtungen/Stichprobe. -- HilberTraum (Diskussion) 16:31, 8. Feb. 2014 (CET)
- Es handelt sich hier um die Wahl der Nulhypothese. Deshalb koennte es im Artikel passen. Aber meinentwege koennte es auch rausgenomen werden. Nijdam (Diskussion) 18:04, 8. Feb. 2014 (CET)
- Ja, von mir aus kann das schon in den Artikel, aber ich fände es schon besser, wenn es zu den Hypothesen einen echten Test (mit Stichprobe und so) gäbe. -- HilberTraum (Diskussion) 20:13, 9. Feb. 2014 (CET)
- Vielleicht koennte das Beispiel so geaendert werden dass es sich um Produzent/Kosument handelt.Nijdam (Diskussion) 00:21, 12. Feb. 2014 (CET)
- Ja, von mir aus kann das schon in den Artikel, aber ich fände es schon besser, wenn es zu den Hypothesen einen echten Test (mit Stichprobe und so) gäbe. -- HilberTraum (Diskussion) 20:13, 9. Feb. 2014 (CET)
- Es handelt sich hier um die Wahl der Nulhypothese. Deshalb koennte es im Artikel passen. Aber meinentwege koennte es auch rausgenomen werden. Nijdam (Diskussion) 18:04, 8. Feb. 2014 (CET)
»Arten von Hypothesen«
BearbeitenUnter »Arten von Hypothesen« heißt es: »Wenn die Gesamtheit aller Möglichkeiten ist, dann kann man einen Test allgemein so formulieren, dass die Teilmenge die Nullhypothese darstellt und die Alternativhypothese.« Weiter unten bei »Wahl der Null- und Alternativhypothese« steht dann »Formal zerlegen die Null- und Alternativhypothese einen Parameterraum in zwei disjunkte nicht leere Teilmengen und .« Widersprichen sich die beiden Sätze nicht dahingehend, daß der erste auch zuläßt, der zweite aber nicht leere Teilmengen verlangt? Chrullrich (Diskussion) 20:10, 30. Apr. 2018 (CEST)
Nullverteilung als verbreiteter Begriff
BearbeitenIn einen Gespräch wurde die Nullverteilung erwähnt. Ich musste erstmal suchen und fand eine Masterarbeit. Es gibt den Begriff auch in der englischen Wikipedia.
Ich würde gerne einen Hinweis darauf in den Artikel schreiben, sowas "(umgangssprachlich auch Nullverteilung genannt)" reinbringen,
Zur Beurteilung, ob die Alternativhypothese akzeptiert oder abgelehnt werden soll, muss außerdem die Verteilung der Prüfgröße unter der Nullhypothese, auch Nullverteilung genannt, bekannt sein.
Gehört der Hinweis in den Artikel?
https://en.wikipedia.org/wiki/Null_distribution
- "In statistical hypothesis testing, the null distribution is the probability distribution of the test statistic when the null hypothesis is true." Das ist der erste Satz, der aber in dieser Allgemeinheit falsch ist, da es in der Regel viele Wahrscheinlichkeitsverteilungen gibt, die durch die Nullhypothese zugelassen werden, und es häufig auch viele Wahrscheinlichkeitsverteilungen der Teststatistik gibt, falls die Nullhypothese wahr ist. Da hilft es auch nicht, dass der Satz ein Zitat ist.--Sigma^2 (Diskussion) 18:53, 31. Jan. 2023 (CET)
Verbesserungsmöglichkeiten
BearbeitenDer insgesamt gute Artikel hat noch Verbesserungsmöglichkeiten. Die Verwendung der Terminologie ist etwas unscharf, etwas uneinheitlich und manchmal zu umgangssprachlich, so dass die statistische Fachterminologie unklar bleibt. Beispiele:
- 'Nullhypothese gilt', 'Nullhypothese ist erfüllt' anstelle von 'Nullhypothese ist wahr'. Hypothesen sind wahr oder unwahr, Entscheidungen (z. B. die Ablehnung einer Nullhypothese) sind richtig oder falsch. Manchmal werden unwahre Hypothesen (etwas unscharf) als 'falsche Hypothesen' bezeichnet. Diese Bezeichnung sollte man vermeiden, ist bisher auch nicht im Artikel.
- ' stammt aus '.
- Die Terminologie 'gerichtete und ungerichtete Hypothese' ist unbelegt und scheint wesentlich Theoriefindung zu sein, um einseitige und zweiseitige Tests zu verstehen. Sie wird vielleicht in bestimmten Anwendungsgebieten verwendet. Das sollte belegt werden.
- Naheliegen wäre das Begriffspaar 'einseitige' und 'zweiseitige' Hypothese.
- Die Terminologie 'spezifische und unspezifische Hypothese' ist unbelegt und scheint wesentlich Theoriefindung zu sein. Sie wird vielleicht in bestimmten Anwendungsgebieten verwendet. Das sollte belegt werden.
- Literatur: Ein Ökonometriebuch – auch wenn es zu besten Ökonometriebüchern gehört – ist als Quelle zu dürftig.
- Der Einstichproben-t-Test als Beispiel ist insofern wenig geeignet, da der Parameter ist, wobei die erste Komponente interessiert und der zweite Teil ein lästiger Parameter (nuisance parameter) oder Rauschparameter ist. Bezüglich ist eine verkürzte Schreibweise für eine zusammengesetzte Hypothese, die alle Normalverteilungen mit und zuläßt. Die Begriffe einfach und zusammengesetzt beziehen sich auf die Mengen zugelassener Verteilungen. Auch der Lilliefors-Test ist ein schlechtes Beispiel, da die Nullhypothese eine nicht einelementige Menge von Wahrscheinlichkeitsverteilungen beschreibt.
- Bei multiplen Tests werden Familien von Nullhypothesen und die sogenannte Globalhypothese als Durchschnitt der Elementarhypothesen untersucht.