Diskussion:Hypergeometrische Verteilung

Einleitung dieser Diskussionsseite anzeigen

Ich kenne die Schreibweise H(N, M, n) und denke, dass sie zumindest nicht unüblich ist. Vielleicht lässt sie sich irgendwie noch im Text erwähnen, damit auch diejenigen, die andere Literatur haben, Parallelen ziehen können. 82.82.120.218 19:50, 9. Jan 2004 (CET)

Binomialkoeffizient

Ist es wirklich im Sinne des Erfinders, wenn statt des Binomialkoeffizienten "( 20 über 4 )" dasteht, m.a.W. trete ich jemandem auf die Zehen, wenn ich es zum Binomialkoeffizienten umschreibe? Können die Wahrscheinlichkeiten in der Tabelle auf 4 Dezimalstellen reduziert werden? Nicht, dass ich das Lebenswerk von jemandem zerstöre! ;-) --Philipendula 15:23, 1. Jul 2004 (CEST)

Vom Gedanken der Autorenschaft muss man sich sowieso hier lösen - es kommt allein darauf an, den perfekten Artikel zu bekommen, also trau dich. -- Nichtich 20:48, 1. Jul 2004 (CEST)

Es könnte halt sein, dass die "( 20 über 4 )"-Schreibweise auch üblich ist, z.B in Schulen, die manchmal eine etwas verquere Art der Darstellung haben. In diesem Fall hätte natürlich die obige Schreibweise die selbe Berechtigung wie meine, obwohl mir das schon etwas gewöhnungsbedürftig vorkommt. --Philipendula 22:50, 1. Jul 2004 (CEST)

Darstellung der W'funktion

Letzter Kommentar: vor 18 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Ich habe meine sämtlichen Statistikbücher gewälzt. In mindestens 80%, auch englischen, wurde für die Parameter der HV N, M und n gewählt. Auch die Bezeichnung war meistens ähnlich wie bei mir, h(x|N,M,n). Wegen des Wiedererkennungswertes erschien mir eine Umformulierung angebracht, auch auf die Gefahr hin, Schläge zu kriegen.

Auch habe ich die Unterschiede zwischen W'funktion und Verteilung stärker herausgehoben.

--Philipendula 23:54, 1. Jul 2004 (CEST)

Umsetzung in TeX, Umformung in h(x|N,M,n), letzten Abschnitt nach oben geholt, teilweise formelmäßig verändert. --Philipendula 00:54, 2. Jul 2004 (CEST)

Ich finde es nervig, dass jeder Matheprofessor meint, sich durch eigene Kürzel profilieren zu müssen. Man ist ja gezwungen, sich eine Vergleichstabelle anzulegen; hier der Anfang einer solchen, ist vielleicht für manche ganz hilfreich:

GG/universe: Standard ist 'N', P.Boley 'τ' (tau); 'n' (Schülerduden, unsinnig!).

Mark.Teilmenge (=max. Treffer): 'M' (Altmann, Schlittgen, Hartung); 'N1' (Sachs, Boley); 'w' (=weiß, Schülerduden).

(2.)Ziehg./gezogene Tupel: meist 'n' (en.wiki, Sachs, Boley, Altmann); 'k' (Hartung); 'r' (?); 'm' (natürl.Schülerduden).

davon markiert/Treffer: 'x' (Thompson 92, Standard für Unbekannte) 'x1'; 'k' (en.wiki, Schülerduden);'m' (Altmann); 'a' ("agreements", Holm u.a., Linguistik).

Bestimmt läßt sich das sehr weit fortsetzen bzw. ergänzen. (HJJHolm 09:34, 14. Dez. 2006 (CET))Beantworten

Warum hypergeometrisch?

Letzter Kommentar: vor 9 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Warum nennt man diese Verteilung eigentlich hypergeometrisch? Hat das etwas mit den Mengen zu tun, die im ersten Absatz genannt werden? Ich begreife diesen Teil des Textes sowieso nicht ganz; liegt vielleicht auch daran, dass ich nicht weiß, was der Autor unter unabhängigen Mengen versteht. --Saraedum 19:49, 6. Aug 2005 (CEST)

Das interessiert mich auch woher der Name kommt. Ich könnte mir vorstellen, dass der Name vom Begriff der geometrischen Folge abgeleitet ist. Bei einer geometrischen Folge ist der Quotient zweier benachbarter Folgenglieder immer konstant q. Bei einem hypergeometrischen Zufallsexperiment wie z.B. n-faches Ziehen von M roten und (N-M) blauen Kugeln aus einer Urne mit N Kugeln ohne Zurücklegen, ändern sich die Einzelwahrscheinlichkeiten p = M/N für eine rote und 1-p für eine blaue Kugel durch das Nichtzurücklegen ständig, da nach jeder Ziehung N um 1 verringert wird. Diese Änderungen könnten man mit der Vorsilbe "Hyper" ausdrücken wollen. Ich habe das aber noch nie irgendwo nachlesen können. Eventuell weiß dazu jemand hier mehr oder kann mich korrigieren. --Carrois (Diskussion) 12:48, 17. Jan. 2015 (CET)Beantworten

Ganz intuitiv hätte ich jetzt gesagt, dass der Name daher kommt, dass ihre wahrscheinlichkeitserzeugende Funktion die hypergeometrische Funktion beinhaltet, siehe Hypergeometrische Verteilung#Wahrscheinlichkeitserzeugende Funktion. Die hypergeometrische Funktion kann wiederum durch die hypergeometrische Reihe dargestellt werden, die eine Verallgemeinerung der geometrischen Reihe ist, bei der das Verhältnis aufeinanderfolgender Glieder nicht mehr konstant sein muss. Grüße, --Quartl (Diskussion) 13:55, 17. Jan. 2015 (CET)Beantworten

Charakteristische Funktion

Was ist das 'p' in der charakteristischen Funktion? --141.76.10.46 19:12, 23. Jul 2006 (CEST) Wenn p=M/N, dann steht hier die falsche charakteristische Funktion - nämlich die der Binomialverteilung zu p.

Die charakteristische Funktion sollte falsch sein. Schließlich müsste sonst die erzeugende Funktion $(1-p + pz)^n$ (mit $z=e^{is}$) sein. Da die erzeugende Funktion aber eindeutig die Verteilung festlegt, müsste die ZVar damit Bin(n,p)-verteilt sein - unabhängig von dem eigentlichen Wert von $p\in[0,1]$.

Einführung

Kann sein, dass ich mich irre, da ich grade erst das zweite Mal Stochastik im Unterricht behandele, aber wird in der Einführung X bzw. x in der gleichen Funktion verwendet wie im späteren Artikel k?

Ich fand das ganze sehr verwirrend aber lasse mich natürlich gern eines besseren belehren.

Richtig. Und gemäß wiki-Regeln sollen die Leser - zumindest in der Einleitung - allgemeinverständlich informiert werden.

Einführung II

Letzter Kommentar: vor 16 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Am Ende der Einführung wird auf ein "anschauliches" Beispiel verwiesen: "In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit in einer 10-elementigen Stichprobe genau 4 gelbe Kugeln zu ziehen?" Warum wird dieses "anschauliche" Beispiel nicht gleich auf das bekannte Lottospiel übertragen: "In einer Lostrommel mit 49 durchnummerierten Kugeln befinden sich sechs von mir als Gewinnzahlen notierte Kugeln. Wie hoch ist die Wahrscheinlichkeit, dass beim Ziehen von 7 Kugeln genau 5 Gewinnzahlen darunter sind?" Wahrscheinlichkeiten für das Lottospiel 6 aus 49 werden im Verlauf des Artikels doch auch angegeben. Die Rolle der Zusatzzahl muss ja erst einmal nicht im Term berücksichtigt werden. --Ruppert 22:27, 1. Dez. 2008 (CET)Beantworten

Fehler wegen unvollständiger Berücksichtigung der Sortierung?

Letzter Kommentar: vor 13 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Die Definition und das Kugelbeispiel scheinen einen Fehler aufzuweisen, weil sie die Sortierung nicht vollständig berücksichtigen. Kombinatorisch werden nur (M über k) x (N-M über n-k) Treffermöglichkeiten betrachtet, also zuerst die Kugeln aus der gelben Menge, dann die aus der violetten. Allerdings gibt es auch die Möglichkeit, dass zuerst eine violette und danach eine gelbe Kugel gezogen wird.

Ein einfaches Beispiel: Seien zwei Kugeln (N=2), davon eine gelb (M=1), die andere violett. Wie hoch ist die Wahrscheinlichkeit, dass bei Ziehung von zwei Kugeln (n=2) eine gelbe (k bzw. x=1) enthalten ist? Natürlich muss bei Ziehung aller Kugeln (n=N) die Wahrscheinlichkeit, dass alle gelben Kugeln gezogen werden (k=M), 100% betragen. Die zwei Möglichkeiten sind (gelb, violett) und (violett, gelb) - also stets eine gelbe Kugel. Die Formel ergibt aber: h(k|N,M,n) = (M über k) x (N-M über n-k) / (N über n) = h(1|2,1,2) = (1 über 1) x (2-1 über 2-1) / (2 über 2) = 1 x 1 / (2 x 1) = 0,5 = 50%.

Die Formel gibt also die Wahrscheinlichkeit dafür an, dass die ersten k Kugeln gelb und die restlichen violett sind! -- Karl Wiki 14:00, 12. Dez. 2009 (CET)Beantworten

Die Reihenfolge der Kugeln spielt in der Formel keine Rolle. Es wird die Wahrscheinlichkeit dafür berechnet, dass die Kugeln "mit einem Griff" gezogen werden. Diese Formulierung ("mit einem Griff") soll bedeuten, dass die Kugeln keine Reihenfolge durch das Ziehverfahren aufgedrückt bekommen (es gibt keine "erste", "zweite", ... Kugel). Das könnte man tatsächlich auch so auslegen, dass nur eine ganz bestimmte Anordnung berücksichtigt wird: Z.B. könnte man die Kugeln erstmal nacheinander ziehen (statt mit einem Griff) und dann die Reihenfolge dadurch eliminieren, dass man die Kugeln der Farbe nach ordnet. Auch mit dieser Sichtweise passt die Formel ganz genau. Das "einfache Beispiel" ist falsch gerechnet, denn (2 über 2) = 1. 87.154.95.88 18:58, 20. Feb. 2011 (CET)Beantworten

Anderer Fehler

Letzter Kommentar: vor 9 Jahren2 Kommentare1 Person ist an der Diskussion beteiligt

Die Voraussetzung $0\leq k\leq \min\{n,M\}$ reicht nicht: FÜr $N=5,M=4,n=3,k=1$ ist $n-k>N-M$ und damit

{\binom {N-M}{n-k}}

undefiniert.

Es muss also zusätzlich $n-k\leq N-M$ gelten, also $k\geq n+M-N$ . -- UKoch (Diskussion) 21:17, 22. Aug. 2015 (CEST)Beantworten

Die en:WP sieht das auch so (s. Inbox unter "Support"), also ändere ich den Artikel hier entsprechend. -- UKoch (Diskussion) 20:40, 26. Aug. 2015 (CEST)Beantworten

Herleitung fehlt

Letzter Kommentar: vor 9 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

In dem Artikel wird die Verteilung nicht hergeleitet. Hat nicht jemand Lust, eine gute Herleitung einzufügen ? Auch wäre es wünschenswert, Beweise für die weiteren Eigenschaften zu haben. (nicht signierter Beitrag von 85.176.129.185 (Diskussion) 10:34, 5. Jan. 2012 (CET)) Beantworten

Meinst du eine Herleitung wie die im Artikel Urnenmodell? Viele Grüße, --Quartl (Diskussion) 21:22, 22. Aug. 2015 (CEST)Beantworten

Es existieren evtl. 2 Modi!

Die hypergeometrische Verteilung hat 2 Modalwerte (Modi), wenn der Bruch ${\frac {(n+1)(M+1)}{N+2}}$ eine natürliche Zahl ist.

Dann sind die Modalwerte ${\frac {(n+1)(M+1)}{N+2}}$ und ${\frac {(n+1)(M+1)}{N+2}}-1$ .

Ansonsten ist der Modalwert eindeutig und $\left\lfloor {\frac {(n+1)(M+1)}{N+2}}\right\rfloor$

Einleitung - Verweis auf Variation

In der Einleitung wird auf die Variation ohne Wiederholung verwiesen. Dies ist meiner Ansicht nach irreführend, denn bei einer Variation kommt es ja auf die Reihenfolge der Elemente an, bei der Hypergeometrischen Verteilung nicht. Passend wäre ein Verweis auf die Kombination (Ziehen mit einem Griff). https://de.wikipedia.org/wiki/Kombination_(Kombinatorik)

Ergebnisraum der hypergeometrischen Verteilung

Letzter Kommentar: vor 1 Jahr1 Kommentar1 Person ist an der Diskussion beteiligt

Im Abschnitt "Definition" ist der Ergebnisraum angegeben als $\{\max\{0,n+M-N\},\dotsc ,\min\{n,M\}\}$ , wobei

$N$ : Anzahl der Objekte in der Grundgesamtheit;
$n\leq N$ : Anzahl Ziehungen;
$M\leq N$ : Anzahl der Objekte mit bestimmter Eigenschaft in der Grundgesamtheit.

Ich halte diese Festlegung des Ergebnisraums für unnötig restriktiv: Falls man z. B. insgesamt 25 Kugeln hat ( $N=25$ ), von denen zehn rot sind ( $M=10$ ) und man 20 mal zieht ( $n=20$ ), so finde ich die Frage "Wie groß ist die Wahrscheinlichkeit, genau zwölf rote Kugeln zu ziehen?" durchaus legitim - die Antwort wäre dann natürlich "null". Analog hat auch die Frage "Wie groß ist die Wahrscheinlichkeit, genau zwei rote Kugeln zu ziehen?" ihre Berechtigung; die Antwort ist auch hier "null". Man kann natürlich diese "unmöglichen Fälle" ausschließen, indem man sie nicht als Teil des Ergebnisraums ansieht, wie es in diesem Artikel getan wurde. Jedoch hat man dann einen Ergebnisraum vorliegen, der erstmal "verdaut" werden muss. Ich könnte mir gut vorstellen, dass der Großteil der Leser dieses Artikels sich die Mühe nicht macht und das mal geflissentlich überliest.Lässt man hingegen diese "unmöglichen" Fälle zu, so muss man nicht einmal die Formel ändern: Durch die verbreitete Festsetzung ${r \choose s}=0$ für $r<s$ behält sie ihre Gültigkeit auch für $k>M$ und $k<n+M-N$ . Ich sehe deshalb nicht, dass man durch die Festlegung $\Omega =\{0,...,n\}$ irgendetwas verlieren würde. --Mathze (Diskussion) 21:20, 30. Jul. 2023 (CEST)Beantworten

(Maginaler) Fehler

Letzter Kommentar: vor 9 Monaten1 Kommentar1 Person ist an der Diskussion beteiligt

Wir erhalten also die Wahrscheinlichkeit

$P(X=3)=h(2|52;4;5)={\frac {{4 \choose 2}\cdot {48 \choose 3}}{52 \choose 5}}={\frac {103776}{2598960}}\approx 0{,}0399$

das heißt, in etwa vier Prozent der Fälle werden genau zwei Asse aufgedeckt.

Müsste das nicht X=2 heißen, unsere zwei Asse stellen die k in P(X=k) dar?

Folglich: $P(X=2)=h(2|52;4;5)={\frac {{4 \choose 2}\cdot {48 \choose 3}}{52 \choose 5}}={\frac {103776}{2598960}}\approx 0{,}0399$

Ich schreib das hier erstmal, bevor ich doch einen Flüchtigkeitfehler einbaue, und überlasse die Bewertung den Profis ;) --Aatwork (Diskussion) 19:55, 4. Mär. 2024 (CET)Beantworten

Abschnitt hinzufügen