Diskussion:Geburtstagsparadoxon/Archiv/001

Warum Variationen und nich Kombinationen??

Ich frage mich warum die Anzahl der möglichen/günstigen Ereignisse mit Variation berechnet werden. Ist die Reihenfolge nicht völlig irrelevant?

Auf welche Formel beziehst Du Dich und wie sollte sie Deiner Meinung nach richtig lauten? --NeoUrfahraner 16:58, 31. Dez 2005 (CET)

Ja, warum sind den die Möglichkeiten 365 hoch n? meiner Ansicht nach müssten es (365+1-n) über (n) sein, weil es doch wurscht ist in welcher Reihenfolge sie geburtstag haben...

Bei 2 Personen ist die Wahrscheinlichkeit, dass eine am 1.1. Geburtstag hat und eine am 1.2. doppelt so groß, wie die, dass beide am 1.1. Geburtstag haben (natürlich vorausgsetzt, alle Tage sind gleich wahrscheinlich und die Geburtstage sind unabhängig voneinander). Wir haben diesen Fall also korrekterweise doppelt gezählt. --217.86.161.131 17:07, 17. Okt. 2006 (CEST)

Ich persönlich verstehe durch die Antwort nicht, warum es sich hier um Variationen statt Kombinationen handeln soll. Ich bin nach wie vor der Meinung, dass die Reihenfolge der Geburtstage unerheblich ist und somit die Formeln für Kombinationen benutzt werden müssten. Das würde die Wahrscheinlichkeiten für zwei Geburtstage am selben Tag natürlich dramatisch steigern (über 70% bei 23 Personen), weshalb mir das seltsam vorkommt. Kann das vielleicht jemand detailliert und verständlich erläutern? -dfeng

Nochmal: Auf welche Formel beziehst Du Dich und wie sollte sie Deiner Meinung nach richtig lauten? --NeoUrfahraner 10:56, 3. Mai 2007 (CEST)

Nur zur Klarheit, ich bin nicht der Author von oben, habe mich bloß über dasselbe gewundert. Es geht uns um die Formeln:

 

und

 .

Diese sind ja die Formeln für Variationen, berücksichtigen also Reihenfolgen. Nun denken mein Vorauthor und ich, dass die Reihenfolgen egal sein und somit die entsprechenden Formeln für Kombinationen gelten müssten:

 

und

 

Vergleiche Formel auf der Wiki Seite unter dem Stichwort Kombinatorik. Vorsicht hier sind n und k vertauscht. -dfeng

Hm. Betrachte die Fälle:
  1. Anna hat am 1. Feb und Berta am 2. März Geburtstag
  2. Anna hat am 2. März und Berta am 1. Feb Geburtstag
Bedeutet beides das selbe? --NeoUrfahraner 13:22, 3. Mai 2007 (CEST)


Intuitiv würde ich sagen, dass beide dasselbe bedeuten, da uns ja egal ist, wer gemeinsam und an welchem Tag Geburtstag hat, da liegt mein Problem. Faktisch weiß ich, dass die im Beitrag verwendeten Formel korrekt sind, da man das mit einem Empirischen Test belegen kann. Die Frage ist nur, warum. -dfeng

Du lernst auf einer Party Anna und Berta kennen. Wie groß ist die Wahrschenlichkeit, dass die eine am 1. Feb und die andere am 2. März Geburtstag hat? --NeoUrfahraner 13:51, 3. Mai 2007 (CEST)

Die dürfte (1/365)² sein, aber das hilft hier nicht weiter. -dfeng

Und wie groß ist die Wahrscheinlichkeit, dass Anna am 1. Feb und Berta am 2. März Geburtstag hat? --NeoUrfahraner 16:33, 3. Mai 2007 (CEST)

Ok, die Wahrscheinlichkeit für das oberen müsste (2/365)*(1/365) sein, weil es für den ersten Geburstag 2 Möglichkeiten gibt. Die für eine spezielle Kombination ist dann (1/365)². Sehe aber ehrlich gesagt noch keinen direkten Zusammenhang und wäre für eine exakte Erklärung dankbar, weiter Raten mach t nur die Seite hier voller und unübersichtlicher. -dfeng

Ich vesuch's einmal so zu erklären: hier wird die naive Definition der Wahrscheinlichkeit als Anzahl der günstigen Fälle durch Anzahl der möglichen Fälle genommen. Mit dieser Definition könnte man als "Fall" die Kombinationen genau so gut nehmen wie die Variationen, das liefert aber unterschiedliche Ergebnisse. Diese naive Definition stimmt nämlich nur, wenn alle Fälle gleich wahrscheinlich sind. Im konkreten Fall sind alle Variationen gleich wahrscheinlich, alle Kombinationen hingegen nicht:
  1. Kombinationen: Die Wahrscheinlichkeit, dass eine am 1. Feb und die andere am 2. März Geburtstag hat ist größer als die Wahrscheinlichkeit, dass beide am 1. Feb Geburtstag haben.
  2. Variationen: Die Wahrscheinlichkeit, dass Anna am 1. Feb und Berta am 2. März Geburtstag hat ist gleich groß wie die Wahrscheinlichkeit, dass beide am 1. Feb Geburtstag haben und gleich große wie die Wahrscheinlichkeit, dass Anna am 2. März und Berta am 1. Feb Geburtstag hat
Alle Variationen sind gleich wahrscheinlich, daher darf die Formel "günstige durch mögliche" für die Variationen genommen werden. Im Artikel kommt das aber zugegebenermaßen nicht deutlich genug raus. --NeoUrfahraner 17:23, 3. Mai 2007 (CEST)

Das war jetzt eine sehr gute und schlüssige Erklärung, danke! Du schriebst "naive Wahrscheinlichkeit". Gibt´s da noch eine bessere Möglichkeit? Diese Form der Wahrscheinlichkeit liefert ja bei empirischen Tests schon sehr exakte Ergebnisse. -dfeng

Siehe Wahrscheinlichkeitsbegriff. Was ich als "naive Wahrscheinlichkeit" bezeichnet habe, heißt dort "klassische oder Laplacesche Auffassung". Mit "naiv" meine ich auch nicht, dass dieser Wahrscheinlichkeitsbegriff generell falsch ist, sondern vielmehr, dass er genauer hinterfragt gehört (und im 20. Jahrhundert auch wurde). --NeoUrfahraner 11:58, 4. Mai 2007 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: Maxus96 02:01, 28. Mai 2009 (CEST)

Hypergeometrische Verteilung und andere Ergänzungen

Zu http://de.wikipedia.org/w/index.php?title=Geburtstagsparadoxon&diff=32623621&oldid=32218207 und http://de.wikipedia.org/w/index.php?title=Geburtstagsparadoxon&diff=32648514&oldid=32623621 : Dir Größe der Grundgesamtheit "Menscheit" ("z.B. 365 000 Menschen") ist völlig irrelevant. Es geht darum, dass jeder der n betrachteten Personen eine iid (unabhängig und identisch verteilte) Zufallszahl g ("Geburtstag") aus der diskrteten Gleichverteilung auf (1,...,365) (Grundgesamtheit) zugeordnet wird. Es werden also nicht n Personen zufällig gewählt ("was im Urnenmodell einer Ziehung von n Kugeln ohne Zurücklegen entspricht"), sondern umgekeht, aus einer Urne mit 365 Kugeln (die mit 1. Jan bis 31. Dez. beschriftet sind) n Kugeln mit Zurücklegen gezogen. --NeoUrfahraner 15:19, 2. Jun. 2007 (CEST)

Hallo, die Größe der Grundgesamtheit "Menschheit" ist sehr wohl relevant. Angenommen die "Menschheit" besteht aus 730 Personen, deren Geburtstage so auf das Jahr verteilt sind, dass je zwei Personen am selben Kalendertag Geburtstag feiern. Dann muss die Stichprobe sehr viel umfangreicher als n=23 sein um zu erreichen, dass die Wahrscheinlichkeit, dass zwei Personen an einem Tag Geburtstag haben, mehr als 50% beträgt. Gruß --172.180.66.241 00:56, 3. Jun. 2007 (CEST)
Im von Dir angegeben Fall ist die Voraussetzung, dass "die Geburtstage der n Personen unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" sind nicht erfüllt, dieser Fall ist somit in meiner Formulierung bereits ausgeschlossen. --NeoUrfahraner 21:20, 3. Jun. 2007 (CEST)
Da also kein Einwand kommt, habe ich wieder die Version 16:49, 2. Jun. 2007 hergestellt. --NeoUrfahraner 07:59, 5. Jun. 2007 (CEST)
Du weißt hoffentlich, dass deine Formulierung nicht der originalen Problemstellung entspricht. Das Geburtstagsproblem lautet:"Wie hoch ist die Wahrscheinlichkeit dafür, dass bei 23 anwesenden Personen mindestens zwei am gleichen Tag Geburtstag haben?" Es geht also um 23 verschiedene Personen, die aus einer (unbekannten) Grundgesamtheit zufällig ausgewählt werden müssen (was im Urnenmodell einer Ziehung von n Kugeln ohne Zurücklegen entspricht; Modell 1). Also ist der Umfang der Grundgesamtheit von zentraler Bedeutung für die Berechnung.
Deine Formulierung entspricht der Problemstellung:"Wie hoch ist die Wahrscheinlichkeit dafür, dass bei 23-maliger Zufallswahl einer Person aus einer gleichbleibenden Grundgesamtheit von 365 Personen mindenstens eine Person zweimal ausgewählt wird?" Es geht also um 365 verschiedene Personen, aus denen 23 mal eine Zufallsstichprobe von 1 Person genommen werden muss (was im Urnenmodell einer Ziehung von n Kugeln mit Zurücklegen entspricht; Modell 2)
Wichtig ist nun die Begründung dafür, warum das Ursprungsproblem Modell 1 durch das Modell 2 ersetzt werden darf. Ohne diese Begründung ist die mathematische Argumentation lückenhaft, und es ist nicht einsehbar, dass die Behauptung "die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" gültig sein soll. Strenggenommen ist sie nämlich nicht gültig! Schließlich ist der Umfang der Grundgesamtheit "Menschheit" endlich. --62.180.196.84 19:36, 5. Jun. 2007 (CEST)
Die Bedingung "die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" ist auch nie exakt erfüllt. Es wird lediglich für die Rechnung als Modellannahme hergenommen. Die Endlichkeit der Menschheit ist aber auch nicht das Problem. Nimm 100 Mädchen zwischen 6 und 10 Jahren, warte ein paar Jahre bis die ersten 23 davon Kinder haben und versammle die 23 Erstgeborenen in einem Raum. Zweifelst Du daran, dass iid in diesem Fall ein schlechtes Modell für die Geburtstagsverteilung ist? --NeoUrfahraner 22:21, 5. Jun. 2007 (CEST)
Du sagst:"Die Bedingung "die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" ist auch nie exakt erfüllt." Das stimmt, aber die zugrundeliegende Gesamtheit wird als so groß sowie deren Verteilung derart angenommen, dass der Rechenfehler sehr gering ausfällt.
Deine Frage lässt sich so nicht beantworten. Vor einer Berechnung muss zuerst die Grundgesamtheit und deren Verteilung angegeben werden. Erst dann kann man eine Aussage über eine Stichprobe machen. Wenn du annimmst, die Grundgesamtheit und die Stichprobe könnten identisch sein mit 23 Personen, dann unterliegst du einem logischen Irrtum. Denn die 23 Neugeborenen können niemals diskret auf 365 Jahrestage gleichverteilt werden. Du brauchst stattdessen mindestens 730 Personen, um eine sinnvolle diskrete Gleichverteilung (von 2 pro Tag) herzustellen.
Solange du nur mit den Jahrestagen argumentierst und nicht das Ursprungsproblem Modell 1 betrachtest, bleibst du in einem logischen Zirkel gefangen. --62.180.196.41 23:39, 5. Jun. 2007 (CEST)
Woher kommen denn in Deutschland die Geburtstage der im Jahr 2007 Neugeborenen? Erzeugt der Staat da eine Grundgesamtheit von 3,65 Mio Kindern, von denen je 10 000 am selben Tag Geburtstage haben, zieht daraus zufällig eine knappe Million Kinder ohne Zurücklegen und schmeißt am Jahresende die verbliebenen weg? Oder kommen die Geburtstage vielleicht doch aus einer anderen Grundgesamtheit? --NeoUrfahraner 08:13, 6. Jun. 2007 (CEST)
Vielleicht noch zur Klarstellung: Ich rede nicht von Stichproben, sondern von Zufallsvariablen. --NeoUrfahraner 08:41, 6. Jun. 2007 (CEST)
Die Geburtstage sind ja nichts anderes als nummerierte Schachteln, die benutzt werden, um die Neugeborenen hineinzulegen. Jede Person erhält also solch eine Nummer. Die Grundgesamtheit besteht sinnvollerweise zum Schluss aus den Personen bzw. deren Nummernzettel in einer Urne, wobei jede Nummer sooft vorkommt wie Personen an diesem Tag Geburtstag haben. Daraus werden nun 23 Nummernzettel ohne Zurücklegen gezogen.
Du behauptest stattdessen, dass die Geburtstage selbst, also die nummerierten Schachteln, die Grundgesamtheit bilden müssten. Das macht aber keinen Sinn, denn wenn du am Ende des Jahres 2007 eine der Schachteln auswählst, hast du mit einer sehr großen Wahrscheinlichkeit mehr als ein Baby in dieser Schachtel. Du benötigst also bestimmt keine 23 Schachteln, um im Durchschnitt mehr als ein Neugeborenes pro Tag zu finden.
Solange du dich nicht von dem Modell 2 gedanklich lösen kannst, wirst du die eigentliche Problemstellung verfehlen. Das gilt unabhängig davon, welchen mathematischen Apparat du verwenden willst. Zuerst sollte das Problem klar erkannt werden, dann kann man über technische Details reden. --62.180.196.75 19:32, 6. Jun. 2007 (CEST)
Kurze Antwort: Modell 2 war ja schon in Deiner Version 14:49, 2. Jun. 2007 vorhanden. Es geht ja nur um die Frage, ob man dazu als Voraussetzung unbedingt eine große Grundgesamtheit braucht. Da wir uns anscheinend nicht einigen können und Du jetzt ohne Diskussion auch noch aus der richtigen Binomialverteilung eine falsche Hypergeometrische Verteilung machst, gehe ich zurück auf die Version 17:37, 23. Mai 2007 Trublu, bevor einer von uns was zum strittigen Thema gesagt hat. --NeoUrfahraner 15:58, 7. Jun. 2007 (CEST)
Die Hypergeometrische_Verteilung ist an dieser Stelle genau richtig, denn es geht um Versuche ohne Zurücklegen (Modell 1). Das entspricht Situationen, bei denen sich die Gesamtzahlen und damit die Chancen für Erfolg und Misserfolg von Teilschritt zu Teilschritt ändern. Wenn eine Person A ausgewählt wurde, gehört sie nicht mehr zur restlichen Gesamtheit, aus der weitere Personen gezogen werden. Die Wahrscheinlichkeit, eine weitere Person B mit demselben Geburtstag zu ziehen, vermindert sich, weil die Besetzungszahl dieses Kalendertages sich um die Person A verkleinert hat. Andererseits erhöht sich die Wahrscheinlichkeit, eine bestimmte andere Person zu ziehen, weil die Grundgesamtheit sich ebenfalls verkleinert hat. Deswegen ist es wichtig zu wissen:
1. Wie groß ist die Grundgesamtheit
2. Wie groß ist die (durchschnittliche) Besetzungszahl pro Kalendertag.
Beispiel: Die Grundgesamtheit bestehe aus 730 Personen, von denen jeweils 2 am gleichen Kalendertag Geburtstag haben. Wir haben dann eine Gleichverteilung mit der Besetzungszahl 2. Wenn wir nun 23 Personen zufällig auswählen und berechnen, wie groß die Wahrscheinlichkeit für mindestens einen doppelten Geburtstag ist, erhalten wir als Ergebnis  . Bei Anwendung von Modell 2 hätten wir jedoch  . Da macht sich der Modellunterschied deutlich bemerkbar.
Die Binomialverteilung wird übrigens im Artikel gar nicht benutzt. Stattdessen wird über plausible Annahmen eine Gegenwahrscheinlichkeit berechnet. --62.180.196.71 17:17, 8. Jun. 2007 (CEST)
Hast Du den Artikel überhaupt gelesen? Dann wüßtest Du, dass die Binomialverteilung für eine andere Frage, nämlich für die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag Geburtstag hat verwendet wird. Und nochmals: Du gehst davon aus, dass die 23 Personen eine Stichprobe aus einer Grundgesamtheit mit einer bekannten Zusammensetzung sind. Davon steht aber im Artikel nichts, und diese Annahme ist auch unnötig. Siehe Dein Satz oben: Jede Person erhält also solch eine Nummer. (19:32, 6. Jun. 2007) Wer vergibt diese Nummern? Sind diese Nummern auch Stichproben aus einer Grundgesamtheit? --NeoUrfahraner 17:45, 8. Jun. 2007 (CEST)
Hast Du den Artikel überhaupt gelesen? Dann wüßtest Du, dass die Binomialverteilung auch nicht für die andere Frage, nämlich für die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag Geburtstag hat verwendet wird. Auch hier wird über plausible Annahmen eine Gegenwahrscheinlichkeit berechnet.
Du sagst:"Davon steht aber im Artikel nichts". Das ist ja gerade einer der großen Mängel des Artikels, dass dort die Voraussetzungen, die die Benutzung des Modells 2 erst möglich machen, nicht explizit ausgesprochen werden.
Die Nummern vergibt z.B. ein Amt. Diese Nummern sind natürlich keine Zufallsstichproben, sondern werden dem Geburtstag der Person entsprechend vergeben. Wenn z.B. der 10.Mai der "rote" Tag im Jahr ist, dann wird für jedes an diesem Tag Neugeborene eine rote Kugel in die große Urne mit der Grundgesamtheit gelegt. Außerdem werden die Kugeln, die Tote repräsentieren, aus der Urne entfernt. Das Geburtstagsproblem befasst sich ja explizit nur mit lebenden Personen. Somit ist in der Urne jede Farbe mit soviel Kugeln vertreten wie lebende Personen an diesem "Farbtag" geboren wurden.
Soweit erstmal. Jetzt aber mal eine Frage: bist du überhaupt in der Lage, meine Argumentation nachzuvollziehen? Kannst du oder willst du meine Argumente nicht verstehen? Ich gewinne langsam den Eindruck, dass ich gegen eine Wand schreibe... --62.180.196.7 21:15, 8. Jun. 2007 (CEST)
Ich habe soeben eine korrektere Fassung des Artikels eingestellt. Wir können gerne darüber diskutieren, wenn du etwas nicht verstehst. Aber lass bitte diese Fassung solange stehen, bis wir zuende diskutiert haben. --62.180.196.7 21:21, 8. Jun. 2007 (CEST)
Umgekehrt. Solande kein Konsens zur Änderung besteht, bleibt die alte Fassung. --NeoUrfahraner 08:04, 9. Jun. 2007 (CEST)
Selbstverständlich verstehe ich Deine Argumentation: siehe oben: "Du gehst davon aus, dass die 23 Personen eine Stichprobe aus einer Grundgesamtheit mit einer bekannten Zusammensetzung sind." --NeoUrfahraner 08:17, 9. Jun. 2007 (CEST)

Amüsante Diskussion. Die aktuelle (i. e. Neourfahraners) Version beschreibt das Geburtstagsparadoxon so, wie es in der Literatur vorkommt und sollte daher jeder anderen Version vorgezogen werden, Stichwort Wikipedia:Theoriefindung. Was man selbst von der i.i.d. diskreten Gleichverteilung auf den Tagen des Jahres hält und wie man das glaubt "verbessern" zu können, ist für die Wikipedia unerheblich, sondern eine Frage für die Wissenschaft. Wenn sich die Version der IP dann durchgesetzt hat, wird auch der Artikel abgeändert. --Scherben 08:44, 9. Jun. 2007 (CEST)

Ich verstehe nicht ganz: in der Literatur kommt die aktuelle Version mit gleichwahrscheinlichen Geburtstagen nicht vor, wenn es um realistisch ungleichmäßig verteilte Geburtstage geht. Das ist ja auch ein wichtiger Punkt im Artikel, der durch alle 4 Literaturangaben belegt wird. Niemand, auch ich nicht, zweifelt daran, dass die einfache Lösung mit Modell 2 eine gute Näherung darstellt. Man sollte allerdings verstehen, warum das so ist, und genau das ist mein Anliegen hier. Meine Ergänzungen im Artikel stellen ja den Lösungsansatz nicht in Frage und verändern den Artikel nicht grundsätzlich, sondern sollen den Leser darauf hinweisen, dass es zu jedem Rechenmodell bestimmte Randbedingungen und Annahmen gibt. Wenn man diese Annahmen nicht nennt, kann ein unbedarfter Leser den Lösungsansatz hier als allgemeingültig missverstehen, so wie es NeoUrfahraner offensichtlich tut.
Ich habe weiter oben (17:17, 8. Juni) gezeigt, dass eine Beispielrechnung gemäß Modell 1 (Ziehung von Personen ohne Zurücklegen), welches 100%ig der Problemstellung entspricht, ein anderes Ergebnis bringen kann als die Rechnung gemäß Modell 2 (Ziehung von Geburtstagen mit Zurücklegen). Was das mit Theoriefindung zu tun haben soll, musst du mir mal erklären. Zumal die Rechnungen bei ungleichmäßig verteilten Geburtstagen nach Modell 2 (alle Geburtstage sind immer gleichwahrscheinlich) sowieso keinen Sinn machen. --62.180.196.112 15:27, 9. Jun. 2007 (CEST)
Eigentlich wollte ich mich nicht mehr zum Thema äußern; trotzdem noch ein kurze Anmerkung: "In der Literatur kommt die aktuelle Version mit gleichwahrscheinlichen Geburtstagen nicht vor, wenn es um realistisch ungleichmäßig verteilte Geburtstage geht." Das stimmt. Ein gutes Beispiel ist ja z.B. der zitiert Bloom, D. (1973). Der wesentliche Punkt dabei ist aber, dass bei D. Bloom zwar nicht mehr alle 365 Tage gleich wahrscheinlich sind, die Geburtstage aber weiterhin i.i.d. sind. Modell 1 (Ziehen ohne Zurücklegen) ist aber nicht i.i.d. Die Aussage dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben gilt ebenfalls nur für i.i.d.; beim Ziehen ohne Zurücklegen hingegen hängt es wesentlich von der Zusammensetzung der Grundgesamtheit ab, ob die Wahrscheinlichkeit für doppelte Geburtstage zu- oder abnimmt. Das Geburtstagsparadoxon ist außerdem weniger für sich selbst als wegen der Anwendungen interessant (z.B. Geburtstagsangriff), und in den Anwendungen interessiert man sich ebenfalls üblicherweise nur für den i.i.d. Fall. Sofern Du nicht irgendwelche Literaturstellen anbieten kannst, die den nicht-i.i.d. Fall (Ziehen ohne Zurücklegen) als relevant für das Geburtstagsparadox ansehen, sehe ich das Thema als abgeschlossen. --NeoUrfahraner 22:22, 9. Jun. 2007 (CEST)
Du sagst:"dass bei D. Bloom zwar nicht mehr alle 365 Tage gleich wahrscheinlich sind, die Geburtstage aber weiterhin i.i.d. sind". Ja und? Das funktioniert ja nur deswegen, weil wie auch bei Hugo Pförtner die Besetzungszahlen eines Tages mit mehreren Tausend Personen so hoch sind, dass der Rechenfehler entsprechend vernachlässigt werden kann. Da wird aus rechentechnischen Gründen dieselbe Vereinfachung vorgenommen wie im Artikel.
i.i.d. hat nichts mit den "Besetzungszahlen eines Tages" zu tun, sondern damit, ob Du mit oder ohne Zurücklegen ziehst. --NeoUrfahraner 10:18, 11. Jun. 2007 (CEST)
Es hat was damit zu tun, ob die Wahrscheinlichkeit p eines Geburtstages dieselbe bleibt, egal ob dieser schon einmal gezogen wurde oder nicht. i.i.d. heißt auch, dass p als nicht veränderlich angenommen wird. Bei einer Besetzungszahl von 8000 für diesen Tag und einem Grundgesamtheitsumfang von 2920000 ist  . Bei Ziehung ohne Zurücklegen wäre die neue Besetzungszahl 7999 für diesen Tag und damit  , eine Abweichung von 0,00034246575/1000. Dieser Fehler wird zwecks Vereinfachung (Ziehung mit Zurücklegen) billigend in Kauf genommen. --62.180.196.26 20:56, 11. Jun. 2007 (CEST)
Glaubst Du ernsthaft, dass die Wahrscheinlichkeit, dass der nächste Papst am 16. April Geburtstag hat, geringer wird, bloß weil der jetzige Papst am 16. April Geburtstag hat? --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)
Wie würdest du diese Wahrscheinlichkeit denn berechnen? --62.180.196.83 19:51, 12. Jun. 2007 (CEST)
Beantworte Du zuerst meine Frage. --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)
Ich habe dir hier schon so viel vorgerechnet, jetzt bist du mal dran. Also... --62.180.196.68 15:01, 13. Jun. 2007 (CEST)
Beantworte Du zuerst meine Frage. --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)
Dazu müsste man zunächst mal wissen, ob die Papstwahl etwas mit dem Geburtstag der in Frage kommenden Kardinäle zu tun hat. Es könnte auch sein, dass unter den Kardinälen nur der jetzige Papst war, der am 16. April geboren wurde, und damit würde der nächste Papst mit Sicherheit nicht an diesem Tag geboren sein. Man muss also etwas über die Grundgesamtheit wissen, um eine sinnvolle Aussage machen zu können.
Wenn du behauptest, mit Modell 2 etwas über eine unbekannte Grundgesamtheit aussagen zu können, dann stimmt das so nicht. Denn du setzt ja Gleichverteilung usw. voraus, stützt dich also auf Annahmen, die eine schon bekannte Grundgesamtheit beschreiben. Damit widersprichst du dir.
Was ist denn nun die Wahrscheinlichkeit dafür, dass der nächste Papst am 16. April Geburtstag hat? --62.180.196.18 22:10, 14. Jun. 2007 (CEST)
Ich setze sie in erster Näherung mit 1/365,25 an, jedenfalls völlig unabhängig vom Geburtstdatum des aktuellen Papstes. Da Du allerdings ständig von "Grundgesamtheit" sprichst - kann es sein, dass Du mit Deiner Wahrscheinlichkeitsauffassung im 19. Jahrhundert stecken geblieben bist und nur den Laplaceschen Wahrscheinlichkeitsbegriff kennst? --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)
Ich glaube nicht, dass für die Papstwahl 365,25 Kardinäle (oder Vielfache davon) in Frage kommen, deren Geburtstage auch noch über das Jahr gleichverteilt sein müssten.
Wenn dir der Begriff "Grundgesamtheit" suspekt ist, dann hast du dich wohl nie wirklich mit Wahrscheinlichkeitstheorie beschäftigt. Lies doch einfach mal diesen Artikel oder Literatur dazu. Auch in anderen Artikeln wird dieser Begriff richtigerweise verwendet.
Der Laplacesche Wahrscheinlichkeitsbegriff ist für die Betrachtungen hier völlig ausreichend. Allerdings müsstest du ein Grundverständnis dafür mitbringen, wie man für konkrete Problemstellungen mathematische Lösungsmodelle entwickelt. Mit einem rein axiomatischen (und deduktiven) Wahrscheinlichkeitsbegriff bist du dazu aber vielleicht gar nicht in der Lage. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)
Zur "Grundgesamtheit" siehe meinen nächsten Beitrag weiter unten. Mein Grundverständnis ist irrelevant, relevant ist vielmehr was in der Literatur zum Geburtstagsparadoxon steht. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)
Du sagst:"Die Aussage dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben gilt ebenfalls nur für i.i.d.". Warum das denn? Nimm z.B. eine Geburtstagsverteilung von 730 Personen auf 365 Tage derart an, dass an 182 Tagen keine, an 182 Tagen genau zwei Personen und am 365. Tag 366 Personen Geburtstag haben. Man sieht schon ohne Rechnung, dass es im Durchschnitt nur weniger Ziehungen bedarf, um mit   zwei Personen vom gleichen Tag zu erhalten.
"beim Ziehen ohne Zurücklegen hingegen hängt es wesentlich von der Zusammensetzung der Grundgesamtheit ab, ob die Wahrscheinlichkeit für doppelte Geburtstage zu- oder abnimmt." Für eine andere Zusammensetzung der Grundgesamtheit kann die Wahrscheinlichkeit abnehmen. --NeoUrfahraner 09:41, 11. Jun. 2007 (CEST)
Dieser Punkt ist eigentlich nicht sehr wichtig für die Relevanz meiner Ergänzungen. Aber interessehalber: Könntest du mir ein Beispiel nennen? --62.180.196.26 20:56, 11. Jun. 2007 (CEST)
Wenn in der Grundgesamtheit kein Geburtstag doppelt vorkommt, kann auch in keiner Stichprobe ein Geburtstag doppelt vorkommen. --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)
Das ist der triviale Fall, der in der Wirklichkeit auch vorkommen kann. Dieser Fall wird z.B. durch Modell 2 gar nicht erfasst. Das heißt, die Rechnung mit i.i.d. würde glatt fehlschlagen und eine unsinniges Ergebnis erbringen. Aber nenn mir doch bitte einen nichttrivialen Fall! --62.180.196.83 19:51, 12. Jun. 2007 (CEST)
Der triviale Fall reicht als Beweis meiner Ausssage. --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)
Das ist doch kein Beweis deiner Aussage. Du sagtest weiter oben:"Beim Ziehen ohne Zurücklegen hingegen hängt es wesentlich von der Zusammensetzung der Grundgesamtheit ab, ob die Wahrscheinlichkeit für doppelte Geburtstage zu- oder abnimmt." Im trivialen Fall ändert sich diese Wahrscheinlichkeit beim Ziehen überhaupt nicht, weil immer   gilt, sie nimmt also auch nicht ab. --62.180.196.68 15:01, 13. Jun. 2007 (CEST)
Genau. Dieser Wert ist niedriger als die angegebenen "mehr als 50%" für 23 Personen. Ziehst Du hingegen mit Zurücklegen 23 Kugeln aus einer Urne, die eine beliebige Mischung von Kugeln mit der Aufschrift "1.Jan" bis "31. Dez" enthält, so ist die Warhscheinlichkeit, dass dabei zwei Kugeln mit der gleichen Aufschrift gezogen werden, immer größer als 50%, unabhängig von der konkreten Zusammensetzung der Kugelmischung in der Urne. --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)
Deshalb ist dein Ergebnis für den trivialen Fall auch falsch; Modell 2 ergibt hier einen unsinnigen Wert, weil du Annahmen über die Grundgesamtheit machst, die nicht stimmen. --62.180.196.18 22:10, 14. Jun. 2007 (CEST)
Es geht hier nich um mein Ergebnis, sondern um die Aussage von D. Bloom. Du zweifelst also die Ergebnisse der Fachliteratur an? --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)
Du sagtest oben:"Wenn in der Grundgesamtheit kein Geburtstag doppelt vorkommt, kann auch in keiner Stichprobe ein Geburtstag doppelt vorkommen." Damit stellst du selbst dein Modell und die Aussage von D. Bloom in Frage. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)
Nein, es ist ganz einfach so, dass bei Bloom keine bekannte Grundgesamtheit vorkommt. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)
Du sagst:"in den Anwendungen interessiert man sich ebenfalls üblicherweise nur für den i.i.d. Fall". Na klar, dieser Fall ist ja auch wesentlich leichter zu implementieren als der andere Fall mit sich ändernden Wahrscheinlichkeiten. Das ist aber kein Grund, die Vereinfachungen, die den Lösungsweg nach Modell 2 plausibel machen, nicht wenigstens im Artikel zu erwähnen.
Beim Geburtstagsangriff gibt es keine "sich ändernden Wahrscheinlichkeiten". --NeoUrfahraner 09:41, 11. Jun. 2007 (CEST)
Ja klar, weil nach Modell 2 gearbeitet wird. Bei Modell 1 ändert sich die Wahrscheinlichkeit p eines Geburtstages jedesmal, wenn dieser Geburtstag gezogen worden ist. Das entspricht ja eigentlich auch der Wirklichkeit und der Problemstellung des Geburtstagsproblems. Im Übrigen ist es unsinnig, von einer "Anwendung des Geburtstagsparadoxons" zu sprechen. Man kann eine Formel oder eine Theorie anwenden, aber keine Problemstellung. --62.180.196.26 20:56, 11. Jun. 2007 (CEST)
Inwiefern entspricht Modell 1 der "Wirklichkeit" des Geburtstagsangriffs? Erleichtert Modell 1 Dir irgendwie das Finden eines doppelten Hashwertes? --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)
Ich schrieb:"Wirklichkeit und der Problemstellung des Geburtstagsproblems" und nicht des "Geburtstagsangriffs". Wer lesen kann ist klar im Vorteil. --62.180.196.83 19:51, 12. Jun. 2007 (CEST)
Und ich schrieb vorher Beim Geburtstagsangriff gibt es keine "sich ändernden Wahrscheinlichkeiten". --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)
Du nimmst hier einfach einen anderen Artikel, auf den in diesem Zusammenhang als "Anwendung" verwiesen wird, und willst ihn als Kronzeugen dafür benutzen , dass dieser Artikel keiner Ergänzungen bedarf. Das ist Unfug, und zwar in doppelter Hinsicht: 1. Wie schon erwähnt gibt es keine Anwendung eines Problems in der Wissenschaft und 2. Es ist für einen Artikel unerheblich, ob ein anderer Artikel Lösungsansätze daraus verwendet, Hauptsache diese Ansätze werden im Artikel diskutiert uns sind nicht falsch. Das hindert aber nicht daran, weitere korrekte Ansätze aufzunehmen, die in anderen Artikeln momentan nicht verwendet werden. --62.180.196.68 15:01, 13. Jun. 2007 (CEST)
Also stimmt jetzt meine Aussage Beim Geburtstagsangriff gibt es keine "sich ändernden Wahrscheinlichkeiten"? --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)
Diese Aussage ist für die Diskussion und den Artikel hier völlig irrelevant. --62.180.196.18 22:10, 14. Jun. 2007 (CEST)
Du drückst Dich schon wieder von einer Antwort. --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)
Du versuchst dauernd, die Diskussion zu zerfasern in zum Teil hier unwichtige Detailfragen. Wenn du den Artikel Geburtstagsangriff diskutieren willst, dann suche dir jemanden dort. Für mich ist dieser Diskussionsstrang hier irrelevant. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)
Was für Dich irrelevant ist, zählt nicht; was zählt ist, dass in der Literatur zum Geburtstagsparadoxon der Geburtstagsangriff sehr wohl relevant ist. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)
Du sagst:"Sofern Du nicht irgendwelche Literaturstellen anbieten kannst..." Ich glaube, dass die meisten Wikipedia-Artikel Sätze und Formulierungen beinhalten, die so nicht in der Literatur zu finden sind. Das wäre ja auch eine eklatante Verletzung von Copyright-Rechten.
Ein sauberes Zitat ist keine Urheberrechtsverletzung, ansonsten siehe WP:ZIT und WP:Q. --NeoUrfahraner 09:41, 11. Jun. 2007 (CEST)
Ich brauche doch keine Zitate, wenn ich in einem Artikel eine Aufgabenstellung beschreiben möchte. Das ergibt sich doch aus dem Verständnis der jeweiligen Autoren. Ansonsten müssten alle Wikipedia-Artikel mit Zitaten und deren Quellenangaben so gespickt sein, dass sie dann nicht mehr lesbar wären. Außerdem kann ich deine Bedenken überhaupt nicht nachvollziehen. Der Artikel verliert durch die Ergänzungen nichts von seinem Gehalt; der theoretische Ansatz wird für den Leser allerdings besser nachvollziehbar, und man beugt Missverständnissen, wie sie bei dir scheinbar auftreten, vor. Wenn du Probleme mit meinen Formulierungen hast, kann man da ja drüber reden, aber inhaltlich hast du meinen Ergänzungen bisher nichts entgegensetzen können. Du trittst hier nur als Blockierer auf ohne erkennbaren Willen zur konstruktiven Arbeit, z.B:
Die komplette "i.i.d.-Diskussion" ist völlig absurd, denn im i.i.d.-Postulat stecken ja die ganzen Vereinfachungen, welche ich explizit im Artikel begründen möchte, schon drin. Also, was soll das? --62.180.196.26 20:56, 11. Jun. 2007 (CEST)
Ist Deine Begründung des i.i.d. Postulats die einzig Mögliche? --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)
Allerdings, weil es hier um die Begründung geht, warum man Modell 1 (reale Bedingungen) durch Modell 2 (idealisierte Bedingungen) ersetzen darf ohne einen allzu großen mathematischen Fehler zu machen. --62.180.196.83 19:51, 12. Jun. 2007 (CEST)
Nun, ich gab am 5.6.2007, 22:21 eine andere Begründung, nämlich Geburtstage sind i.i.d. weil Schwangerschaften (nur Tag und Monat betrachtet, Jahreszahl vernachlässigt) i.i.d. sind. --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)
Diese i.i.d.-Diskussion bringt bisher überhaupt keinen Erkenntnisgewinn. Weder kann damit das Modell 1 in Frage gestellt werden noch liefert es Argumente für Modell 2. Es ist eine rein formale Diskussion ohne inhaltliche Relevanz. Was meinst du denn konkret damit:"Geburtstage sind i.i.d. weil Schwangerschaften (nur Tag und Monat betrachtet, Jahreszahl vernachlässigt) i.i.d. sind"? --62.180.196.68 15:01, 13. Jun. 2007 (CEST)
Doch, es liefert Argumente für Modell 2. Was ich damit meine, habe ich schon am 5.6.2007, 22:21 erklärt. Wenn Du eine fixe Menge von Mädchen hernimmst (z.B. 100 Stück) und nach ein paar Jahren die Geburtstage der Erstgeborenen ansiehst, so sind diese Daten i.i.d., also wenn das erste Mädchen ihre erstes Kind am 13. Juni gebiert, so ändert sich die Wahrscheinlichkeit nicht, dass das zweite Mädchen beispielsweise ihr erstes Kind am 12. Juni gebiert. Dieses Experiment kannst Du beliebig oft wiederholen und meine Aussage ist, dass sich die Geburtstage nicht statistisch signifikant von i.i.d. Realisierungen einer Zufallsgröße auf der Menge {1.Jan ... 31.Dez} unterscheinden. --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)
Aus welcher Grundgesamtheit (Alter, Kultur, ehelicher Stand usw.) stammen deine Mädchen eigentlich? Wie sind ihre Monatszyklen verteilt und wie ist das Sexleben mit ihren Männern beschaffen? Haben alle den gleichen Kinderwunsch, vielleicht sogar zur gleichen (Jahres-)Zeit? Du versuchst hier etwas zu beweisen, was du schon in bestimmte Voraussetzungen hineinstecken musst: dass nämlich all diese Bedingungen zusammengenommen schon "i.i.d." sind. Da beißt sich die Katze in den Schwanz (aus i.i.d. folgt i.i.d.), oder wie ich weiter oben (23:39, 5. Juni) schon bemerkt habe:"...bleibst du in einem logischen Zirkel gefangen". --62.180.196.18 22:10, 14. Jun. 2007 (CEST)
Also wenn ich alle die Details weiß, brauche ich keine Wahrscheinlichkeitsrechnung - dann ist es ja schon fast deterministisch. Ich vermute immer mehr, dass Du nicht über die Laplacesche Wahrscheinlichkeitsauffassung hinausgekommen bist. --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)
Du verwechselst Wahrscheinlichkeitsrechnung mit Statistik. Das sind zwei verschiedene Paar Stiefel. Für erstere werden die Grundgesamtheiten immer als bekannt vorausgesetzt (Münze mit zwei Seiten, Würfel mit 6 Seiten, Urnen mit Mischungen von Kugeln usw.). Bei zweiterer werden vorwiegend unbekannte Grundgesamtheiten mittels Stichproben auf ihre Zusammensetzung untersucht. Dabei müssen Fehler berücksichtigt und/oder Schätzungen vorgenommen werden. Dies ist beim Geburtstagsproblem nicht erforderlich, weswegen dieses Problem zu Ersterer gehört. Das hat nichts mit einer bestimmten Wahrscheinlichkeitsauffassung zu tun. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)
Ob ich etwas verwechsle, ist egal. Was vielmehr zählt, ist die Literatur zum Geburtstagsproblem, und die setzt eben keine bekannte Grundgesamtheit voraus. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)
Außerdem: es gibt keine "Theorie des Geburtstagsproblems", die irgendwo festgeschrieben sein könnte. Es gibt aber eine Wahrscheinlichkeitstheorie und es gibt das Geburtstagsproblem, welches mithilfe jener gelöst werden kann. Die Wahrscheinlichkeitstheorie bietet verschiedene Modelle an für unterschiedliche Problemstellungen. Und hier geht es darum, die passenden Modelle vorzustellen und zu begründen, warum man sich für eines dieser Modelle entscheidet. Das hat nichts mit Theoriefindung zu tun, und einer Literaturangabe bedarf es deshalb auch nicht. Ein Einwand gegen meine Ergänzungen wären nur dann legitim, wenn diese mathematisch nicht korrekt wären. --62.180.196.10 16:09, 10. Jun. 2007 (CEST)

Noch zur hypergeometrischen Verteilung: genausogut wie Du (grundlos) annimmst, dass die 23 Personen Stichprobe aus einer einzigen Grundgesamtheit sind, kann ich behaupten, dass die eine Fußballmanschaft aus einer Grundgesamtheit und die anderen Fußballmannschaft aus einer anderen Grundgesamtheit und der Schiedsrichter aus einer dritten Grundgesamtheit kommen. Dann hilft Dir die hypergeometrischen Verteilung auch nichts, sondern die Sache wird komplizierter. Vielleicht sind auch alle 23 Personen aus 23 Grundgesamtheiten (die erst aus Aachen, die zweite aus Bonn, ...), dann hat man immerhin unabhängige, wenn auch nicht identische Verteilungen. Solange also nichts konkret darüber gesagt wird, wie die 23 Personen ausgewählt wurden, gibt es keinen Grund, die hypergeometrische Verteilung im Artikel zu erwähnen. --NeoUrfahraner 16:35, 13. Jun. 2007 (CEST)

Grade auch wenn die Grundgesamtheiten verschieden sein könnten, macht es Sinn, die hypergeometrische Verteilung im Artikel zu erwähnen. Denn mit ihr kann eine sinnvolle Betrachtung des Problems durchgeführt werden. Man kann z.B. die betreffenden Grundgesamtheiten zusammenfassen, oder die einzelnen Grundgesamtheiten nacheinander für sich betrachten. Wenn z.B. die einzelnen der 23 Grundgesamtheiten aus Personen bestehen, die am selben Tag Geburtstag haben, wobei in jeder Grundgesamtheit ein anderer gemeinsamer Geburtstag gefeiert wird, dann versagt Modell 2 wieder einmal, während Modell 1 das korrekte Ergebnis liefert, nämlich   für 23 Personen, wobei je eine aus einer dieser Grundgesamtheiten stammt.
Dass die Geburtstage gleichwahrscheinlich und unabhängig verteilt sind, ist eine Forderung an die Wahrscheinlichkeitsverteilung bzw. Voraussetzung für die Anwendbarkeit von Modell 2. Aber umgekehrt darfst du nicht aus dem Modell 2 folgern , dass die Wirklichkeit so ist. Das wäre dann ein Fall für die Statistik. Also bitte nicht immer wieder Voraussetzung und Schlussfolgerung verwechseln bzw. tautologisch argumentieren. --62.180.196.18 22:10, 14. Jun. 2007 (CEST)
Klar, Modell 2 ist ein Modell, so wie Modell 1 ein Modell ist. Auch Modell 1 ist nicht die Wirklichkeit. --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)
Modell 1 berücksichtigt die reale Zusammensetzung der Grundgesamtheit und liefert deswegen immer korrekte Werte, während Modell 2 Annahmen macht, die so im Allgemeinen nicht richtig sein müssen und ist deswegen nicht immer korrekt. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)
Anscheinend glaubst Du wirklich, Modell 1 ist die Wirklichkeit. Wie aber schon mehrmals gesagt, die Literatur verwendet nicht Modell 1. Siehe Scherben 08:44, 9. Jun. 2007: Wenn sich Modell 1 in der Literatur durchgesetzt hat, wird auch der Artikel abgeändert. --NeoUrfahraner

Programmierbeispiel

Man sollte das Programmierbeispiel nicht in C sondern in einer leichter lesbaren Sprache oder in Pseudocode schreiben. Alleins schon die Zeilenumbrüche "\n" oder die "double"-Variable verstehen viele Leute nicht. 141.70.124.103 16:37, 1. Jul. 2007 (CEST)

done. -- 141.3.74.36 15:48, 3. Aug. 2007 (CEST)
hmm, aber irgendwie liefert imho das beispiel dem artikel keinen mehrwert. hat jemand was gegen loeschen einzuwenden? -- 141.3.74.36 15:53, 3. Aug. 2007 (CEST)
Das Programmierbeispiel stammt anscheinend von Benutzer:Fsswsb, der vor längere Zeit sein Unwesen mit eigenwilligen Theorien getrieben hat: http://de.wikipedia.org/w/index.php?title=Geburtstagsparadoxon&diff=prev&oldid=14109880 . Das Programmierbeispiel ist anscheinend zwar richtig, aber keineswegs wichtig (es ist wohl nicht mehr als ein nettes Beispiel für einen Anfängerkurs in Programmieren) und kann von mir aus gerne gelöscht werden. --NeoUrfahraner 19:57, 3. Aug. 2007 (CEST)
so seh ich das auch. Benutzer:Fsswsb hat ja damals eine tabelle ersetzt, die quasi das ergebnis des codes war. evtl. waere diese tabelle der oma-tauglichkeit wegen nuetzlich. jedenfalls loesche ich jetzt erst mal den besagten abschnitt. -- 141.3.74.36 21:08, 3. Aug. 2007 (CEST)
die tabelle ist ueberfluessig. der huebsche graf der beiden wahrscheinlichkeiten kann imho von keiner tabelle ueberboten werden. -- 141.3.74.36 21:11, 3. Aug. 2007 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: Maxus96 02:01, 28. Mai 2009 (CEST)

Mathematische Herleitungen

Zitat:"Im Folgenden wird der 29. Februar vernachlässigt und angenommen, dass die Geburtstage der   Personen unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung auf der 365-elementigen Menge   sind." Warum? --172.181.142.171 20:36, 18. Jul. 2007 (CEST)

Warum der 29. Februar vernachlässigt wird? Weil der 29. Feb. die Herleitung komplizierter macht, aber am Ergebnis nicht viel ändert. --NeoUrfahraner 07:10, 19. Jul. 2007 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: Maxus96 02:01, 28. Mai 2009 (CEST)

Falsche Bezeichnung

Auch wenn der Begriff "Geburtstagsparadoxon" häufig verwendet wird, so ist er doch falsch. Im Text steht: "Das Ergebnis [...] ist für die meisten verblüffend". Das stimmt wohl in Bezug auf die meisten mathematischen Laien. Weiter: "und wird deshalb als paradox wahrgenommen." Nein, paradox bzw. ein Paradoxon ist etwas anderes, dabei geht es um einen tatsächlichen oder scheinbaren logischen Widerspruch. Nur weil das Ergebnis eines mathematischen Problems für die meisten Nicht-Mathematiker verblüffend ist, handelt es sich bei dem Problem noch nicht um ein Paradoxon. (nicht signierter Beitrag von 85.178.67.84 (Diskussion) 3:13, 1. Aug 2008 (CEST))

kurz: der satz "das geburtstagsparadoxon ist kein paradoxon." mag paradox klingen, ist es aber nicht. ;-)
lang: die unterscheidung zwischen richtig/falsch ist in den sprachwissenschaften haeufig nicht so einfach und nicht mit mathematischem richtig/falsch zu verwechseln. in der sprache werden haeufig begriffe umgedeutet, obwohl deren bestandteile eigentlich etwas ganz anders oder zumindest mehrdeutiges aussagen. ein beispiel dafuer ist "antisemitismus" der gar nicht alle semiten, sondern nur eine grupper derer einschliesst. siehe aber auch volksetymologie. der begriff "geburtstagsparadoxon" hat sich eben etabliert und ist damit richtig. aehnlich ist es mit dem begriff "logik" (bzw. "logisch"), der sich im allg. sprachgebrauch eben nicht nur auf die wissenschaftliche logik, sondern eher auf vernunft bezieht (und nicht erst seit mister spock *g*). -- seth 10:08, 1. Aug. 2008 (CEST)
Zitat: "der begriff "geburtstagsparadoxon" hat sich eben etabliert und ist damit richtig."
Nein, allein durch wiederholte Verwendung wird etwas falsches nicht richtig. Ebensowenig wird beispielsweise ein Atommüllager dadurch zum Park, dass es immer wieder als "Entsorgungspark" bezeichnet wird. (nicht signierter Beitrag von 85.178.123.12 (Diskussion) 15:29, 1. Aug 2008 (CEST))
Wo willst du denn die Grenze zwischen "scheinbar widersprüchlich" und "verblüffend" ziehen? Formal wird dir das nicht gelingen. --Scherben 21:38, 5. Aug. 2008 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: Maxus96 02:01, 28. Mai 2009 (CEST)

Andere Jahreslängen

Wofür soll http://de.wikipedia.org/w/index.php?title=Geburtstagsparadoxon&diff=54144865&oldid=53061995 gut sein? Wer den exakten Wert braucht, ist hoffentlich in der Lage, das simple Computerprogramm selbst zu schreiben; für Abschätzungen ist die angegebene Näherung mit der Stirlingformel oder   für ein Jahr der Länge N (vgl. en:Birthday_problem) viel interessanter. Damit ergibt sich

  für p=1/2. --NeoUrfahraner 10:44, 15. Dez. 2008 (CET)

Ich habe den Abschnitt jetzt gelöscht, da er anscheinend keinene Mehrwert hat. Sie dazu auch WP:TF. --NeoUrfahraner 06:52, 16. Dez. 2008 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: Maxus96 02:01, 28. Mai 2009 (CEST)

GiftBot (Diskussion) 19:58, 9. Sep. 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: HilberTraum (Diskussion) 12:38, 11. Sep. 2012 (CEST)

Geburtstagsproblem - kleine Abweichung

Bei der Berechnung mit Excell komme ich nur auf 22 Personen, bei denen dann die Wahrscheinlichkeit mindestens 50% ist, dass zwei am gleichen Tag Geburtstag haben. Habe ich einen Rundungsfehler oder Denkfehler gemacht?

Ich habe n = 23 und eine W'keit von 0,5073 also echt größer als 0,5 ;-) MfG

Für n=23 stimmt dein Ergebnis, aber für n=22 erigbt sich 0,4757 --Robert 07:44, 2. Mär 2005 (CET)
Die Stirling-Formel produziert einen kräftigen Fehler. Die exakte Lösung P = 1 - (1 - 1/365) ^ (n(n-1)/2) liegt bei 33 Personen um geschlagene 0,99 Prozent unter der Näherung. Für n=23 ist P = 0,500477..., die 23 Personen sind also trotzdem richtig.
Findet jemand meine Formel nicht gut? Bitte melden!
--Maxus96 18:59, 19. Apr. 2008 (CEST)
Ooops! Man darf natürlich nicht einfach potenzieren. Die Wahrscheinlichkeit, daß keiner am gleichen Tag wie Person 1 Geb. hat, ist (364/365)^(N-1). Daß _auch_ keiner am gleichen Tag wie Pers. 2 Geb. hat, ist (363/364)^(N-2). Nr.3 (362/363)^(N-3) etc. Der Fehler ist aber nachgerade winzig für so viel Dummheit :-).
Comments?--Maxus96 15:36, 21. Apr. 2008 (CEST)
Und wenn man das dann mal ausrechnet kommt man auf einen Fehler von max. 8*10-4 %. Eine Tabellenkalkulation macht beim Multiplizieren ganzer Zahlen keinen Fehler, der über die hinteren Kommastellen der Exponentialdarstellung herausgeht, oder? Bei 40 Personen landet man immerhin bei 10^100.
Könnte mal jemand die Herleitung so anpassen, daß auch ich sie auf Anhieb richtig verstehe? Ich steh mit diesem Wiki-Mathesatz etwas auf Kriegsfuß.
--Maxus96 17:43, 21. Apr. 2008 (CEST)

"alternative" herleitung

ein gegenbeispiel sollte ja genuegen. also n=3, dann gilt offensichtlich, dass die wahrscheinlichkeit, dass genau drei leute am gleichen tag geburtstag haben, 1/365^2 betraegt. genau zwei von diesen drei haben mit der wahrscheinlichkeit 3*364/365^2 geburtstag. also ist die wahrscheinlichkeit, dass mind. zwei der drei am selben tag geburtstag haben, (3*364+1)/365^2. das deckt sich auch mit der formel 1-365!/((365-3)! 365^3). es passt jedoch nicht zur "alternativen" 1-(364/365)^3. -- seth 00:25, 19. Apr. 2008 (CEST)

wenn du dir die englische Seite ansiehst, so siehst du dass dort die Lösung mit der "alternativen" Variante ebenfalls verzeichnet ist - zusammen mit deiner kombinatorisch korrekten Lösung. http://en.wikipedia.org/wiki/Birthday_paradox#A_simple_exponentiation . Diese Lösung ist gerade für Nichtmathematiker hinreichend korrekt und verständlich. -- ThePacker 01:43, 19. Apr. 2008 (CEST)
Deswegen halte ich es für sinnvoll auch den Lösungsansatz der IP-Adresse hier stehen zu lassen. Ich wäre sehr dafür, auch einfach verständliche Herleitungen hier anzubieten. Wie siehst du das? -- ThePacker 02:10, 19. Apr. 2008 (CEST)
Dir ist hoffentlich aufgefallen, dass auf http://en.wikipedia.org/wiki/Birthday_paradox#A_simple_exponentiation   steht und nicht  : We can approximate the probability of no two people sharing the same birthday by assuming that these events are independent. Es handelt sich also um eine Näherung. Der Grund, warum es nur eine Näherung ist, ist folgender: Nimm eine Gruppe von drei Personen: Alex, Chris und Uli. Wenn Alex und Chris am gleichen Tag Geburtstag haben und Chris und Uli an verschiedenen Tagen Geburtstag haben, dann können Alex und Uli nicht am gleichen Tag Geburtstag haben. Die Ereignisse sind also nicht unabhängig; ihre Wahrschinlichkeiten können nicht einfach multipliziert werden. Die Herleitung ist also eine Näherung. Damit stellt sich aber die Frage, wie gut diese Näherung ist, und auf Du diese Frage kenne ich keine einfache Antwort. --NeoUrfahraner 07:15, 19. Apr. 2008 (CEST)
die form, in der es eingetragen wurde, war falsch genug, um geloescht zu werden. wenn man es explizit als naeherungsformel auffuehrt mit einer erklaerung, welchen semantischen fehler man dabei macht und ungefaehr angibt, wie ungenau die werte dadurch werden (was wohl in einfach verstaendlicher form nur moeglich ist, wenn man sowas sagt wie "bis zu n=... personen maximale abweichung von ..."), dann will ich mich nicht unbedingt einer aufnahme der formel in den weg stellen. afaics wuerde das jedoch alles zusammen nicht weniger kompliziert sein als die richtige formel. -- seth 08:23, 19. Apr. 2008 (CEST)
Wenn sie eine gute Näherung wäre - ist sie aber nicht. Nach meiner Rechnung kommt man auf p=1/2 damit bei 16 Personen statt bei 23 Personen; für kleine n ist die Formel zu nahe bei 1, für große n zu weit entfernt; insbesondere erreicht sie auch für n >>365 nicht 1. Sie ist eher ein Beispiel dafür, wie man es besser nicht machen sollte. --NeoUrfahraner 09:37, 19. Apr. 2008 (CEST)
für 23 Personen komme ich auf 1-(364/365)^(23*22/2)=0.500477. Die Abweichnung vom tatsächlichen Wert liegt im Promillebereich. Bei 16 Personen komme ich auf 1-(364/365)^(16*15/2)=0.28051. Die Näherungsformel ist für Werte größer 10 schon hinreichend korrekt. Ich bitte dich dein Argument noch einmal zu überdenken und dem Leser eine Näherungsformel zu spendieren. Wenn du magst, plotte ich gern den absoluten Fehler mit Gnuplot. Dass die zufällig anwesenden Personen ein Gleichungssystem bilden, das nicht linear unabhängig ist, ist mir bewusst. Aber für eine Stichprobe ist das ein zulässiger Gedanke. -- ThePacker 11:48, 19. Apr. 2008 (CEST)
OK, stimmt, ich habe mich verrechnet. Mit Fehlerabschätzung kann's von mir aus in den Artikel. --NeoUrfahraner 12:57, 19. Apr. 2008 (CEST)

3 Leute am selben Tag

Kennt jemand die Formel dafür, dass 3 Leute am selben Tag Geburtstag haben? Ich habe schon lange überlegt, komme aber nicht drauf.

Der Erste ist egal, daß die anderen Beiden am gleichen Tag haben ist (1/365)^2. Bitte lösche diesen Abschnitt, wenn du das hier liest. Und mach mal deine Hausaufgaben! ;-)--Maxus96 15:42, 21. Apr. 2008 (CEST)
Also so unberechtigt ist die Frage nicht. Ich glaube mich zwar zu erinnern, irgendwo was drüber gelesen zu haben, das war aber nicht in einer Zeile behandelbar. --NeoUrfahraner 15:58, 21. Apr. 2008 (CEST)

Fehler?!

also wenn ich das mit der Binomialverteilung kontrolliere, ob bei 253 Personen zwei am selben Tag haben, wobei der Tag wichtig ist, kommt folgendes raus:

(253 nCr 2) * (1/365)^2 * (364/365)^251 und das ist bei mir nur 12 % (nicht signierter Beitrag von 80.121.3.33 (Diskussion) 14:30, 4. Jun 2008 (CEST))

...wobei der Tag wichtig ist... --Scherben 15:37, 4. Jun. 2008 (CEST)

quadratisches Wachstum?

Die Sätze

"Der Grund für diesen großen Unterschied liegt darin, dass es bei n Personen n(n − 1) / 2 verschiedene Paare gibt, die am selben Tag Geburtstag haben könnten. Die Wahrscheinlichkeit für das Zusammentreffen beziehungsweise Kollidieren zweier Geburtstage steigt daher ungefähr mit dem Quadrat der Anzahl n an."

gefallen mir nicht:

Von einem quadratischen Wachstum einer Wahrscheinlichkeitsfunktion zu sprechen, ist hochgradig fragwürdig, da Wahrscheinlichkeiten begrenzt sind (stets kleiner gleich 1), quadratische Funktionen aber nicht.

IMHO sollte man das umformulieren.

Ob sich die tatsächliche Wahrscheinlichkeitsfunktion p(n) = 1 - 365 * 364 * 363 * .... * (365 - n +1) / 365 ^ n abschnittsweise quadratisch verhält, wage ich weder zu behaupten noch zu widerlegen, trivial ist es allerdings nicht. (nicht signierter Beitrag von 88.74.29.157 (Diskussion) 12:20, 26. Nov. 2008 (CET))

Gemeinst ist, dass die Wahrscheinlichkeit "anfangs" (also solange p(n)<<1) ungefähr quadratisch wächst. Wenn dann p(n) "groß" (also nahe bei 1) ist, kann es natürlich nicht mehr quadratisch weitergehen. Man sieht das ja auch am Graph p(n): zunächst schaut er wie eine Parabel aus, die aber später irgendwann abflacht. Wenn's jemand stört, kann man ja ein zunächst/anfangs/für kleine n oder ähnliches ergänzen. --NeoUrfahraner 06:59, 16. Dez. 2008 (CET)

Bestimmter oder unbestimmter Tag im Jahr

Vielleicht kann das Studieren dieses Artikels über das Geburtstagsparadoxon zu Missverständnissen führen und ein Indiz dafür könnte eine einschlägige Passage in Hans Magnus Enzensbergers Veröffentlichung „Fortuna und Kalkül. Zwei mathematische Belustigungen.“ sein. Von Seite 14 dieses im übrigen gleichermaßen geistreichen wie unterhaltsamen Büchleins darf zitiert werden:

„Nehmen Sie an, Sie hätten zu einer Party 23 Leute eingeladen. Mit den Gastgebern wären dann 25 Personen anwesend. Was glauben Sie, wie stehen die Chancen, daß zwei von ihnen an ebendiesem Tag Geburtstag haben?“

Nach einigen launigen Denkübungen zur Eingrenzung des Problems geht es dann überraschend wie folgt weiter, Zitat:

„ Hoffentlich ist kein Mathematiker unter Ihnen; denn der würde sofort rufen: »Falsch! Die Wahrscheinlichkeit, daß dieser Fall eintritt, liegt ziemlich genau bei 57 Prozent.«“

So wollen aber die Mathematiker wohl ungern in Anspruch genommen werden, denn für den zitierten Fall gibt es statt 57 Prozent tatsächlich nur magere 6 Prozent.

Ich bin zwar kein Mathematiker, aber das Zitierte war mir der Anstoß, den Artikel über das Geburtstagsparadoxon so zu ergänzen, dass sprachlich deutlicher zwischen den Gesetzmäßigkeiten für einen bestimmten Tag im Jahr und den Gesetzmäßigkeiten für einen unbestimmten Tag im Jahr unterschieden wird. Außerdem ist die Formel zu der blauen Kurve der Wahrscheinlichkeit ergänzt und mit einer Erklärung verbunden worden. (Ob diese blaue Kurve in dem Bild für den Spezialfall   gemeinsam mit der grünen Kurve tatsächlich, so wie es sein muss, die Abszisse schneidet, lässt sich nicht zuverlässig ablesen.)

--Adopol 13:32, 4. Jan. 2010 (CET)

Nur weil der Herr Enzensberger ein paar launige Bemerkungen über Mathematiker machen wollte, müssen wir den Artikel aber nicht aufblähen, oder? Das Geburtstagsparadoxon dreht sich um irgendeinen Tag. Daß von 25 Leuten zwei an einem vorher bestimmten Tag Geburtstag haben, hat übrigens eine Wahrscheinlichkeit (von 57 % / 365) oder (25/365 * 24/365). Das sind überschlägig lausige 2 Promille, und nicht 6 %, und das ist kein bisschen paradox, und der Artikel war da in keiner Weise undeutlich, was gemeint ist.
Die sechs Prozent gehören übrigens zu einer anderen Rechnung: Wenn Sie 23 Leute zu Ihrer eigenen Geburtstagsparty einladen, dann hat mit einer Wahrsch. von 23/365 = 6% ein Weiterer Geburtstag. Übrigens nicht 24/265, denn sie wissen hoffentlich den Geburtstag ihrer Frau, und ob der mit Ihrem zusammenfällt.
Herrn Enzensberger, so Sie ihn richtig wiedergegeben haben, bleibt anzuraten, keine Witze über Mathematiker zu machen, wer selbst nicht rechnen kann.
Gruß, -- Maxus96 14:42, 4. Jan. 2010 (CET)
Immer langsam mit den jungen Pferden.- Guter Stil ist es ja nicht, seine Gegenargumente dadurch unterstreichen zu wollen, dass man einem, der einen Vorschlag einbringt, vage unterstellt, er könnte vielleicht zwei Sätze nicht korrekt zitieren und den Geburtstag seiner Frau nicht wissen. Immerhin kann man bei gutem Willen aus der Einrede von Maxus96 auch positive Ansätze herauslesen:
Messerscharf wird erkannt, dass ich stillschweigend (unzulässig bei so aufmerksamem Kritiker) Enzensbergers Party als Geburtstagsparty interpretiert habe. – Akzeptiert. Aber was 57 % / 365 mit 25/365 * 24/365 gemeinsam haben sollen, kann wohl nur Maxus96 aufklären. Haken wir diesen Teil ab.
Haha, da haben Sie mich erwischt. Die 57%/365 stimmen natürlich, danach ist die Mathematik mit mir durchgegangen. Genauso sind die 23/365 später Quark. Dann wäre ja bei 365 Gästen die Wahrscheinlichkeit eins.-- Maxus96 20:44, 5. Jan. 2010 (CET)
Bleibt die vergleichende Betrachtung der Wahrscheinlichkeiten von 23/365 einerseits und 24/365 (24/265 ist wohl nur ein Tippfehler von Maxus96) andererseits; damit wird der eigentlich sensible Punkt angesprochen: Wenn ich 23 Leute zu meiner Geburtstagsparty einlade (eine Einladung an Maxus96), dann hat in der Tat mit einer Wahrscheinlichkeit von :   [nicht etwa 23/365!] ein Weiterer Geburtstag. Die Berechnung geht von 24 anwesenden Personen aus (davon 23 Eingeladene). Deshalb ist auch die von mir in den Artikel eingefügte Formel :   richtig und zweckmäßig, denn in dem Artikel ist immer von   anwesenden Personen die Rede und   sollte immer gleicher Definition unterliegen. Mit dieser Formel wird nichts aufgebläht, sondern erst die richtige Grundlage für die blaue Kurve im Bild angegeben. Für den Spezialfall mit   (Das traurige Geburtstagskind ist allein geblieben und keiner ist seiner Einladung gefolgt) ergibt sich dann exakt 0% Wahrscheinlichkeit für ein zusätzliches Geburtstagskind. Es besteht der begründete Verdacht, dass die Programmierung der blauen Kurve im Bild dieser Gesetzmäßigkeit nicht absolut deckungsgleich Rechnung trägt.
Falls jetzt nicht ein weiterer Schnellschuss wie nach einer Majestätsbeleidigung kommt und wir im Gespräch bleiben sollten, gibt es noch eine weitere Stelle im Artikel, die auf eine kleine Präzisierung wartet.
Freundlichen Gruß --Adopol 16:18, 5. Jan. 2010 (CET)
Die blauen Kurve ist eben gegen gekommene Gäste aufgetragen, und die grüne gegen insgesamt anwesende Leute. Daß das nicht so richtig zusammenpaßt, ist eigentlich klar, oder? Es geht ja auch nur darum, daß erstere langsam gegen eins strebt, während letztere viel schneller ansteigt, und spätestens bei n=365 gleich eins ist.
Freundliche Grüße, -- Maxus96 20:31, 5. Jan. 2010 (CET)
P.S. Und wo liegt der weitere Hund begraben?
P.P.S. Ich fand das stilistisch gut. Möglicherweise etwas unverschämt, gut.
Nun haben wir die Tonlage unseres Gedankenaustausches auf „verträglich“ gestimmt. Da können wir künftigen Lesern des Artikels doch auch ersparen, selbst herauszufinden, dass da was „nicht so richtig zusammenpasst“. Und so bescheiden ist der mit diesem Artikel verbundene Anspruch an Aussagekraft auch wieder nicht, dass da nur vermittelt werden soll, dass „die blaue Kurve nur langsam gegen 1 strebt, während die grüne viel schneller ansteigt“.
Vorschlag zur Güte und erster Schritt: Die Rücknahme meines Beitrages wird wieder zurückgenommen. Damit kann der Leser dann nicht nur für die grüne Kurve   im Text die zugehörige Formel finden sondern auch für die blaue Kurve  .
Freundlichen Gruß --Adopol 10:29, 6. Jan. 2010 (CET)
gudn tach!
es wird ja in der artikeleinleitung bereits explizit auf den fall hingewiesen, um den Adopol den artikel erweiterte, insofern halte ich diese ergaenzung fuer eine nuetzliche erklaerung. nicht jeder leser denkt automatisch um genuegend ecken, um sich "-1" dazuzudenken.
das mit dem verlauf eines jahres ist imho ebenfalls eine ergaenzung, die dem verstaendnis dient. aber imho muss man es nicht in die ueberschrift des abschnittes packen, da ja bereits in der einleitung der jahrgang vernachlaessigt wird.
Maxus96, noch einwaende, dass die version von Adopol im grossen und ganzen wiederhergestellt wird? -- seth 11:13, 6. Jan. 2010 (CET)
Nö. Aber ich bitte zu bedenken, daß das hier ein Lexikon sein soll, und kein Lehrbuch. Man sollte beim Thema bleiben, im Allgemeinen. -- Maxus96 23:00, 7. Jan. 2010 (CET)
Wenn von   Anwesenden 1 Person definitiv Geburtstag hat, erstreckt sich die Wahrscheinlichkeitsbetrachtung nur auf die übrigen   Personen. Das schlägt sich sowohl in der Formel für   wie auch im (jetzt angepassten) Text der Einleitung nieder.
--Adopol 18:07, 12. Jan. 2010 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: Maxus96 (Diskussion) 01:25, 17. Dez. 2013 (CET)

Geburtstagsverteilung

Ich wollte in den entsprechenden Abschnitt folgendes einfügen : "Wie leicht einzusehen ist, hat eine ungleichmäßige Verteilung den gleichen Einfluß wie ein kürzeres Jahr: Die Geburtstage verteilen sich über weniger Tage, mithin steigt die Wahrscheinlichkeit für Doppelungen." Jaja, hab ich mir selber ausgedacht. Trotzdem einbauen? -- Maxus96 22:10, 25. Jan. 2010 (CET)

Die Aussage stimmt, braucht aber nicht mehr eingebaut zu werden, da sie bereits drinnen steht: Fußnote 2 (Bloom 1973) und dazugehöirger Text. --NeoUrfahraner 07:27, 26. Jan. 2010 (CET)
Aber wozu die Lagrangeschen Multiplikatoren? Leicht einzusehen sind die nicht. :-) -- Maxus96 00:17, 27. Jan. 2010 (CET)
Dafür aber ist der Beweis mathematisch exakt. Was "leicht einzusehen" ist, ist manchmal trotzdem falsch. --NeoUrfahraner 07:34, 28. Jan. 2010 (CET)

Vergleichsmaßstab Q

Im Artikel steht "Die Wahrscheinlichkeit Q ist gleichzeitig der adäquate Vergleichsmaßstab, wenn im Gegensatz zu den Betrachtungen für einen bestimmten Tag, im folgenden Abschnitt der Focus auf die Gesamtheit aller Tage des Jahres gerichtet wird." Welche Art von Vergleichsbetrachtung sollte man denn dann durchführen? Kann das jemand sinnvoll präzisieren (oder erstmal hier erklären, was man dazu schreiben sollte)? -- KurtSchwitters 14:33, 4. Mär. 2010 (CET)

Hash Kollisionen

Es wäre schön wenn jemand das ganze mal mit hash kollisionen beschreibt, da das sehr gut für viele programmierer zu gebrauchen ist und eine verallgemeinerung in zwei dimensionen darstellt. Gemeint ist, wenn man eine hashtabelle der grösse N slots hat (bei der man durch verkettung die kollisionen abfängt) wieviele slots hat man dann idealerweise bei M elementen einfach, doppelt, dreifach (k-fach) belegt? (nicht signierter Beitrag von 213.61.9.74 (Diskussion | Beiträge) 15:19, 13. Apr. 2010 (CEST))

Verallgemeinerungen

Obwohl das Geburtstagsparadoxon mit N=365 Möglichkeiten besonders attraktiv für die Veranschaulichung ist (und deshalb so bekannt), stellen sich die gleichen Fragen auch im allgemeinen Fall (beliebiges N).

Gleichwertige Formulierungen sind dann:

a) Man zieht k Kugeln aus einer Menge von N nummerierten Kugeln aus einer Urne (mit Zurücklegen). (1) Ab welchem k ist die Wahrscheinlichkeit größer als 50%, dass man mindestens einmal die Kugel mit einer vorher festgelegten Nummer zieht? (2) Entsprechend: ab welchem k ist die Wahrscheinlichkeit größer als 50%, dass nicht alle gezogenen Kugeln verschiedene Nummern tragen?

b) Genauso kann man auch das Modell verwenden, in dem Kugeln in nummerierte Zellen geworfen werden, wobei Mehrfachbesetzung der Zellen erlaubt sei (siehe hierzu die 16 Beispiele in Feller: An Introduction to Probability Theory and its Applications, Chapter 1, "The Sample Space").

In der Geburtstags-Formulierung würde man ein hypothetisches Jahr betrachten, welches statt 365 Tage nun N Tage hat, und für die erste Frage bekommt man das Ergebnis:

Es sind   Personen nötig, um eine Wahrscheinlichkeit von 50% zu erreichen, dass mindestens eine Person an einem bestimmten Tag Geburtstag hat.

Da die Ableitung von ln(x) gerade 1/x ist, gilt

 ,

und es folgt

 

Der Quotient 253/365 beträgt übrigens fast genau ln(2) (explizit: 365 x ln(2) = 252,9987).

Für die zweite Frage ist auf der englischsprachigen Wikipedia-Seite die Methode von Halmos beschrieben.

Was ist Eure Meinung zu einem Ausbau des Artikel in diese Richtung? -- KurtSchwitters 13:31, 3. Mär. 2010 (CET)

Schön, aber WP ist doch kein Mathe-Lehrbuch. Gruß, -- Maxus96 21:43, 3. Mär. 2010 (CET)
Hallo Maxus96, oft gewinnt ein mathematisches Problem, wenn man die speziellen Parameter (hier 365) ersetzt durch eine Variable. In diesem Beispiel ist es zwar schön, dass man die Zahl 253 ausrechnen kann. Die allgemeinere „Erklärung“, dass die gefragte Anzahl ungefähr N*ln(2) ist, hat aber auch ihren Reiz, oder? Die nächste Verallgemeinerung wäre dann, die 50% durch einen variablen Wert zu ersetzen... (das ist im Artikel schon geschehen, mit der Variablen P). KurtSchwitters 09:37, 4. Mär. 2010 (CET)
gudn tach!
als kleiner nachtrag: ich hatte vor 4 tagen die aenderung von KurtSchwitters revertiert (der text ist ja damit nicht verloren, sondern kann gf. wiederverwertet werden), zum einen weil die typografischen aenderungen nicht unseren konventionen entsprachen (siehe dazu WP:SVZ und hilfe:teX) und zum anderen, weil exkurse nicht in fussnoten geschehen sollten. ueberhaupt werden exkurse eher selten als enzyklopaedisch relevant angesehen. ich muss allerdings zugeben, dass es mathematisch eigentlich voellig normal ist, dass man sich nach verallgemeinerungen fragt. so wie man z.b. beim sudoku-spiel sich nach automatisierten loesern oder gar konstruierern fragt (die im entsprechenden artikel vorhanden sind). insofern halte ich eine solche verallgemeinerung fuer interessant genug. aber um sicherzugehen - vielleicht auch fuer die zukunft -, waere vielleicht eine kleine diskussion im portal:mathematik angebracht. -- seth 14:58, 6. Mär. 2010 (CET)
Ich finde, dieser Artikel benötigt dringend einen Unterpunkt Verallgemeinerung. Was KurtSchwitters da ausgearbeitet hat stellt imho einen guten Anfang dar. Vgl. hier ist auch der englische Wikipedia-Artikel Birthday problem.
Das Geburstags-Paradoxon hat enge Verbindungen zum Panini-Sammelalbumproblem und zum Coupon collector's problem. Beides sind - wie auch das Geburstagsproblem - nur einprägsamme Namen für allgemeinere Probleme. Deswegen sollten auch Nicht-Mathematiker dafür Verständnis haben, wenn Mathematiker und dem Oberbegriff "Geburstagsproblem" bei Wikipedia nach den Verallgemeinerungen suchen. Fast immer findet man diese letztlich nur beim englischen Pendant zur deutschen Seite. Aber unsere Version hat durchaus auch stärken gegenüber der englischen, so etwa die Abschätzung mittels der Sterling-Formel, welche leider nur im konkreten Geburtstagsfall vorliegt.
Solche Abschätzungen gehören imho eher in den allgemeinen Teil, weil sie für das tatsächliche Geburstagsproblem nicht benötigt werden.
Andere Nutzer sollen also konkret sagen, was am Vorschlag von KurtSchwitters noch verbessert werden muss, um diesen so verwenden zu können. -- AtroX Worf 21:46, 4. Mai 2010 (CEST)
Hallo Atrox Worf, ich glaube, es spricht nichts dagegen. Meine ursprünglichen Änderungen waren nur nicht so geschickt (ich wollte es in eine Fussnote quetschen). Man könnte, wie Du sagst, auch noch einige Ideen aus der englischen Seite nehmen. Wenn Du Lust dazu hast, könntest Du ja einen Versuch starten. Grüße KurtSchwitters 11:22, 7. Mai 2010 (CEST)

Mathematische Herleitungen

Wenn ich das richtig sehe, wird das Ursprungsproblem, nämlich 23 Personen aus einer Obermenge von Menschen zufällig auszuwählen, dadurch ersetzt, dass man 23 Geburtstage aus der Menge von 365 Tagen eines Jahres (mit zurücklegen) auswählt. Das ist aber eine andere Problemstellung, weil damit der Umfang der Obermenge von Menschen nicht mehr berücksichtigt wird. Ab welcher Populationsgröße und bei welcher Geburtstagsverteilung gilt denn überhaupt die Behauptung im Artikel? Und warum wird diese veränderte Problemstellung im Artikel nicht mit dem Ursprungsproblem ausfühlich verglichen? --149.225.178.109 21:32, 8. Jan. 2011 (CET)

Das ursprüngliche Problem geht von einer so großen Obermenge aus (z.B. mehrere Millionen Personen), dass die tatsächliche Anzahl keine Rolle spielt. Man könnte sich aber auch fragen, was herauskommt, wenn beispielsweise 730 Personen mit jeweils 2 Geburtstagen am gleichen Tag als Obermenge verwendet werden. Dabei fällt aber auf, dass es sich um ein ziemlich konstruiertes Problem handelt. Aber wer Lust hat, kann es ja mal ausrechnen. -- KurtSchwitters 17:02, 11. Jan. 2011 (CET)
Hugo Pförtner schreibt:Mit der realistischen Verteilung ist nach wie vor 23 die erste Gruppengroesse, fuer die die kumulierte Wahrscheinlichkeit fuer einen Doppeltreffer 50% uebersteigt. In meiner Simulation ueberschreitet die interpolierte kumulierte Wahrscheinlichkeit 50% bei ca. 22.758 Personen fuer die Gleichverteilung und bei ca. 22.677 Personen bei der 1978er-Verteilung (siehe Seite 4 in birth2.pdf). Der theoretische Wert bei Gleichverteilung fuer 2 oder mehr Personen mit gleichem Geburtstag liegt uebrigens bei ca. 22.769 Personen
Das könnte man nach Prüfung doch so ähnlich in den Artikel übernehmen, oder? --149.225.130.25 17:47, 11. Jan. 2011 (CET)
Wenn ich es richtig verstehe, geht es aber bei Pförtner nicht um kleine Obermengen, sondern nur um Abweichungen von der Gleichverteilung. Die Zahlen 22.758, 22.677 und 22.769 bedeuten hier, dass die Verteilungsfunktionen für 22 Personen Werte von < 50% haben und bei 23 Personen Werte von > 50% haben, nur eben jeweils etwas verschoben (deshalb die Unterschiede in den interpolierten Werten). Der Abschnitt über ungleichmäßige Verteilung der Geburtstage ist erstmal ausführlich genug, finde ich. (→ Oder hattest Du 22.758 als 22758 Personen in der Obermenge interpretiert?) -- KurtSchwitters 13:52, 12. Jan. 2011 (CET)

Ja, du hast Recht: ich habe die Zahlen als Obermenge interpretiert. Schade eigentlich, aber so musste ich doch noch selber rechnen! Aber unabhängig davon habe ich mal die Anzahl an Personen einer Obermenge ausgerechnet, die man mindestens benötigt, um bei Gleichverteilung der Geburtstage im Jahr (außer dem 29. Februar) die Wahrscheinlichkeit p=0.5 dafür zu erreichen, dass mindestens zwei von 23 zufällig ausgewählten Personen am selben Tag Geburtstag haben. Es ist eine Zahl zwischen 17155 (47 Personen pro Geburtstag) und 17520 (48 Personen pro Geburtstag). Bei einer kleineren Grundmenge nimmt die Wahrscheinlichkeit ab, bei einer größeren zu.

Diese Betrachtung wäre auch deshalb interessant für den Artikel, weil zu überlegen ist, woher die 23 Personen stammen. Es wäre sehr unanschaulich zu sagen, die Personen würden aus einem internationalen Telefonbuch zufällig ausgewählt. Die Originalfassung des Paradox ist ja mWn folgende:

Befinden sich in einem Raum mindestens 23 Personen, dann ist die Chance, dass zwei oder mehr Personen am selben Tag Geburtstag haben, größer als 50%.

--149.225.130.81 20:15, 12. Jan. 2011 (CET)

Ich hatte weiter oben schon geschrieben, dass es viele Möglichkeiten der Formulierung gibt. Eine ist z.B. das Werfen von Kugeln in nummerierte Zellen, wobei Mehrfachbesetzung der Zellen erlaubt ist. Bei einer „großen“ Anzahl von Zellen (z.B. 365 oder 10000) kommt es dennoch bei einer im Vergleich kleinen Anzahl von Würfen schon zu Mehrfachbelegungen/Kollisionen. Ein solcher Vergleich macht deutlich, dass man sich nicht zu konkret damit beschäftigen sollte, woher die 23 Personen kommen. Die Sichtweise einer kleinen Obermenge tritt nur dann auf, wenn durch einen Wurf in Zelle i die Wahrscheinlichkeit, wieder Zelle i zu treffen, sinkt (Beispiel bei 48 Personen pro Geburtstag: wenn eine Person schon ausgewählt wurde, dann stehen für die weiteren Ziehungen für diesen Geburtstag nur noch 47 Personen zur Verfügung). Was wäre hierfür eine natürliche Anwendung? -- KurtSchwitters 09:47, 13. Jan. 2011 (CET)
Es heißt aber "Geburtstagsparadoxon" und nicht "Kollisionsparadoxon" oder "Werfen-von-Kugeln-in-Zellen-Paradoxon". Deshalb macht es Sinn, sich mit der Herkunft der Personen zu beschäftigen. Wenn man das Problem nur von der Anwendung her betrachten wollte, hätte man ja ein entsprechendes Anwendungs-Paradoxon formulieren können. Nun gewinnt aber das Problem durch die Geburtstagsanalyse seine populäre Aussagekraft und ist so bekannt geworden, dass sich Wissenschaftler bis heute damit beschäftigen. Z.B. gibt es eine Arbeit darüber, wie die Geburtstage der 22 Spieler (+ Schiedsrichter) bei den Spielen der WM 2006 verteilt waren. Dabei wird das Ergebnis so gut bestätigt, dass man es durchaus im Artikel erwähnen könnte. --149.225.130.229 15:52, 13. Jan. 2011 (CET)
Ich habe Dein Ergebnis mit 48 Personen pro Tag nachgerechnet und kann es bestätigen. Bei 730 Personen (zwei pro Tag) benötigt man nach meiner Rechnung 32 Personen, um mit einer Wahrscheinlichkeit von mehr als 50% zwei mit gleichem Geburtstag zu haben. Das könnte man als „Zwillingsparadoxon“ so formulieren: auf einer Insel leben 365 Zwillingspaare, und zwar für jeden Tag des Jahres genau ein Paar. Wenn man auf der Insel zufällig 32 Personen auswählt, so ist die Wahrscheinlichkeit größer als 50%, dass sich darunter mindestens eines der Zwillingspaare befindet. Bei Drillingen findet man doppelte Geburtstage ab 28 Personen mit mehr als 50%, bei Vierlingen ab 27 Personen, bei Fünflingen ab 26, bei 6-9lingen ab 25 und dann geht es bis 47 ab 24. -- KurtSchwitters 22:01, 13. Jan. 2011 (CET)

Könnte man daraus nicht eine schöne Tabelle oder Grafik kreieren, die zeigt, wie mit Vergrößerung der Obermenge die Anzahl an benötigten Personen für die 0.5-Wahrscheinlichkeit asymptotisch sinkt? Und muss dieses Ergebnis einem Laien nicht ebenfalls paradox erscheinen? Jedenfalls hätte man damit ein anschauliches Argument dafür, dass man das Zufallsexperiment:

Ziehe 23 Personen zufällig ohne Zurücklegen aus einer Urne mit x Personen

durch ein anderes Experiment ersetzen darf:

Ziehe 23 Geburtstage mit Zurücklegen aus einer Urne mit 365 Tagen

Desweiteren hätte ich noch mehrere Verbesserungsvorschläge in petto. Ich weiß nur nicht, ob es besser ist, diese einzeln zu diskutieren oder eher anhand eines alternativen Artikels aufzuzeigen. Gäbe es einen Platz hier, solch eine Alternative darzustellen? --149.225.132.28 18:48, 14. Jan. 2011 (CET)

Hallo, über die mit/ohne Zurücklegen-Frage denke ich nochmal nach. Allgemein würde ich vorschlagen, dass Du Dich anmeldest, denn bei jedem Edit eine unterschiedliche IP-Adresse zu sehen, ist etwas verwirrend. Im Benutzernamensraum kannst Du dann eigene Probeartikel ablegen, die auch von anderen gelesen werden können. Ein solcher Artikel kann entweder ein neues Thema haben, oder Du kannst einen bestehenden Artikel kopieren und ihn probeweise verändern. Die abgestimmten Änderungen können dann in den Originalartikel eingebaut werden. Grüße, KurtSchwitters 20:37, 14. Jan. 2011 (CET)
Ich habe mal den Text erstmal nur strukturell verändert, ohne die schon angesprochenen inhaltlichen Veränderungen. Schau mal, ob diese Umgestaltung die Lesbarkeit des Artikels erhöhen könnte. --Pardox 18:15, 19. Jan. 2011 (CET)
Es stimmt, dass der wichtigere Abschnitt der über die gleichen Geburtstage ist, und nicht der über das Zusammentreffen mit einem bestimmten Tag im Jahr. Deshalb finde ich es verständlich, dass Du den Abschnitt nach vorn gestellt hast. Man müsste noch schauen, wie die Verweise auf die Graphik gemacht werden können. Warum Du es so wichtig findest, dass die Personen sich in einem Raum befinden, habe ich aber noch nicht verstanden. Insgesamt könnte man den Artikel auch noch stärker verändern: mit Anregungen aus der englischen WP und aus den Diskussionen weiter oben. Experimentell kannst Du zum Beispiel eine komplett neue Version auf Deiner Spielwiese entwickeln (muss aber nicht sein, da kleine Änderungen einfacher nachvollziehbar sind, haben sie natürlich auch viele Vorteile). -- KurtSchwitters 21:56, 21. Jan. 2011 (CET)
1. Die (räumliche) Begrenzung der 23 Personen ist m.E. wichtig, um eine Vorstellung von der Situation zu erhalten. Niemand kann sich "abstrakt" 23 Personen vorstellen, sondern man versucht doch immer, einen Zusammenhang herzustellen: 23 Sänger in einem Chor, 23 Besucher einer Fete, 23 Schüler in einer Klasse oder auch nur 23 Punkte auf einem Blatt Papier. Ich verstehe nicht, warum dieses Zugeständnis an die menschliche Vorstellungskraft ein Problem sein sollte...?
2. Der Artikel der englischen WP scheint mir zu ausufernd zu sein, um daraus kurzfristig Anregungen übernehmen zu können. Die strukturelle Umstellung wie von mir vorgeschlagen könnte allerdings ein erster Schritt sein, um weitere Verbesserungen zu erleichtern.
3. Die Spielwiese ist schön und gut, aber die konkrete Arbeit am Artikel unter möglicher Beteiligung anderer wäre für mich befriedigender. --Pardox 20:31, 7. Feb. 2011 (CET)
OK, dann würde ich vorschlagen, dass Du den umgestalteten Artikel so nimmst (kopierst), aber noch die Verweise zur Graphik verbesserst. -- KurtSchwitters 21:13, 7. Feb. 2011 (CET)
Verweis zur Grafik als Link gestaltet; gäbe es eine andere Möglichkeit...? --Pardox 23:42, 8. Feb. 2011 (CET)

Quelle für Zitat

Also, als Quelle für ein Zitat ein Aufgabenblatt zu nehmen ist schon ungewöhnlich. Noch ärgerlich ist es, dass der Professor, der die Aufgaben gestellt hat auch noch im Aufgabenblatt selbst eine Quelle angegeben für das Geburtstagsparadoxon. --Sigbert 19:09, 14. Feb. 2011 (CET)

Ja, du hast Recht...!
Frage: Warum wurde deine Revertierung auf die alte Artikelfassung automatisch gesichtet, deine anschließenden Änderungen aber nicht? --Pardox 19:47, 14. Feb. 2011 (CET)
gudn tach!
deine aenderung 2011-02-12T18:46:43 wurde nicht gesichtet, die version auf die sigbert revertierte, war gesichtetet. als sigbert dann den eigenrevert durchfuehrte, wurde wieder der gesichtet-status der version 2011-02-12T18:46:43 uebernommen. allerdings ist die neuste gesichtete version immer noch die nach dem ersten revert.
nun, dann koennen wir in ruhe oben noch mal weiter diskutieren. -- seth 22:38, 14. Feb. 2011 (CET)

Neustrukturierung des Artikels

Vorweg: ich bin Nichtmathematiker. Ich beobachte den Artikel seit 2005, er ist zunehmend besser, ausführlicher und verständlicher geworden - bis Jan. 2011. Die Pardoxen Umstrukturierungsmaßnahmen haben meiner Ansicht nach aber geschadet. Das Thema wird nun gänzlich anders behandelt. Der Psychologische Moment der mathematisch schrägen Alltagswahrnehmung ist in den Hintergrund gerückt. Was die Bachelorarbeit hier soll ist mir auch schleierhaft. Fazit: Hätte ich nicht nur Leistungskurs Mathe und 3 Semester Statistik gehabt sonder jenes studiert würde ich sofort reverten. So frage ich einfach in die Runde: Was haltet ihr von dieser Umstrukturierung? --Aineias © 21:41, 12. Feb. 2011 (CET)

Zustimmung. Ich habe zwar nicht alle Details angesehen, sehe aber keinerlei Verbesserung gegenüber der alten Version. Die Positionierung der Bachelorarbeit gleich am Anfang erweckt fast den Eindruck, alsob sie von zentraler Bedeutung wäre. Sie passt allerdings bestenfalls in den Abschnitt "Ungleichmäßig verteilte Geburtstage", falls sie dazu neue Erkenntnisse liefert. Fazit: Ich bin für Revert auf Version 21:50, 22. Jan. 2011 von Benutzer:Lustiger seth, Neustart von dort, wenn klar ist, was das Ziel der neuen Version sein soll. --NeoUrfahraner 06:59, 13. Feb. 2011 (CET)
Ein Beispiel, wenn es zur Illustration des Paradoxons hilfreich ist, sollte zwecks Motivation des Lesers immer am Anfang stehen. Das ist klassische Didaktik und hat mit "zentraler Bedeutung" des Beispiels nichts zu tun. Im Übrigen bietet auch die Ursprungsformulierung des Paradoxoxns, wei sie von Mieses zugeschrieben wird, keine Hinweise darauf, wie zufällig oder gleichmäßig die Geburtstage insgesamt verteilt sind.
Einen sinnvollen Neustart von der alten Version wird es m.M.n nicht geben können, weil der Artikel in der dortigen Form nicht vernünftig erweiterbar ist. Dazu ist er der Form nach zu sehr in sich geschlossen:
Die "Eingrenzung" behandelt ja nicht nur das Originalproblem sondern auch gleich noch eine Variante des Paradoxons. Hier wird sozusagen eine inhaltliche Klammer geöffnet.
Die "Mathematische Herleitungen" behandeln in einem Abschnitt zuerst die Variante und im Anschluss dann erst das Originalproblem. Hier wird die inhaltliche Klammer wieder geschlossen.
Solch eine Darstellung ist, weil sie ihre Inhalte nicht nach Abschnitten sauber trennt und ordnet, unübersichtlich und für einen Laien schlechterdings kaum nachvollziehbar. Deswegen sollten meine strukturellen Neuerungen beibehalten werden. Über die Abschnitte und ihre Inhalte kann man ja noch reden... --Pardox 10:59, 13. Feb. 2011 (CET)
Ich habe nichts gegen ein Beispiel an sich. Da Du anscheinend zustimmst, dass die Bachelorarbeit nicht von zentraler Bedeutung ist, schlag ein anderes Beispiel vor, vielleicht können wir uns darauf einigen. --NeoUrfahraner 14:15, 13. Feb. 2011 (CET)
ich fand die alte version auch nicht schlechter als die neue, vor allem, dass die tex-formatierung unnoetigerweise durch eher alten code ersetzt wurde (also \frac -> \over), empfand ich sogar eher als nachteil und waere insofern auch fuer den revert. allerdings finde ich die idee von Pardox sehr gut, schon in der einleitung die eigentliche statische aussage wiederzugeben und nicht nur meta-kram. deswegen denke ich auch, dass wir die einleitung (nach einem revert) wieder entsprechend umbauen.
das beispiel durch ein klassenzimmer mit 23 schuelern zu ersetzen ist uebrigens vielleicht ein noch leichter verstaendliches beispiel. -- seth 21:16, 13. Feb. 2011 (CET)
Die Tex-Formatierung kann ja wieder eingesetzt werden. Ich hatte den Artikel zuvor in meine Spielwiese kopiert, um dort die Strukturänderungen vorzunehmen, und habe ihn dann als Ganzes wieder rüberkopiert. Deshalb wohl kam es zu den Überschneidungen in der Bearbeitung.
Ich verstehe die Aversion gegen das Fußball-Beispiel nicht ganz. Immerhin ist es eine wissenschaftliche Arbeit und allein deshalb schon zitierfähig. Wenn jemand ein anderes Beispiel findet, welches ebensogut als Quelle taugt, dann möge er es stattdessen einfügen. --Pardox 20:26, 14. Feb. 2011 (CET)
was das fussballbeispiel explizit betrifft, sollten wir vielleicht besser oben im thread weiter diskutieren und hier dafuer noch mal die struktur an sich besprechen.
was die "inhaltlichen klammern" betrifft, kann man afaics beide positionen einnehmen: entweder man trennt auf hoeherer ebene die aufgabenbeschreibung von der mathematischen herleitung oder man trennt auf hoeherer ebene die unterschiedlichen varianten des problems.
die alte struktur fand ich persoenlich uebersichtlicher. und bisher hat sich ja eine mehrheit fuer den revert ausgesprochen, wobei ich wie gesagt, auch vorteile in der einleitung der neueren version sehe. wie waere es also mit einem revert unter beibehaltung der aktuellen einleitung? -- seth 22:48, 14. Feb. 2011 (CET)
wenn keine einwaende mehr kommen, werde ich demnaechst mal versuchen, das entsprechend umzusetzen. -- seth 20:16, 16. Feb. 2011 (CET)
Aus meiner weiterhin Sicht OK. Pro revert. --NeoUrfahraner 00:26, 17. Feb. 2011 (CET)
Ich bin nach wie vor gegen einen Revert. Die Gründe hatte ich oben bereits dargelegt:"Solch eine Darstellung ist, weil sie ihre Inhalte nicht nach Abschnitten sauber trennt und ordnet, unübersichtlich und für einen Laien schlechterdings kaum nachvollziehbar." Erst recht ist die alte Fassung nicht OMA-tauglich. --Pardox 15:49, 17. Feb. 2011 (CET)

Neuanfang

Hallo, ich habe mal einen Neuanfang gemacht: Umstrukturierung ist drin, Bachelorarbeit als Fußnote. Ich denke, dass es noch viele interessante Ergänzungen geben kann und der Artikel sowieso viel ausführlicher sein sollte. -- KurtSchwitters 19:30, 15. Feb. 2011 (CET)

Einverstanden! Ich würde die Fußnote allerdings eher an anderer Stelle im Artikel einfügen, und zwar an das Ende das vorletzten Satzes im Abschnitt "Mathematische Herleitung":"...dass für eine Wahrscheinlichkeit von mindestens 50 % nur 23 Personen benötigt werden (Fußnote Fußball-WM 2006)." --Pardox 20:19, 15. Feb. 2011 (CET)
gudn tach!
bitte die obigen threads ab #beispiel beachten. die derzeitige version entspricht nicht dem konsens, sondern wird sogar mehrheitlich abgelehnt. -- seth 22:11, 15. Feb. 2011 (CET)
Ja, sorry, ich konnte nur nicht ertragen, längere Zeit „sichten“ in meiner Beobachtungsliste zu sehen :-) Ein Revert auf eine frühere Version ist jetzt ja immer noch möglich. Nach nochmaligem Überdenken bin ich auch zu dem Schluss gekommen, dass für eine OMA-Tauglichkeit der Abschnitt nach der Einleitung nicht sofort die mathematische Herleitung sein darf. Es sollte also einen allgemeinverständlichen Abschnitt geben, ähnlich zur bisherigen „Eingrenzung“. -- KurtSchwitters 09:07, 17. Feb. 2011 (CET)
Wie der Abschnitt nach der Einleitung aussehen soll ist die eine Frage. Die andere ist, ob es Sinn macht, die alte Unübersichlichkeit wiederherzustellen...? --Pardox 15:51, 17. Feb. 2011 (CET)

beispiel

gudn tach!
beispiele sind ja haeufig sinnvolle ergaenzungen. aber das Beispiel Fußball-WM 2006, bei dem eine bachelorarbeit als beleg fuer trivialitaeten herangezogen wird, ist imho dem artikel nicht nuetzlich. das ist etwa so, wie wenn eine studentische arbeit beim Pizza-Theorem herangezogen wuerde, die in einer mini-untersuchung das theorem "unterstuetzte", also eher wertlos. -- seth 00:36, 12. Feb. 2011 (CET)

könnte man es als Quelle oder als "siehe auch" nehmen? --Riepichiep 07:47, 12. Feb. 2011 (CET)
1. Ist das Geburtstagsparadoxon eine mathematische Trivialität?
2. Ist eine Bachelorarbeit keine wissenschaftliche Arbeit?
3. Sind studentische Arbeiten, weil Mini-Untersuchungen, wertlos?
4. Sind Beispiele zur Motivation des Lesers in Artikeln unerwünscht?
5. Ich wäre dafür, dass der Verweis zum Lincoln-Kennedy-Mysterium gestrichen wird. Das hat wirklich gar nichts mit dem Geburtstagsparadoxon und seinem mathematischen Hintergrund zu tun. --Pardox 17:52, 12. Feb. 2011 (CET)
Ad 1: seth meint mit "Trivialität" nach meinem Verstädnis, dass die mathematische Aussage sich mit empirischen Daten belegen lässt.
Das ist aber nicht trivial, sondern betrifft die Kernaussage des Paradoxons. --Pardox 11:20, 13. Feb. 2011 (CET)
Die Kernaussage des Paradoxons ist, dass sich die mathematische Aussage mit empirischen Daten belegen lässt? --NeoUrfahraner 21:20, 13. Feb. 2011 (CET)
Insofern als die Auswahl von 23 Personen aus einer umfassenderen Menschenmenge (Ziehung ohne Zurücklegen) nicht dasselbe ist wie das Ziehen von 23 Geburtstagen aus einer Urne mit 365 Tagen (Ziehung mit Zurücklegen). --Pardox 20:10, 14. Feb. 2011 (CET)
Jetzt musst Du mir aber genauer erklären, was die Kernaussage des Paradoxons Deiner Menung nach ist. --NeoUrfahraner 11:38, 16. Feb. 2011 (CET)
Es geht ja um die obige Behauptung, dass es trivial sei, dass die mathematische Aussage sich mit empirischen Daten belegen lässt. Allerdings ist es m.M.n. nicht trivial, dass man eine Ziehung ohne Zurücklegen durch eine andere Ziehung mit Zurücklegen ersetzen darf. Genau das wird aber in der mathematischen Herleitung kommentarlos getan, und diese führt ja zur Kernaussage. --Pardox 16:04, 16. Feb. 2011 (CET)
Der Klapperstorch holt sich die Geburtstage aus einer Urne mit Zurücklegen. Er fliegt bei Bedarf auch mehrmals täglich. Was die Kernaussage ist, hast Du aber noch immer nicht gesagt.--NeoUrfahraner 00:25, 17. Feb. 2011 (CET)
1. Wieso gibt es dann einen Abschnitt "Ungleichmäßig verteilte Geburtstage", wenn die Geburtstage aus einer Urne mit Zurücklegen geholt werden? Offensichtlich sind nicht alle Geburtstermine gleich wahrscheinlich...
Richtig, eine Urne mit 365 gleich wahrscheinlichen Kugeln ist nur eine erste Näherung. Die Geburtstage sind nicht gleich wahrscheinlich (die Kugeln also sozusagen unterschiedlich groß), aber weiterhin (mit Ausnahme von Zwillingen etc.) unabhängig voneinander und identisch verteilt (mit Zurücklegen). Kennst Du den Unterschied zwischen gleichverteilt und i.i.d.? --NeoUrfahraner 00:07, 18. Feb. 2011 (CET)
2. Die Kernaussage ist die Ersetzung von 23 Personen, ausgewählt aus tausenden Individuen, durch 23 Geburtstage, ausgewählt aus 365 Tagen. --Pardox 15:45, 17. Feb. 2011 (CET)
Ich verstehe Deine Kernaussage noch immer nicht, da ich das Prädikat nicht gefunden habe. --NeoUrfahraner 00:07, 18. Feb. 2011 (CET)
Pardox meint das so (siehe auch oben unter „Mathematische Herleitungen“): Man betrachtet eine kleine Obermenge von Personen, aus denen die Stichprobe genommen wird. Angenommen, jeder Geburtstag kommt n-mal vor (z.B. 3650 Personen und n=10 Personen für jeden Tag des Jahres), dann führt die Auswahl einer Person mit Geburtstag 1. Januar dazu, dass für die zweite Auswahl für den 1. Januar nur noch 9 Möglichkeiten übrig bleiben.
Mögliche Anwendung: bei einer Tombola gibt es 100 (oder N) Preise und von jedem Preis n Exemplare. Man kann nun fragen, ab welcher Anzahl von Treffern/Ziehungen in der Tombola es wahrscheinlicher ist, einen Preis (mindestens) doppelt zu bekommen, als dass alle erhaltenen Preise verschieden sind. Wenn n groß ist, dann spielt es keine Rolle mehr und das Problem ist das gleiche wie beim Geburtstagsproblem. Pardox wünscht sich eine Klarstellung dieses asymptotischen Verhaltens (oder?). -- KurtSchwitters 09:13, 18. Feb. 2011 (CET)
1. Dieses Phänomen gibt es an sich, allerdings betrachte ich es nicht als Kernaussage des Geburtstagsparadoxons.
2. Die Unterscheidung ist nur dann relevant, wenn die Zusammensetzung der Obermenge a priori bekannt ist. Da wir aber die Obermenge nicht kennen, kann man gleich annehmen, der Geburtstag wird erst bei der Stichprobenauswahl fixiert. Wenn Du die Anwendung der Wahrscheinlichkeitsrechung auf Ereignisse, die in der Vergangenheit stattgefunden haben, deren Ausgang Du aber nicht kennst, ablehnst, musst Du es eben für künftige Ereignisse nehmen: 23 Kinder, die in zwei Jahren geboren werden.
3. Wie Du schon gesagt hast: selbst wenn die Zusammensetzung der Übermenge bekannt wäre, spielt es keine Rolle, da n groß ist. --NeoUrfahraner 09:59, 18. Feb. 2011 (CET)
Ad 2 bis 4: Das hängt vom konkreten Fall ab. Bei der Fussball-WM wäre für mich vor allem die interessante Frage, wie sehr die beobachteten Werte (ungleichmäßig verteile Geburtstage) von der Theorie (gleichmäßig verteile Geburtstage) abweichen. Außerdem ist zubeachten, dass, wenn die beiden Spiele A gegen B und B gegen C untersucht werden, die Wahrscheinlichkeiten nicht unabhängig sind (es können ja schon in Manschaft B zwei Spieler am gleichen Tag Geburtstag haben). Wird das in der Bachelorarbeit behandelt?
Das weiß ich nicht. Es ist aber auch egal, weil bei realen Menschengruppen diese Unabhängigkeit sowieso nicht garantiert werden kann. --Pardox 11:20, 13. Feb. 2011 (CET)
Wieso ist das egal? Und wieso ist bei repräsentativen Stichproben von Menschen diese Unabhängigkeit nicht garantiert? --NeoUrfahraner 21:20, 13. Feb. 2011 (CET)
Du sprichst von "repräsentativen Stichproben", ich rede von "realen Menschengruppen". Nimm als Beispiel zwei befreundete Mathestudenten mit demselben Geburtstag. Diese sitzen im gleichen Seminar (Stichprobe 1), sind auf der gleichen Fete (Stichprobe 2) und wohnen vielleicht noch im gleichen Flur des Studentenwohnheims (Stichprobe 3). Wenn die beiden also häufig zusammen auftreten, sind solche Stichproben, an denen sie beteiligt sind, nicht unabhängig, oder? --Pardox 20:10, 14. Feb. 2011 (CET)
"Realen Menschengruppen" und "repräsentative Stichproben" schließen einander nicht aus. Es kommt darauf an, ob die Überlappung der Stichproben ein "zufälliger" oder ein systematischer Effekt ist. Sinnvollerweise solltest Du die Stichproben gleich so wählen, dass sie disjunkt sind (also z.B. disjunkte Bereiche des Studentenheims). Bei den Spielen einer Fussball-WM ist die Überlappung der Stichproben jedenfalls systematisch und die Resultate sind somit verfälscht. --NeoUrfahraner 05:52, 16. Feb. 2011 (CET)
Was sind denn disjunkte Bereiche des Studentenwohnheims? --Pardox 16:04, 16. Feb. 2011 (CET)
Siehe disjunkt: Beispielsweise Zimmer 1 bis 23 und Zimmer 24 bis 46, unter der Voraussetzung, dass jeder Bewohner nur ein Zimmer mieten darf. --NeoUrfahraner 00:25, 17. Feb. 2011 (CET).
Ich verstehe immer noch nicht, worauf du hinaus willst. Die beiden befreundeten Mathestudenten bewohnen denselben Flur, also z.B. Zimmer 4 und 9. Was ändert das jetzt an der Abhängigkeit? --Pardox 15:45, 17. Feb. 2011 (CET)
Die beiden Studenten wohnen aber nicht in den Zimmern 24 bis 46; die Geburtstagsverteilung der Zimmer 24 bis 46 ist also unabhängig von der Geburtstagsverteilung der Zimmer 1 bis 23. Die Geburtstagsverteilung der Zimmer 11 bis 33 hingegen wäre abhängig von diesen beiden Verteilungen, siehe dazu Stochastische Unabhängigkeit. --NeoUrfahraner 00:07, 18. Feb. 2011 (CET)
Ad 5: Das Lincoln-Kennedy-Mysterium ist sozusagen eine Art mehrdimensionaler Verallgemeinerung. Dort steht auch "Das Phänomen, dass sich schon in einer relativ kleinen Personengruppe wahrscheinlich zwei Personen finden lassen, bei denen eine bestimmte Eigenschaft wie etwa das Geburtsdatum übereinstimmt, wird in der Mathematik als Geburtstagsparadoxon bezeichnet." Den Verweis streichen, halte ich nicht für zweckmäßig, aber man sollte den Zusammenhang deutlicher machen. --NeoUrfahraner 07:15, 13. Feb. 2011 (CET)
Ich halte das "Lincoln-Kennedy-Mysterium" für eine Art Kaffeesatzleserei. Wenn man sich die einzelnen Punkte mal durchliest, weiß man nicht, ob man lachen oder weinen soll. So ein Verlinkung in einem mathematisch-wissenschaftlichen Artikel schadet diesem nur. Und wer den von dir zitierten Satz geschrieben hat wollte wohl nur den Artikel aufwerten. --Pardox 11:20, 13. Feb. 2011 (CET)
PS: Wenn in einer Bachelorarbeit gezeigt wird, dass die Wahrscheinlichkeit, dass drei Personen am gleichen Tag Geburtstag haben, für ungleichmäßig verteilte Geburtstage größer ist als für gleichmäßig verteilte (wie es das zitierte Bloom-Paper für zwei zeigt), so wäre das sicher erwähnenswert. Für diese an sich naheliegende Aussage habe ich noch keinen Beleg gefunden. --NeoUrfahraner 07:28, 13. Feb. 2011 (CET)
gudn tach!
als ergaenzung zum ersten punkt: ja, das was NeoUrfahraner vermutete, meinte ich. deswegen hatte ich ja auch das etwas ueberspitzte pizza-theorem-beispiel angegeben. -- seth 19:41, 13. Feb. 2011 (CET)
Der in der en:WP verlinkte Artikel [1] verwendet auch das Fußball-Beispiel und stammt von 1998 (siehe [2]). Bei diesem Beispiel wurde darauf geachtet, dass alle verwendeten Spieler verschieden sind: „For our sample, we chose the ten Premier Division fixtures played on 19 April 1997, which at kickoff involved a total of 220 players and 10 referees.“ Das sieht mir nach einer vernünftigen Stichprobe aus, bei der es keine Überschneidungen gibt. -- KurtSchwitters 17:23, 19. Feb. 2011 (CET)
Das erscheint auch mir vernünftig. --NeoUrfahraner 14:36, 25. Feb. 2011 (CET)
dann schlage ich vor, die nennung der bachelor-arbeit (die eh anscheinend nicht so leicht einsehbar ist) zu streichen und ggf. durch das paper zu ersetzen. derzeit wird die bachelor-arbeit scheinbar als einzelnachweis verwendet, was hier keinen sinn macht. -- seth 23:20, 1. Mär. 2011 (CET)

Revert und weitere Überarbeitung

Hallo, ich habe die Version vom 22.01.2011 genommen, dort die Einleitung so angepasst, dass dort die Formulierung von Pardox steht, die Reihenfolge der beiden mathematischen Herleitungen vertauscht und die Formeln insofern vereinfacht, dass ich die Fakultäten und Binomialkoeffizienten erst bei der Approximation genommen habe, anstatt schon vorher. Den Satz mit "adäquatem Vergleichsmaßstab" habe ich gelöscht, da ich nicht verstehe, was er bedeutet (hatte ich schon mal hier angemerkt). Außerdem noch ein paar typographische Änderungen − bitte prüfen, ob es Euch gefällt. -- KurtSchwitters 09:32, 9. Mär. 2011 (CET)

Verwandte Beispiele: Memory

Das Beispiel beruht nicht auf Fachliteratur, scheint mir aber so übersichtlich zu sein, dass man es akzeptieren kann. Was meint Ihr? -- KurtSchwitters 13:38, 27. Apr. 2011 (CEST)

Einzelnachweise

Sinnverwandte Frage

Ich habe danach jetzt schon länger gesucht, aber bis jetzt leider nichts gefunden. Meine Frage: Wie viele verschiedene Menschen kann es theoretisch geben? Oder anders formuliert: Wie viele unterschiedliche DNA-Anordnungen, welche immer noch der Gattung Homo Sapiens zuordenbar sind, gibt es? Könnte es irgendwann in der Zukunft nur noch "Klone" von Menschen aus der Vergangenheit geben? Dank und Gruß Impériale (Diskussion) 14:24, 9. Okt. 2014 (CEST)

Kombination, Variation

In dem Beweis-Abschnitt ist von Kombinationen die Rede. Handelt es sich aber nicht hierbei um Variationen (n^k) und dann Permutationen (n!/(n-k)!)? https://de.wikipedia.org/wiki/Abz%C3%A4hlende_Kombinatorik 91.5.219.196 00:57, 10. Jul. 2015 (CEST)

Weitere Probleme

"Wie wahrscheinlich ist es, dass unter n Personen genau 2 Personen am gleichen Tag Geburtstag haben, die anderen aber an paarweise verschiedenen Tagen ?" Es wäre doch interessant, den Artikel um dieses Problem zu erweitern. --KaliNala (Diskussion) 16:49, 1. Jun. 2016 (CEST)

Mathematische Formeln vs Allgemeinverständlichkeit

Kann es sein, daß der Fall, daß 365 Leute in einem Raum alle an unterschiedlichen Tagen Geburtstag haben, exakt so wahrscheinlich ist, wie der Fall, daß 365 Leute in einem Raum alle am selben Tag Geburtstag haben? (Natürlich wieder die soziologischen Aspekte bzgl. geburtenstärkerer/schwächerer Monate und Schaltjahre außen vor gelassen...)
Ich glaube, bei einem Beispiel in dieser Richtung wird auch ein Normalbürger intuitiv verstehen, daß zwischen diesen beiden unwahrscheinlichen Extremen irgendwo ein "Break Even" liegen muß. Wer den Sachverhalt mal von dieser Seite her betrachtet, begreift leicht, daß fürs Auftreten von "Geburtstagspaaren" gar keine besonders hohen Personenzahlen notwendig sind.
--BjKa (Diskussion) 16:27, 24. Okt. 2016 (CEST)

Ich denke, dass diese beiden Wahrscheinlichkeiten sehr deutlich auseinander liegen, auch wenn natürlich beide Wahrscheinlichkeiten sehr klein sind. Kurzer Rechenweg: Die Wahrscheinlichkeit für lauter unterschiedliche Geburtstage ist 365!/365^365 (in Übereinstimmung mit der Formel aus dem Artikel) bzw. nach Kürzen einer 365 die Zahl 364!/365^364. Die Wahrscheinlichkeit für alle Geburtstage am gleichen Tag ist 365/365^365 = 1/365^364, da nur 365 Kombinationen möglich sind (für jeden Tag des Jahres). Die eine Wahrscheinlichkeit ist also um den Faktor 364! größer, was eine gigantische Zahl ist. Andererseits ist die Zahl 365^364 noch schlimmer, sodass ich auch mit Computer-Taschenrechner nicht an die konkreten Zahlen drankomme. Oder hatte ich jetzt einen offensichtlichen Denkfehler/Missverständnis, wie das bei Stochastik ja häufig passiert? ;) Die Frage nach dem Gleichstand oder "Break Even" wäre aber in der Tat eine sehr interessante Idee. Sozusagen ein Bezug zu einem "dualen" Problem. --Neunundneunzigwasser (Diskussion) 18:54, 1. Dez. 2016 (CET)