Diskussion:Relative Häufigkeit
Definition
BearbeitenWelche Definition wäre allgemeinverständlicher? Wer kennt Quellenangaben zur Definition?
Folgende Quelle habe ich gefunden: "Tritt ein zufälliges Ereignis A [...] in n ›Versuchen m-mal ein, so heißt hn(A):=m/n die relative Häufigkeit von A bei diesen Versuchen; die Zahl m selbst wird als absolute Häufigkeit bezeichnet." [1] (allerdings gibt es davon noch eine neuere Ausgabe, die man heranziehen sollte.)
Laut dieser Definition ließe sich die relative Häufigkeit nicht in der deskriptiven Statistik anwenden. Kennt jemand Quellen die zeigen, dass die relative Häufigkeit auch in der deskriptiven Statistik zum vergeleich von Teilmengen verwendet wird?--Christian stroppel 16:32, 6. Jan. 2009 (CET)
- Wer in Deutschland Statistik studiert, bekommt das Lehrbuch Statistik: Der Weg zur Datenanalyse von Fahrmeir et al empfohlen. Dort werden relative Häufigkeiten auf Seite 32 im Kapitel "Univariate Deskription und Exploration von Daten" erstmals vorgestellt und auch danach oftmals verwendet. Damit ist einwandfrei belegt, dass die relative Häufigkeit auch in der deskriptiven Statistik relevant ist.--Malte Schierholz 00:02, 11. Feb. 2009 (CET)
Danke. Die entsprechende Stelle habe ich gefunden. [2] Ludwig Fahrmeir (2007) schreibt: „Die folgende Definition ist für jedes Skalenniveau [des interssierenden Merkmals] sinnvoll: Als absolute bzw. relative Häufigkeit einer Ausprägung aj , j = 1, . . . , k, bezeichnet man die Anzahl bzw. den Anteil von Werten der Urliste, die mit aj übereinstimmen“ (S. 32). Das Wort Urliste ist ein Synonym zum Begriff Rohdaten und Primärdaten (S. 31). aj kennzeichnet dabei die die Ausprägung des Merkmals (S. 32) z. B. a0=männlich und a1=weiblich.-- Christian Stroppel 00:27, 24. Mai 2009 (CEST)
- Jemand hat in der Einleitung bedingte Häufigkeit geschrieben. Kann bitte dafür eine Quelle angegeben werden? Ich verstehe unter bedingter Häufigkeit was anderes. --Sigbert 16:03, 14. Feb. 2011 (CET)
- Der Begriff bedingte Häufigkeit kommt mir auch komisch vor... ich streiche ihn einmal heraus. Wenn jemand anderer Meinung ist kann er das ja hier ausdiskutieren... --Bw234 18:29, 31. Mai 2011 (CEST)
Da ich schon einmal dabei bin... ich überarbeite einmal den Definitionsteil. Ausserdem stelle ich die Definition mal nach vorne in den Artikel. --Bw234 18:34, 31. Mai 2011 (CEST)
Die nun überarbeitete Definition: „Sie gibt den Anteil der Versuche eines Zufallsexperiments, bei dem ein bestimmtes Ereignis eingetreten ist. Sie wird berechnet, indem die absolute Häufigkeit durch die Anzahl der Objekte oder Versuche überhaupt geteilt wird.“, könnte leicht den Eindruck erwecken, die Relative Häufigkeit wäre nun doch beschänkt auf Zufallsexperimente, [Zufalls]ereignisse, Vesuche und damit eben nicht auch als rein deskriptives Maß zu gebrauchen.--Christian Stroppel 11:37, 19. Jul. 2011 (CEST)
Der Einwand ist leider berechtigt. Ich hatte eigentlich nur der Einfachheit halber das Wort Zufallsexperiment verwendet, da mir 'Beobachtung' oder etwas ähnliches zu vage erschien. Ich ändere gleich mal den Artikel.--Bw234 23:40, 20. Jul. 2011 (CEST)
Sollte man das Beispiel zur pharmazeutischen Industrie löschen? Ich finde es didaktisch nicht besonders geschickt, ausserdem hat es m.E. nur wenig Erklärungswert. --Bw234 00:38, 21. Jul. 2011 (CEST)
Da sich bisher niemand gegenteilig geäussert hat, lösche ich erste einmal... Falls jemand das dringende Bedürfnis hat den gelöschten Text wieder einzufügen: s.u.
- === Nebenwirkungen pharmazeutischer Produkte ===
- Bei den Häufigkeitsangaben zu Nebenwirkungen pharmazeutischer Produkte werden folgende Definitionen zugrunde gelegt:
- Sehr häufig: mehr als ein Fall von zehn (> 0,10)
- Häufig: ein bis zehn Fälle von 100 (0,01 bis 0,10)
- Gelegentlich: ein bis zehn Fälle von 1000 (0,001 bis 0,01)
- Selten: ein bis zehn Fälle von 10000 (0,0001 bis 0,001)
- Sehr selten: weniger als ein Fall von 10000 (< 0,0001)
- In anderen Zusammenhängen können die verbalen Angaben anderen Zahlenwerten entsprechen. (nicht signierter Beitrag von Bw234 (Diskussion | Beiträge) 23:20, 25. Jul 2011 (CEST))
Alte Diskussionen
BearbeitenUnd wie rechnet man das aus ?
Relative Häufigkeit= Absolute Häufigkeit (v. Merkmalsausprägungen) / Gesamtheit (v. Merkmalsausprägungen) oder für den prozentualen Anteil mit 100 multipliziert. Die Formel lautet: f(xj)=h(xj)/n * 100
Beispiel:
x1=ledig x2=verheiratet x3=geschieden x4=verwitwet
h(x1) = 8 h(x2) = 10 h(x3) = 2 h(x4) = 4
n= Summe(x1,x2,x3,x4)=Gesamtheit= 24
f(x1) = 0,33 / 33,33% f(x2) = 0,42 / 41,66% usw... --Dr.G0nzo 23:26, 2. Jan 2006 (CET)
Was soll der Verweis auf prozentuale Häufigkeit, wenn man wieder hierher zurückgeleitet wird??? das ist unsinnig... **das ist doch viel zu kompliziert man sollt es einfacher erläutern!!** ))masched((
das beispiel "In einer Umfrage werden 453 Personen nach ihrem Alter befragt. Bei der Auszählung stellt man fest, dass 197 Personen in die Klasse "von 20 Jahre bis unter 30 Jahre" fallen. Damit ist die relative Häufigkeit dieser Klasse 197/453 = 43,5%." ist doch falsch..es muß 197/413 heißen. ich änder das mal
Ich finde den Artikel zu wissenschaftlich. Wie soll ein Laie soetwas verstehen ?
Ich bin Schülerin und habe ein paar Sachen davon verstanden ! Aber besser ist dieser Text für Studenten oder ähnliches.
- Karina (nicht signierter Beitrag von 95.33.38.133 (Diskussion | Beiträge) 18:29, 8. Apr. 2010 (CEST))
Übungsaufgabe
BearbeitenIch bin für Übungsaufgaben und Beispiele und hab deswegen, die Aufgabe drin gelassen auch wenn sie den Begriff relative Häufigkeit nicht erklärt. Vielleicht ließe sich die Augabe noch modifizieren, dass dieser Begriff noch in ihr vorkommt.--Christian stroppel 14:34, 11. Mai 2008 (CEST)
- Ich finde gut, dass die Aufgabe im Artikel vorkommt. Beispiele sind oft die beste Erklärung. – Metoc 21:07, 10. Jun. 2008 (CEST)
A posteriori Wahrscheinlichkeit
BearbeitenDie Hinweise auf A-posteriori-Wahrscheinlichkeiten gehören m. E. nicht in den Artikel, da der Begriff A-posteriori-Wahrscheinlichkeit aus dem Umkreis der Bayesianischen Statistik kommt. In einem Artikel über relative Häufigkeiten hat der Begriff nichts zu suchen. Zudem sind die hier verwendeten Definitionen von A-posteriori- und A-priori-Wahrscheinlichkeit grottenfalsch...
Ich fange dann mal an zu löschen (dann wird der Artikel auch leichter lesbar). --Bw234 20:35, 13. Feb. 2011 (CET)
Der Begriff A-priori-Wahrscheinlichkeit taucht doch im Zusammenhang mit dem Laplace-Experiment oder Bernoulli-Versuch auf (Der theoretisch gerechte Würfel). Allerdings wird hier oft nicht mehr von der relativen Häufigkeit gesprochen, sondern gleich von Wahrscheinlichkeit. Ferner liest man über einen selbstgebastelten Würfel: "Man erhält in diesem Fall unter Zuhilfenahme der Erfahrung aus den Versuchen die Wahrscheinlichkeit a posteriori oder die statistische Wahrscheinlichkeit: die relative Häufigkeit in einer sehr großen Versuchsserie.[...] Der Unterschied zwischen einer relativen Häufigkeit und einer Wahrscheinlichkeit besteht darin, dass sich eine relative Häufigkeit auf den erfassten Zusatnd einer Stichprobe in der mehr oder weniger unmittelbaren Vergangenheit bezieht, eine Wahrscheinlichkeit bezieht sich jedoch auf ein zukünftiges Ereignis."[3]--Christian Stroppel 17:59, 19. Jul. 2011 (CEST)
Hmmm, ich bin mir nicht sicher ob man in diesem Zusammenhang aus dem Buch von Sachs zitieren sollte. Im Gegenzug mal ein Zitat aus minem vielgeliebten Rüger-Buch: "Man kann daher P(A) nach der Laplaceschen Wahrscheinlichkeitsdefinition als Quotient aus 'Anzahl der für A günstigen Fälle' und 'Anzahl aller möglichen Fälle' bestimmen. Diese Bestimmung ist nicht empirisch orientiert, sie geschieht vor jeder Beobachtung von Ergebnissen eines Experiments, ist also eine a priori Methode." [4]
Hier ist ganz klar nicht von a priori Wahrscheinlichkeiten die Rede sondern nur von einer a priori-Methode. Ich denke hier verwendet Sachs' Buch eine Definition, die im Allgemeinen so nicht verwendet wird.
Im allgemeinen Gebrauch bezeichnet a-priori-Wahrscheinlichkeit einen Begriff aus der Bayesianischen Statistik. (siehe auch in dem oben angegebenen Buch von Rüger, auf Seite 24). --Bw234 00:38, 21. Jul. 2011 (CEST)
Noch einmal zu obigem Thema... . In der bayesianischen Statistik sind a-priori-Wahrscheinlichkeit und a-posteriori-Wahrscheinlichkeit genau definierte Begriffe und haben nichts mit dem zu tun was in dem Sachs-Buch dargestellt wird. Quellen: das o.g. Buch von Rüger[5] oder beispielsweise die Einführung von Gelman et al. in die bayesianische Statistik[6] . In der frequentistischen Statistik werden hingegen diese Begriffe meines Wissens nach nicht verwendet. Zusammenfassend denke ich daher dass das Zitat aus dem Buch von Sachs keine zuverlässige Grundlage für die früher in diesem Artikel verwendete Definition von a-priori-Wahrscheinlichkeit und a-posteriori-Wahrscheinlichkeit ist. --Bw234 23:16, 21. Jul. 2011 (CEST)
Quellen
Bearbeiten- Bernhard Rüger: Induktive Statistik. Einführung für Wirtschafts- und Sozialwissenschaftler. R. Oldenbourg Verlag, München Wien 1988. ISBN 3-486-20535-8
- Andrew Gelman, John B. Carlin, Hal S. Stern and Donald B. Rubin: Bayesian Data Analysis. Chapman & Hall/CRC, Boca Raton London New York Washington DC, 1995. ISBN 0-412-03991-5
Einzelnachweise
Bearbeiten- ↑ Müller, P. (1980).Lexikon der Stochastik. Wahrscheinlichkeitsrechnung und mathematischen Statistik. Akademie-Verlag: Berlin S.213
- ↑ Ludwig Fahrmeir, Künstler, R., Pigeot, I. und Tutz, G. (2007) Statistik: Der Weg zur Datenanalyse. Berlin: Springer
- ↑ Von Lothar Sachs,Jürgen Hedderich. (2006). Angewandte Statistik. Springer, S.111 und 112[online http://books.google.com/books?id=kTsBP77mqzUC&pg=PA112&dq=A-priori-Wahrscheinlichkeit+laplace+relative&hl=de&ei=tKElTvzrBZGq-ga914HcCw&sa=X&oi=book_result&ct=result&resnum=1&sqi=2&ved=0CCkQ6AEwAA#v=onepage&q=A-priori-Wahrscheinlichkeit%20laplace%20relative&f=false], zusätzlicher Text.
- ↑ Bernhard Rüger (1988), S. 17
- ↑ Bernhard Rüger (1988), S. 24
- ↑ Gelman et al. (1995), S. 10ff.
Additive Smooting
Bearbeitenhttps://en.m.wikipedia.org/wiki/Additive_smoothing wäre gut zu erwähnen, Nützlich falls für einen Fall bisher keine Beobachtungen vorlagen. biggerj1 (Diskussion) 23:36, 15. Jun. 2023 (CEST)
Sprachliche Mängel, fehlende Genauigkeit
BearbeitenAus der Einleitung:
- "Um die relative Häufigkeit zu definieren, nehmen wir an, dass die zugrundeliegende Menge Elemente aufweist." Was ist das denn für eine Formulierung? Darf man einfach alles annehmen?
- "Unter diesen Elementen tritt -mal das Ereignis auf." Sind wir in der Wahrscheinlichkeitstheorie oder der deskriptiven Statistik? Mir scheint, dass hier Begrifflichkeiten durcheinandergeraten. Und wofür braucht es einen Index n bei der Bezeichnung der relativen Häufigkeit?
- "Die relative Häufigkeit wird berechnet als die Anzahl der Beobachtungen mit dem Merkmal dividiert durch die Gesamtzahl aller Elemente in der zugrundeliegenden Menge." Mir scheint es, als würden "Merkmal" und "Merkmalsausprägungen" verwechselt werden.
- "Die relative Häufigkeit ergibt sich daher als..." Die relative Häufigkeit ergibt sich aus gar nichts, sondern ist so definiert.
- " wird auch als absolute Häufigkeit bezeichnet." Das ist korrekt, wobei der Zusatz "der Merkmalsausprägung A" fehlt. Doch warum kommt diese Erläuterung erst drei Sätze hinter der ersten Erwähnung von H_n(A) im Text?