Diskussion:Median/Archiv/1

Letzter Kommentar: vor 2 Jahren von 2003:D4:7F15:2AF9:7158:2E9C:8C0B:56A7 in Abschnitt OMA-tauglichkeit und Umbau

grundgesamtheit

Den Median gibt es übrigens auch in der Grundgesamtheit! --Philipendula 14:20, 11. Jun 2004 (CEST)

hat sich das eigentlich mittlerweile erledigt? -- seth 22:15, 20. Jul. 2007 (CEST)

beispiele

Geometrie

Die Seitenhalbierende teilt das Dreieck nicht generell in zwei flächenhaft gleich große teile. Die Analogie im Text oben ist also falsch... Dies gilt so nur für gleichschenklige Dreiecke und der Seitenhalbierenden der Basis. (Der vorstehende, nicht signierte Beitrag stammt von 134.245.134.104 (DiskussionBeiträge) Philipendula)

Äh, möepp? -- Philipendula 13:18, 15. Apr. 2008 (CEST)
Die Seitenhalbierende ist definiert als Gerade durch die Mitte der Seite und den gegenüberliegenden Punkt. Damit teilt sie das Dreieck in 2 gleiche Hälften. Ich war zuerst wie du aufgebracht, weil ich Seitenhalbierende als lotrechte Gerade durch den Mittelpunkt der Seite verstand, so ist sie aber nicht definiert, siehe Seitenhalbierende. --Franz Berwein 01:27, 19. Feb. 2009 (CET)


"Damit teilt sie das Dreieck in 2 gleiche Hälften." Das ist ja wohl Quatsch. Nichts für ungut, Dominik (nicht signierter Beitrag von 87.146.244.204 (Diskussion | Beiträge) 17:55, 9. Nov. 2009 (CET))

2. Beispiel: Median = 3,5

Beispiel 2: Gerade Zahl n von Meßwerten

1, 2, 3, 4, 5, 6

>> Der Median ist 3,5. Er berechnet sich aus ½ ( 3 + 4).


Dieses Beispiel ist falsch, soweit ich weiß, ist das korrekte Ergebniss 3 und 4. Das Ergebniss kann nur ein Wert der Eingangsgrößen sein. --Habakuk <>< 13:45, 3. Mär 2005 (CET)

IIRC ist der Median 1/2 * (x(n/2) + x((n/2)+1)) (bei gradem n) wobei n die Anzahl der Merkmale ist. Beispiel: 1,5,6,9,14,17 (grade Anzahl) -> x(n/2) ist 6 (der 6/2=3. Wert); x(n/2+1) ist 9 (der 6/2=3+1=4. Wert). M ist also (6+9)/2=7,5 --84.136.245.217
3.5 (http://www.umverteilung.de/rechner/?tupletext=1,1%7C1,2%7C1,3%7C1,4%7C1,5%7C1,6)
7.5 (http://www.umverteilung.de/rechner/?tupletext=1,1%7C1,5%7C1,6%7C1,9%7C1,14%7C1,17)
DL5MDA 10:35, 20. Jul. 2007 (CEST)
ja, je nach definition muss der median ein element der menge sein. steht mittlerweile aber alles im artikel. -- seth 21:46, 20. Jul. 2007 (CEST)
Vielleicht steht's da nicht klar genug ;-). Wie im Artikel richtig steht, ergibt sich der Median bei einer geraden Zahl von Elementen aus zwei Elementen. DL5MDA 22:44, 20. Jul. 2007 (CEST)
im artikel wird zunaechst vom median berichtet, der bei einer geraden anzahl an elemtenten das arithmetische der beiden mittleren ist. kurz darauf ist aber von ober- und untermedian die rede (zwar habe ich diese beiden begriffe so noch nicht gesehen, aber kenne die stochastische definition, die sich eben damit deckt). was sollte deiner meinung nach noch klarer formuliert werden? -- seth 00:00, 21. Jul. 2007 (CEST)

Das Beispiel ist richtig

Der Median dieser Stichprobe ist 3,5.

Man schaue sich zur Versicherung z.B die Excel Funktion Median an. (unbekannte IP)

Die Aussage ist richtig, ohne die Begründung wäre sie fundierter gewesen :-) --Suricata 4. Jul 2005 10:40 (CEST)
Hab mir grade Excel gekauft, an welcher Uni kann ich mich nun als Matheprof bewerben? --WikiWichtel Cappuccino? 4. Jul 2005 10:53 (CEST)

Ok, richtig, als Mathematiker hätte ich zur Bestätigung der Aussage direkte Literaturangaben angeben müssen. Da aber nicht jeder ein Statistik Buch zur Hand hat, habe ich die einfachste Methode zur Bestätigung des Beispiels gewählt: Nimm ein Programm, das jeder hat und das die Median Funktion anbietet, und schaue nach, was es ergibt! Wenn es das selbe Ergebnis, wie die Beispielrechnung ergibt, würden mir zumindestens erste Zweifel kommen, ob das Ergebnis tatsächlich falsch ist. Dann schnapp ich mir entweder ein Buch, um auf Nummer sicher zu gehen, oder ich mache Bill Gates per e-mail auf den Excel-Fehler aufmerksam :)

Beispiel entfernt

Folgendes Beispiel habe ich herausgenommen:


Angenommen, eine Gemeinde erfasst ihre Häuser nach Bewohnerzahl statistisch und ermittelt folgende Werte:

  • 30 Häuser mit 3 Personen
  • 20 Häuser mit 4 Personen
  • 2 Häuser mit 100 Personen (Hochhäuser)

Die durchschnittliche Bewohnerzahl pro Haus (Mittelwert) ist dann  , der Median ergibt dagegen einen Wert von 3 Bewohnern pro Haus. Das nach dem Mittelwert suggerierte „Durchschnittshaus“ mit 7 Bewohnern gibt es aber überhaupt nicht; hier kann je nach Betrachtungszweck der Median die sinnvollere Größe sein.


Das Beispiel ist zwar richtig, aber etwas unglücklich, denn wir haben 2 Bezugsgrößen, die Personen und die Häuser.

  1. Mehr als die Hälfte der Häuser werden von nur drei Personen bewohnt
  2. Mehr als die Hälfte der Personen wohnen in Hochhäusern mit 100 Bewohnern

Da verliert sowohl die 3 als auch die 7,12 an Aussagekraft. Falls unbedingt nötig könnte man Autos mit PS nehmen. Da kommt man nicht in Versuchung PS als Bezugsgröße zu nehmen. --Suricata 15:13, 14. Mär 2006 (CET)


Eine Kleinigkeit: Kann man nicht die Formeln neu einscannen? Die Qualität ist dieses Beitrags etwas "unwürdig" ;) (und umso später der abend um so verschwommener...) Wäre nett ;)

", zum Beispiel der Häufigkeitsverteilung einer Datenmenge oder Stichprobe oder der Wahrscheinlichkeitsverteilung einer Zufallsvariablen."

Warum diese Beispiele? Sie verwirren den Leser nur. Es geht schlicht um eine x-beliebige Menge: Ob das eine Stichprobe ist, ob es eine Wahrscheinlichkeitsverteilung oder eine empirische Häufigkeitsverteilung ist, ist völlig egal. Ich habe den Abschnitt daher wieder entfernt. Kängurutatze (Diskussion) 10:03, 7. Mär. 2012 (CET)

Mir gings eben um "Verteilung", vorher stand da "Datenmenge". Also okay von mir aus. Aber Lagemass raus? --Erzbischof 10:17, 7. Mär. 2012 (CET)
Verstehe ich nicht. Quantile sind doch Lagemasse, das ist doch also impliziert. Kängurutatze (Diskussion) 10:55, 7. Mär. 2012 (CET)
Lagemass ist ein Wort, was auch ausserhalb der Fachsprache richtig verstanden werden kann, "aha, ein Wert, der die Position angibt"... --Erzbischof 11:27, 7. Mär. 2012 (CET)

Der Artikel hat - wie fast alle Artikel zu statistischen Maßzahlen - das Problem, dass _drei_ verschiedene (aber natürlich zusammengehörige) Begriffe als Median bezeichnet werden: 1. Der Median von konkreten Daten, also das Lagemaß aus der deskriptiven Statistik. 2. Der Stichprobenmedian, also eine Schätzfunktion in der induktiven Statistik und 3. den Median einer Wahrscheinlichkeitsverteilung. Wenn es nur einen Artikel "Median" geben soll (worüber man natürlich diskutieren kann), dann muss er schon auf alle drei Bedeutungen eingehen, also auch Stichproben und Wahrscheinlichkeitsverteilungen erwähnen. -- HilberTraum (Diskussion) 12:17, 7. Mär. 2012 (CET)

Verstehe ich schon wieder nicht. Es werden doch in der Folge alle drei Konzepte erklärt. Man könnte die Abschnitte natürlich geeignet in der Einleitung verlinken. Dann sind es aber keine Beispiele mehr. Kängurutatze (Diskussion) 18:19, 7. Mär. 2012 (CET)
Ja, "Beispiele" sollte man das vielleicht nicht nennen, aber wenn der Artikel die drei Konzepte erklärt, dann müsste doch die Einleitung auch konkret alle drei Konzepte nennen. Und weil sie sich doch voneinander unterscheiden, kann man sie auch nicht, wie du oben vorgeschlagen hast, alle in einen Topf werfen. -- HilberTraum (Diskussion) 19:41, 7. Mär. 2012 (CET)
Ich sehe es wie HilberTraum, alle Konzepte müssten in der Einleitung angesprochen werden. Ausserdem wird der Median als Schätzfunktion im Artikel gar nicht angesprochen; der dritte Abschnitt Median von gruppierten Daten müsste eigentlich ein Unterabschnitt von Median einer Stichprobe sein, da er auf einen Spezialfall bei der Datenstruktur der Stichprobe eingeht. --Sigbert (Diskussion) 20:43, 7. Mär. 2012 (CET)
Apropos Statistik, die Anwendbarkeit des Medians im Zusammenhang mit verschiedenen Skalenniveaus wie weiter oben totdiskutiert müssten wir auch noch mal anpacken. --Erzbischof 21:51, 7. Mär. 2012 (CET)

geordneten Stichprobe ?

Was genau bedeutet "geordneten Stichprobe"?

Wenn die Ergebnisse der Stichprobe lauten (5, 4, 3, 2, 1, 2, 3, 4, 5) wie lautet dan der Median?

  • 1
  • 3 da die Stichprobe geordnet (1, 2, 2, 3, 3, 4, 4, 5, 5) lautet

Honeybal 02:09, 17. Aug 2005 (CEST)

3, das wird nach meinem Dafürhalten auch durch den Absatz klar. Sollte man da etwas verbessern? --Suricata 08:30, 17. Aug 2005 (CEST)
Mir war nicht sofort klar, was mit "sortierter Zahl von Messwerten" und "Median einer geordneten Stichprobe" gemeint ist (kein Mathematiker :)). Unter dem Stichwort Stichprobe findet man dazu leider auch keine Erläuterung. Mit etwas Überlegung, vor allem mit dem Vergleich Median mit Mittelwert, wird der Sachverhalt aber klar. Honeybal 15:51, 17. Aug 2005 (CEST)
In der Tat ist die "sortierter Zahl von Messwerten" Unfug, habe es geändert zu "sortierte Reihe von Messwerten".--Suricata 15:55, 17. Aug 2005 (CEST)

Median(e)/Schwerlinie

Das könnte man auch nach Schwerpunkt "dieser artikel"n --W!B: 22:33, 6. Mai 2006 (CEST)

Danke für diese Anregung :-) Sie hat mich auf zwei Falschaussagen in diesem Artikel gebracht [1]:
  1. Es gibt durchaus asymmetrische Verteilungen, in denen Arithmetisches Mittel und Median zusammenfallen.
  2. Median und Schwerelinien sind unterschiedliche Dinge. Nicht jede Gerade durch den Schwerpunkt teilt ein Dreick in zwei flächengleiche Hälften. Die Seitenhalbierenden sind zufällig Median und Schwerlinien in einem.
--Suricata 11:55, 7. Mai 2006 (CEST)
soll dann Schwerlinie auf Schwerpunkt zeigen und dort definiert werden? --W!B: 19:51, 7. Mai 2006 (CEST)
Auf jeden Fall, ich setze das gleich um. --Suricata 07:33, 8. Mai 2006 (CEST)

median von gruppierten daten

gudn tach! hat jemand dafuer gescheite quellen? wenn nicht, wuerde ich den abschnitt gerne kicken. falls doch: dann wuerde ich ihn gerne umschreiben. -- seth 00:51, 7. Jul 2006 (CEST)

Hallo: Quelle im Internet: http://www.uni-oldenburg.de/zef/k3659/kap-4/med-form.html ansonsten diverse Statistikbücher beispielsweise Müller Benedict: Statistik in den Sozialwissenschaften 2003: S.71
In diesen Formeln wird bei geraden n das medianelement bei (N+1)/2 festgesetzt. Habe es aber auch schon anders gesehen.
Sorry für die miese Form und so, habe von den LaTEX sachen keine Ahnung. Würde mich freuen wenn du es verbessern würdest . Benutzer:Flexi24
Es ist natürlich naheliegend Unsicherheiten einfach durch lineare Interpolation innerhalb der Nachbarwerte abzuschätzen. Dem liegt die Annahme zu Grunde, dass die tatsächliche Verteilung innerhalb des Intervalls gleichmäßig ist. Aus mathematischer Sicht ist das ziemlich unbefriedigend, aber wenn die Sozialwissenschaftler unbedingt Zahlen brauchen, muss halt so ein Verfahren herhalten. :-) --Suricata 15:51, 7. Jul 2006 (CEST)
ach so. ja ja, die sozialwissenschaftler mal wieder *g*. ok, ich formuliere es um. -- seth 23:21, 7. Jul 2006 (CEST)
http://www.umverteilung.de/rechner berechnet auch den Median von gruppierten Daten. Der rechnerische Kern des Programms ist hier: http://luaforge.net/frs/?group_id=49&release_id=773 in zwei alternativen Skriptsprachen: Lua und Phyton. Der Rechner ermittelt Ungleichververteilungskoeffizienten, mit denen man (z.B. wie von Amartya Sen vorgeschlagen) Wohlfahrtsfunktionen berechnen kann. Die sind eine Alternative zum Median.
Übrigens: Bei einer geraden Zahl von Quantilen gilt nicht „Dem liegt die Annahme zu Grunde, dass die tatsächliche Verteilung innerhalb des Intervalls gleichmäßig ist.“ Das Programm nimmt in diesem Fall das gewichtete arithmetische Mittel der beiden betroffenen Quantile. Bei der Wohlfahrtsfunktion hat man das Problem nicht. Auch müssen die Daten - solange man nicht auch eine hübsche Lorenz-Kurve malen will - nicht sortiert werden. (Wegen des Medians sortiert das Programm die Daten allerdings doch).
DL5MDA 10:47, 20. Jul. 2007 (CEST)
mit "gleichmaessig" schloss Suricata afais z.b. sowas wie ein gewichtetes arithmetisches mittel der infrage kommenden werte nicht aus. lineare interpolation war nur _ein_ beispiel. letztlich ist aus mathematischer sicht erst mal beides gleich schlecht. dass es bei einigen anwendungen - z.b. bei den sozial- oder den wirtschaftswissenschaftlern - u.u. aus heuristischen gruenden sinnvoll sein kann, mal das eine oder mal das andere zu verwenden, will ich jedoch nicht bestreiten. -- seth 22:03, 20. Jul. 2007 (CEST)
Könnte es sein, dass aus mathematischer Sicht erst mal nicht nur Beides gleich schlecht ist, sondern auch das Gleiche ist? DL5MDA 22:51, 20. Jul. 2007 (CEST)
;-) und gegen was richtete sich dann dein "uebrigens: ..."? -- seth 23:52, 20. Jul. 2007 (CEST)

Weiterer Vorteil des Medians

Bei ordinalen, aber nicht metrischen Daten (z.B. Schulnoten) kann man soweit ich weiß kein arithmetisches Mittel verwenden, wenn man auf Korrektheit Wert legt. Einen Median hingegen kann man angeben. Wenn das stimmt, kann das jemand formulieren und einbauen.

19:13, 20. Sep 2006 (CEST)

man kann auch das arithmetische mittel verwenden. die frage ist, was man unter "korrektheit" versteht. mathematisch ist der begriff in diesem kontext afaik nicht ueblich. -- seth 23:17, 20. Sep 2006 (CEST)
Das arithmetische Mittel gilt bei ordinal skalierten Werten als unfein. Man kann die Bruchteile nicht interpretieren, weil die Abstände zwischen den Ausprägungen nicht definiert sind. Man merkt das z.B. an einer Aussage wie: Die Hotels in Frankfurt haben im Durchschnitt 2,3 Sterne. --Philipendula 00:25, 21. Sep 2006 (CEST)
naja, 1. kann man auch die bruchteile (auf unterschiedliche weise) interpretieren, obwohl es 2,3 sterne nicht gibt und 2. koennen auch beim median (nach aktueller wikipedia-definition im abschnitt zum "median einer stichprobe") 2,5 sterne herauskommen. der tatsaechliche vorteil des medians wird bereits mehrmals im artikel genannt. wenn die sache mit den nicht-metrischen daten fuer bestimmte statistiker sehr wichtig ist, sollte das imho wenn ueberhaupt, dann nur sehr vorsichtig formuliert werden, denn was interpretierungswuerdig ist und was nicht, ist bei statistiken in den vielen faellen ansichts-/glaubenssache. -- seth 10:27, 21. Sep 2006 (CEST)
Das Problem bei 2,3 Sternen ist nicht, dass es nur ganze Sterne gibt, sondern dass die Einheit 1 Stern nicht quantitativ angegeben werden kann. Es ist auch ein 4-Sterne-Hotel nicht doppelt so gut wie ein 2-Sterne-Hotel, aber es sind 4 Kinder doppelt so viele wie 2. Deshalb darf man 2,3 Kinder sagen, aber nicht 2,3 Sterne (Für Leute mit Ahnung: Ich weiß, dass der Vergleich teilweise angreifbar ist.) Kinderzahl ist metrisch diskret, Sternezahl ist ordinal. Man kann nur sagen, ein 4-Sternhotel ist besser als ein 2-Sterne-Hotel, mehr nicht. Und deshalb ist die Mittelung methodisch unzulässig, auch wenn man es in der Psychologie, Marktforschung, Medizin usw. ungerührt macht. Ich darf vielleicht noch Schaich, Köhle etc., Statistik II, zitieren, wenn man schon mir nicht glaubt: Nun wird von n Beobachtungswerten xi eines mindestens intervallskalierten Merkmals ausgegangen. Das ... arithmetische Mittel dieser n Beobachtungswerte ist wie folgt definiert. In ähnlicher Form taucht das noch bei anderen Autoren auf. --Philipendula 10:58, 21. Sep 2006 (CEST)
ich hatte es schon vorher verstanden, meine jedoch trotzdem, was ich meine. ;-) das mit den kindern ist imho meist nichts anderes als mit den sternen. z.b. 4 kinder kosten (und um sowas geht es ja haeufig) nicht genau doppelt so viel wie 2 kinder und wenn man nur die _anzahl_ von sternen betrachtet und nicht deren _guete_, so ist man ja doch wieder im metrischen bereich... und da liegt auch der hund begraben. eigentlich ist das arithmetische mittel bei nicht-metrischen daten doof, aber die meisten ordinalen, nicht-metrischen daten werden eben doch wieder zu metrischen verwurschtelt, naemlich dadurch, dass man doch wieder nur auf die anzahl der jeweiligen daten schaut. bei schulnoten hat, obwohl die 1 nicht 6-mal so gut ist wie die 6, ein arithmetisches mittel eben doch ein bissl aussage. wenn der median 6 ist, weiss man nur, dass mind. 50% der leute eine 6 hatten, ueber die anderen weiss man genau nichts. wenn das arithmetische mittel 5,3 ist, weiss man, dass ein relativ grosser haufen der leute eine 6 hatte und die anderen relativ wenige gute noten oder eben viele nicht ganz so schlechte hatten oder eine entsprechende mixtur daraus, jedenfalls ist information enthalten. (und selbst wenn die notenstufen nicht aequidistant verteilt waeren, koennte man sie fuer das arithmetische mittel temporaer auf gleiche abstaende bringen.)
sollte man darauf nun noch genauer im artikel eingehen? -- seth 11:23, 21. Sep 2006 (CEST)
Was mit Quellen belegt werden kann ... gell? --Philipendula 12:23, 21. Sep 2006 (CEST)
was genau soll mit quellen belegen werden? dass man das arithmetische mittel anwendet, hast du doch weiter oben selbst schon gesagt, oder wie sollte ich sonst "[...] ist die Mittelung methodisch unzulässig, auch wenn man es in der Psychologie, Marktforschung, Medizin usw. ungerührt macht" verstehen? -- seth 17:16, 21. Sep 2006 (CEST)

Kern der Aussage ist IMHO: Einen Median kann man bei jeder Totalordnung bilden, auch wenn es keine quantitative Bewertung gibt. Also wenn a besser ist als b, b besser als c und c besser als d und e, dann ist bezüglich der Güte (besser-Relation) immer c der Median der Elemente a,b,c,d,e. Wenn ich irgendeine Bewertungsfunktion finde, die bezüglich der besser-Relation monoton steigt, wird der Median immer die Bewertung von c sein. --Suricata 13:21, 21. Sep 2006 (CEST)

Yep --Philipendula 13:28, 21. Sep 2006 (CEST)
ja, soweit sind wir uns wohl alle einig. die frage war afais, wann man das arithmetische mittel verwenden darf. offensichtlich macht es keinen sinn, das arithmetische mittel auf nicht-numerische objekte wie dienstgrade oder "a", "b", "c" etc. direkt anwenden zu wollen. durch den isomorphismus a->1, b->2, c->3 usw. laesst sich aber das arithmetische mittel auch auf diese daten anwenden. dass das arithmetische mittel z.b. bei den schulnoten eine aussage hat, habe ich bereits oben gesagt. -- seth 17:15, 21. Sep 2006 (CEST)

Zunächst mal kann man den Median von Ordinalzahlen nur zuverlässig bilden, wenn man eine ungerade Anzahl Stichprobenelmente hat. Ansonsten kann es halt passieren, dass zwei verschiedene Werte in der Mitte stehen, und aus denen kann man keinen Mittelwert bilden. Dann sollte man beachten, dass sinnvolle Interpretationen des Medians ordinaler Zahlen nur sinnvoll sind, wenn es eine hinreichende Zahl an Beobachtungen und vor allem eine recht große Zahl möglicher Ausprägungen gibt. Im Fall der Hotelsterne: Wenn ich wissen will, wie die Hotelqualität in den Ländern dieser Welt ist (angenommen es gäbe international einheitliche Maßstäbe) kann man wohl den Median der Hotelsterne jedes Landes dieser Welt bilden und diese vergleichen; nur wird man wohl so gut wie immer bei "3" landen, da sich so viele Beobachtungen auf so wenig Werte verteilen, dass - außer bei ganz schiefen Verteilungen - in der Mitte immer eine drei befindet. Es mag Anwendungen geben, bei denen der Median von ordinalzahlen ein sinnvolles Maß ist; aber ich halte diese für rar gesät, und in der Literatur habe ich noch nichts darüber gelesen. Ich bin da kein Experte, möglicherweise gibt es solche Definitionen in einigen Werken - dann möchte ich aber ordentliche Quellenangaben, alles andere wäre Theoriefindung / Original Research und als solche nicht mit der Wikipedia vereinbar. -- H005 16:29, 21. Sep 2006 (CEST)

Man verwendet den Median bei sehr vielen Verfahren in der Explorativen Datenanalyse anstelle des arithmetischen Mittels, weil er ein resistenter und robuster Schätzer ist. Ich kann da ziemlich Literatur anführen. Wär mal interessant, ob die Anderen das auch können. --Philipendula 16:53, 21. Sep 2006 (CEST)
du hast vollkommen recht, dass der median robuster ist als das arithmetische mittel. das stellte hier aber afais auch niemand infrage und es wird auch bereits mehrmals im eigentlichen artikel gesagt. -- seth 17:27, 21. Sep 2006 (CEST)
Keine Frage, aber da geht es immer um Kardinalwerte, zu Ordinalwerten kenne ich nichts. -- H005 17:47, 21. Sep 2006 (CEST)
Das mit den Ordinalwerten, nämlich dass da das arithmetische Mittel nicht sinnvoll ist, hab ich oben mit Quelle belegt. Wieviel sollens denn noch sein? Hartung oder Schwarze? --Philipendula 18:56, 21. Sep 2006 (CEST)
auf meinen obigen einwand, das arithmetische mittel trotzdem anzuwenden, 1. was sehr oft gemacht wird, z.b. bei berechnung des sog. notendurchschnittes und 2. was, wie ich oben anhand eines beispiels gezeigt habe, durchaus aussage hat, geht die von dir zitierte stelle aber nicht ein. -- seth 23:05, 21. Sep 2006 (CEST)
Macht, was ihr wollt, wenn ihr es soviel besser wisst. --Philipendula 17:17, 21. Sep 2006 (CEST)
hey, hey. nicht gleich resignieren. ich kenne dich bisher als gescheiten wikipedianer und mir waere es deshalb sehr lieb, wenn wir uns einigen koennten. momentan geht die diskussion wohl etwas durcheinander. -- seth 17:27, 21. Sep 2006 (CEST)
Sorry. Mein Tag hat halt auch nur 24 Stunden und diese Diskutiererei, wieder und wieder um das Gleiche, strapaziert meine Nerven. --Philipendula 18:51, 21. Sep 2006 (CEST)
klaro, nicht nur deine. und obwohl das immer wieder auf den diskussionsseiten passiert, gewoehnt man sich irgendwie nicht so wirklich daran. aber ich glaube nicht, dass diese diskussion endlos ausarten wird. es sind ja eigentlich nur ein paar wenige punkte zu klaeren. vielleicht hilft dir ein wenig motivation: [2] (flash-plugin benoetigt) ;-) -- seth 23:05, 21. Sep 2006 (CEST)
Hm, ich weiß nichts besser, aber erwartest du, dass man bei jedem, der um die Ecke kommt und sagt "Ich hab da mal was gehört", dieses sofort kritiklos einbauen?
Ich kenne diese Verwendung des Medians nicht; sie hat ihren Charme, aber auch ein paar Haken und Fallstricke. Es ist nicht unsere Aufgabe, eine These zu erforschen; entweder haben das bereits seriöse Wissenschaftler gemacht - dann sollten die Ergebnisse samt Quellen hier herein; oder eben nicht, dann müssen wir halt warten, bis sich die Wissenschaft dazu eine Meinung gebildet hat. -- H005 17:47, 21. Sep 2006 (CEST)
Es haben das seriöse Wissenschaftler gemacht. --Philipendula 18:49, 21. Sep 2006 (CEST)

versuch einer zusammenfassung des bisher gesagten

ich versuche mal ein wenig zusammenzufassen, was wir afais (d.h. bitte korrigiert mich, falls ich was missverstanden habe) zu klaeren haben...

  1. ist der median bei ordinalen, nicht-metrische daten grundsaetzlich sinnvoll? (nachtraegliche anmerkung: erledigt, er ist es.)
  2. und was ist bei solchen daten mit dem arithmetische mittel? (nachtrag: durch verwurschtel-tricks geht auch das.)
  3. ist ueberhaupt der vergleich median vs. arithmetisches mittel bzgl. ordinaler, nicht-metrischer daten enzyklopaedie-wuerdig? (nachtrag: wenn, dann im artikel zum arithmetischen mittel.)

zum ersten punkt: sich kritisch dazu geaeussert hat bisher nur H005. er haelt die anwendung des median von ordinalen daten fuer "rar gesät, und in der Literatur habe ich noch nichts darüber gelesen". Philipendula ist sich sicher, dass die anwendung nicht rar gesaet sei. unabhaengig von etwaiger anwendung ist erstmal offensichtlich, dass man den median bei solchen daten anwenden _kann_, das hat keiner bisher bestritten. und das duerfte ja auch ruhig in der wikipedia stehen, ohne dass wir gefahr laufen theoriefindung zu betreiben, ganz einfach weil es offensichtlich ist. was die _anwendung_ betrifft, koennen wir es ja erstmal offen lassen bzw. einfach warten bis jemand was dazu in den artikel schreibt und dann schreien, wenn er keine quellen dazu angeben kann.

zum zweiten punkt habe ich ein beispiel (notendurchschnitt 5,3) gegeben, das imho die pauschale aussage "das arithmetische mittel darf bei ordinalen daten wie z.b. schulnoten nicht verwendet werden, da es hier keine aussage hat." widerlegt.

zum dritten punkt kann ich nichts sinnvolles beitragen. -- seth 23:05, 21. Sep 2006 (CEST)

Hallo seth, danke für die Zusammenfassung; so etwas dient immer der Versachlcihung der Diskussion.
a. Dass es sinnvolle Anwendungen eines Median bei ordinalen Größen geben kann, denke ich auch. Dennoch werfe ich die Frage auf, was die Wissenschaft dazu sagt, insbesondere zu Voraussetzungen und Einschränkungen. Solange wir die nicht kennen, dürfen wir m. E. auch nicht pauschal sagen, dass man einen Median bilden kann, denn das ist nunmal Theriefindung; die einschlägige Literatur jedenfalls geht immer von kardinalen Größen aus, und möglciherweise gibt es gute Gründe, den Beriff des Median nicht auf ordinale Zahlen auszudehnen; Gründe, die uns hier einfach noch nicht eingefallen sind.
Der Median ist ja keine neue Erfindung; alle Fachliteratur dazu dürfte ihn hinreichend von allen Seiten beleuichtet haben. Wenn also heutzutage Konsens in der Wissenschaft ist, dass der Median nur aus kardinalen Größen gebildet werden kann, dann sollten wir das so hinnehmen und nicht die Wissenschaft mit unseren eigenen Überlegungen in Frage stellen.
b1. Man bedenke, dass sich möglicherweise Schüler oder Studenten, die hier nach der wissenschaftlichen Definition suchen, gehörig in die Nesseln setzen können, nur weil drei Wikipedia-Laien sich überlegt haben, dass das mit ordinalen Zahlen doch eigentlich auch gehen müsste.
b2. Noch ein Aspekt: Wenn wir hier versehentlich Blödsinn schreiben, schreckt dies "nur mal hereinschauende" wissenschaftliche Experten von der Wikipedia ab, weil die die häufig gestreuten Vorurteile bestätigt sehen.
c. Übrigens, nur so am Rande: Wenn man das arithemetische Mittel von Schulnoten bildet, dann bildet man dies nicht aus ordinalen Zahlen, sondern man definiert die Schulnoten als kardinal. Ob eine Variable ordinal oder kardinal ist, ist nämlich keine Gottgegebenheit, sondern eine am Zweck der Messung ausgerichtete menschliche Definition. Auch die KAridnalität vermeintlich so zweifellos kardinaler Größen darf angezweifelt werden: So wird man Geld in der Regel als kardinal betrachten; wenn ich damit aber den individuellen Nutzen des Geldes messen will, stimmt dies schon nicht mehr, da der Grenznutzen normalerweise stetig abnimmt.
d. Es bleibt dabei: Aus ordinalen Größen kann ich kein arithmetisches Mittel bilden. Das ist ein definitorischer Widerspruch. -- H005 23:56, 21. Sep 2006 (CEST)
ich war so frei, deine kommentare zu "nummerieren", was das antworten verkuerzt und damit die lesbarkeit verbessert.
a. soweit ich Philipendula verstanden habe, kann er sogar literatur angeben, die den median so allgemein (d.h. fuer ordinale daten) definieren.
b1 und b2. ich denke, das ist allen bisher an der diskussion beteiligten bewusst.
c. ja, und das meinte ich mit "ordinale, nicht-metrische daten werden eben doch wieder zu metrischen verwurschtelt". (metrisch=kardinal)
d. da alle ordinalen groessen mit leichtigkeit zu kardinale "verwurschtelt" werden koennen, was auch sehr oft getan wird, muesste diese aussage imho erweitert/praezisiert werden um das, was du in c. sagtest. (sonst wuerde die schueler aus b. beim naechsten notendurchschnitt meckern "aber die wikipedia hat gesagt...!" ;-) )-- seth 09:22, 22. Sep 2006 (CEST)
ad a: Schön, wenn es seriöse Literatur gibt, nur her damit. Das ist alles, was ich verlange. :-)
ad c und d: Dass die Grö0en "verwurschtelt" werden, ist eine Sache; hier wollen wir aber die mathematische Theorie darlegen und nicht, was irgendjemand verwurschtelt.
Wenn jemand den möglichen Angaben in einer Umfrage "toll", "ganz gut", "geht so", "schlecht" und "grauenhaft" Werte von 1 bis 5 zuordnen will, dann kann er das machen; dann hat er aber kardinale Größen und findet in diesem Artikel alles, was er zum Median braucht. Wer bei den ordinalen Größen bleiben will, findet hier nichts - und das halte ich für richtig, solange der Median nicht ein wissenschaftlich akzeptiertes Maß hierfür ist. -- H005 23:58, 24. Sep 2006 (CEST)
es herrscht ja hier mittlerweile (siehe unten) einigkeit ueber die anwendung des medians bei ordinalen daten. es bleibt also nur noch der punkt zu klaeren, mit dem die ganze diskussion startete.
insofern widerspreche ich dir: als enzyklopaedie _sollten_ wir darauf eingehen, wenn alle welt aus ordinalen daten kardinale verwurschtelt, um das a.m. anwenden zu koennen. -- seth 19:25, 25. Sep 2006 (CEST)
Dieses Thema gehört aber meines Erachtens nicht hierher, sondern unter Ordinalskala und/oder Intervallskala oder allenfalls noch Arithmetisches Mittel. -- H005 22:31, 25. Sep 2006 (CEST)
ack. beim artikel zum a.m. waere das besser aufgehoben. -- seth 23:38, 25. Sep 2006 (CEST)

Ich fasse mal aus meiner Sicht zusammen:

Wir reden von Merkmalen einer Stichprobe:

  • Für ordinalskalierte (=rangskalierte) Merkmale verwenden wir als Lageparameter den Median oder beispielsweise den Modus. Das arithmetische Mittel (a.M.) ist bei rangskalierten Merkmalen pöse. Es wird trotzdem sehr häufig verwendet, weil es den Anschein größerer Genauigkeit suggeriert, der aber bei ordinalskalierten Merkmalen ins Leere geht. Auch Durchschnittsnoten verstoßen gegen dieses Verbot (Ich verwende auch häufig hier das arithmetische Mittel, allerdings mit dem gebotenen schlechten Gewissen). Ich kann hier aus dem Stand 4 Quellen angeben. Es gibt sogar Autoren, die die Mittelwertbildung bei geradzahligem Stichprobenumfang nicht tolerieren, was ich übertrieben finde.
  • Bei metrischskalierten (=kardinal) Merkmalen kann man Modus, Median, a.M. als Lageparameter verwenden. Der Median liefert hier durchaus wertvolle Information.Die 50% kleinsten Werte liegen links davon, die 50% größten rechts davon. Bei symmetrisch verteilten Merkmalen kann man den Erwartungswert mit ihm schätzen, was bei kleinen Stichproben wichtig ist. Sind die Daten stark ausreißerbehaftet, ist das a.M. kein bester Schätzer mehr, hier hat der Median größere Vorzüge. Deshalb verwendet man in der Explorativen Datenanalyse den Median anstelle des a.M. Häufig dient ein Vergleich von Median und a.M. dazu, die Eignung von Daten für die Analyse zu untersuchen. Auch hier Literatur vorhanden.

Mich hätte schon immer mal eine theoretische Rechtfertigung für die Verwendung der klassischen Schätzer (a.M., Varianz) bei ordinalskalierten Merkmalen interessiert. Da hab ich aber noch nichts finden können. --Philipendula 11:02, 22. Sep 2006 (CEST)

zu deinem ersten punkt. das a.m. wird trotzdem haeufig genutzt, ja. aber ueber die gruende koennen wir hier nur spekulieren. dass es durchaus sinn machen (i.s.v. aussage haben) kann, habe ich durch ein (noten-)beispiel gezeigt. und H005 hat ja auch schoen erklaert, was der hintergrund dafuer ist. was genau (sinngemaess) sagen die 4 quellen?
zum zweiten punkt: das hat afais niemand hier angezweifelt, steht also gar nicht zur diskussion.
zum nachsatz: was hat dir an der rechtfertigung mithilfe des notenbeispieles nicht geschmeckt? ich mach's mal noch deutlicher: notendurchschnitt 5,6. man sieht nun daran deutlich, dass in diesem spezialfall(!) die information des a.m. die des medians enthaelt und sogar noch etwas mehr infos - ueber die anderen 50% - bietet. (das soll selbstverstaendlich nicht heissen, dass das a.m. grundsaetzlich besser sei als der median.) -- seth 23:42, 24. Sep 2006 (CEST)

Selbstverständlich wird der Median bei Ordinalzahlen verwendet Der Median ist ja nur ein Spezialfall der Quantile und die begegnen uns alle Nase lang. Wenn bei einer Klassenarbeit die Hälfte der Schüler schlechter als 4 ist, ist 4 der Median. Wenn bei einem Marathonlauf mit 1500 Teilnehmern die besten 10% eine Medaille erhalten sollen brauche ich 150 Medaillen (10% Quantil). Ob da nun die Grenze eingeschlossen ist oder nicht ist zweitrangig. Für die sinnvolle Verwendung braucht es noch nicht mal Wissenschaft, es reicht der gesunde Menschenverstand. -- Suricata 10:56, 25. Sep 2006 (CEST)

Ich habe jetzt mal meinen alten Hartung aus dem Keller geholt, der wohl als das deutschsprachige Standardwerk zur Statistik gelten darf, und die deskriptorische Definition dementsprechend überarbeitet. Hartung erwähnt, dass der Median auch bei ordinalen Größen verwendet werden kann, behält dabei aber den Widerspruch bei zwischen der angegebenen arithmetischen Formel und dem Anspruch, sich auch auf ordinale Größen zu erstrecken, die sich ja jeglicher Arithmetik entziehen. Man muss etwas zwischen des Zeilen lesen, um ihn aufzulösen. Vielleicht ist das in neueren Auflagen besser dargestellt.

Mir scheint aber, der Artikel hat immer noch ein wenig Überarbeitungsbedarf, insbesodnere im nicht-deskriptiven Bereich.

PS: Suricata, ich habe mal die Überschriftzeichen entfernt (die erweckten den Anschein eines Themawechsels) und deine Signatur korrigiert - hoffe, das ist ok so. -- H005 12:31, 25. Sep 2006 (CEST)

alternative median-definition

vor kurzem aenderte 130.75.17.228 die quantil-formel

 

zu

 

mit der begruendung "das war vorher so nur für positive dichten richtig, jetzt stimmt es generell". in den mir hier zur verfuegung stehenden mathebuechern steht nichts zu negativen dichten. wo wird sowas verwendet? wird sowas ueberhaupt verwendet? -- 141.3.74.36 15:10, 23. Apr. 2007 (CEST)

Gemeint sind offenbar positive Dichten nicht im Gegensatz zu negativen sondern zu abschnittsweiser Dichte 0 (also zu insgesamt nicht-negativen Dichten). Beispiel: Wirf eine Münze. Bei Kopf wähle eine uniform in [0,1] verteilte Zufallszahl, bei Zahl wähle eine in [10,11] verteilte. Dann ist  , aber  . Das ist also analog zum Fall der geraden Stichprobe.--Hagman 12:57, 7. Mai 2007 (CEST)
ach so, verstehe. wo wird dieser halb-arithmetische median verwendet? (quellen?) bei relevanz koennen wir es ja noch im artikel ergaenzen. -- 141.3.74.36 17:41, 25. Jun. 2007 (CEST)

Median einer Einkommensverteilung

Beim Median addiert man nichts. Was du meinst, ist die Konzentration. Bitte lass doch das Beispiel. --Philipendula 11:05, 6. Mai 2007 (CEST)

Siehe Median einer Verteilung. Wenn mit 0,5-Quantilen gearbeitet wird, muss addiert werden. Median der Einkommen ist dagegen zwischen unterer und oberer Hälfte der sortierten Einkommen (ohne Addition). --DL5MDA 11:28, 6. Mai 2007 (CEST)
Beispiel: Beobachtete Werte 1, 2, 3, 4, 5. Die empirische Verteilungsfunktion ist
 
Nach der im Artikel gegebenen (und allgemein üblichen) Definition ist der Median  . Nach der Definition in "Median einer Einkommensverteilung" ist der Median hingegen 4 (Summe ist 15, die 7,5 werden mit dem Summanden 4 erreicht). Die Berechnung in "Median einer Einkommensverteilung" passt jedenfalls nicht mit dem Rest des Artikels zusammen (und auch nicht mit dem Artikel Quantil). Vielleicht meinst Du irgendetwas anderes. Wo hast Du diese Berechnung her? --NeoUrfahraner 08:35, 7. Mai 2007 (CEST)

Krugmans Witz

Ein Liberaler und ein Demokrat sitzen in einer Bar. Dann kam Bill Gates herein. „Oh, wir sind reich!“ rief der Konservative. „Der durchschnittliche Barbesucher ist jetzt mehr als eine Milliarde wert!“ „Das ist Quatsch,“ antwortete der Liberale. „Bill Gates hebt den Durchschnitt, aber das macht Sie oder mich noch lange nicht reicher.“ „Ha!“ sagt der Konservative, „Ich sehe, Sie praktizieren immer noch die unglaubwürdige Politik des Klassenkampfes.“ (Paul Krugman, International Herald Tribune, 22. Januar 2003)

Das wurde am 18.7.2007 von jemandem gelöscht, der den Zusammenhang zum Median nicht versteht. Das Zitat passt ausgezeichnet. Vielleicht ist es aber für eine naturgemäß dröge Enzyklopädie nicht so geeignet. 84.150.68.192 23:47, 18. Jul. 2007 (CEST)

Na dann erklär bitte den Zusammenhang mit dem Median. --NeoUrfahraner 07:06, 19. Jul. 2007 (CEST)
Der Zusammenhang ist doch klar. Warum nimmt man für bestimmte Aussagen den Median her, und nicht den arithmetischen Durchschnitt? Aber die Verben sollten alle besser im Präsens stehen. DL5MDA 10:52, 20. Jul. 2007 (CEST)
und wenn drei reiche leute reinkommen wuerden und der median somit sehr hoch waere, haetten die beiden sich unterhaltenden immer noch nix davon. das zitat hat imo nichts im artikel verloren. -- seth 21:46, 20. Jul. 2007 (CEST)
Richtig. Die drei Reichen würden nicht plötzlich verarmen, wenn sie in die Bar mit zwei Normalos kämen. Das ist aber ein anderer Witz und nicht Krugmanns Witz. Ein Urteil über einen anderen Witz ist nicht logischerweise ein Urteil über Krugmanns Witz. DL5MDA 22:49, 20. Jul. 2007 (CEST)
Und warum ist Krugmanns Witz gerade über den Median und nicht über den Modus (Statistik), über das untere Quartil oder über irgendeine andere statistische Kenngröße? --NeoUrfahraner 09:54, 24. Jul. 2007 (CEST)
Ich fasse den Witz dahingehend auf, dass er verdeutlicht wie unzulänglich eine einzelne Zahl die (unendlich komplexe) Realität abbilden kann. Insofern würde der Witz als "Ermahnung zum Mitdenken" sowohl beim Median, als auch bei jeder anderen statischen Kenngröße seine Berechtigung haben. --Qaswed 23:52, 22. Feb. 2010 (CET)

Fehler?

Im OTRS haben wir folgende E-Mail (Ticket#: 2008012010007706) erhalten:

An: <info@wikipedia.org>
Betreff:  Median
Erstellt: 20.01.2008 18:32:02

Ich habe versucht, eine Korrektur im Lexikon anzubringen. Ist mir aber nicht
gelungen. Unter der Überschrift "Median einer Verteilung" erweckt die gegebene
Funktion den Anschein, als sei ihr Nenner für den Median verantwortlich. In Wahrheit
ist es aber die obere Grenze. Sie heißt dort 6. Der Median ist dann 6 durch Wurzel 2.
Quellen braucht man dafür keine. Der gesunde Menschenverstand genügt. 

Mag sich das bitte ein Mathematiker anschauen und ggfs. korrigieren? Danke. — Raymond Disk. Bew. 23:16, 23. Jan. 2008 (CET)

Die Dreiecksverteilung ist ein Spezialfall, wo man eine Lösung mit Hilfe der elementaren Geometrie erhält. Es geht aber hier vor allem darum, zu zeigen, wie man bei einer stetigen Verteilung einen Median ermittelt, und es gibt auch noch ein Leben nach der Dreiecksverteilung. --Philipendula 09:33, 24. Jan. 2008 (CET)

Naja, ich meine, der Schreiber stört sich vor allem daran, dass die 18 sowohl in   als auch in   auftaucht. Er hat vermutlich die Formel  , a=0, b=c=6 vgl. en:Triangular distribution im Hinterkopf. Vermutlich sollte man deutlicher machen, dass hier der Median aus der Gleichung "Dreiecksfläche=1/2", also   bestimmt wird. Ich habe es als Vorschlag ein wenig anders formuliert. --NeoUrfahraner 10:42, 24. Jan. 2008 (CET)

Oberbegriff "Quantil"

Ich finde der Oberbegriff Quantil sollte in der Einleitung des Artikels auftauchen! (nicht signierter Beitrag von 134.106.132.150 (Diskussion) 14:51, 17. Feb. 2011 (CET))

Folgender Satz in der Einleitung hat mich irritiert: "In der Statistik teilt der Median beispielsweise eine Grundgesamtheit in zwei Hälften gleicher Größe, so dass Merkmalsausprägungen in der einen Hälfte kleiner als der Medianwert sind, in der anderen größer." Für das folgende Beispiel würde der Satz nicht gelten: Zahlenreihe: 1,2,3,4,5,5,5,7,8,9,10 Median: 5

Sowohl in der oberen als auch in der unteren Hälfte befindet sich jeweils eine 5, also eine gleich große Zahl. (nicht signierter Beitrag von CarefulStatistician (Diskussion | Beiträge) 22:38, 15. Nov. 2011 (CET))

Es muss kleiner gleich oder größer gleich heißen. Gruß --Philipendula 08:47, 17. Nov. 2011 (CET)

Wissenschaftitis

Dieses Lemma ist ein perfektes Beispiel wie man am interessierten Leser vorbeischreiben kann. Durchaus bemüht und interessiert habe ich nach der Hälfte des Textes frustiert das Handtuch geworfen. Liegt vielleich an mir, habe aber für andere ungeduldige Wissensdurstige wenigstens einen klaren Einleitungssatz vorangestellt. Den Blödsinn (?) aus der Begrifferklärung habe ich entfernt; naja jedenfalls hohes Verwirrungspotential hatte: " ...., der die Daten in zwei Hälften teilt." --Allander (Diskussion) 18:22, 5. Mär. 2012 (CET)

Ich finde eher, daß der Begriff Zahlenreihe völlig verwirrend gebraucht wird. Um nicht zu sagen: Schlicht falsch. Insofern ist das sicher keine «Wissenschafttitis».
O Benutzer:Kängurutatze Korrigiere auf: "sortierte Liste von Zahlen". Bitte unterschreibe deine Beiträge. Gruß--Allander (Diskussion) 19:06, 5. Mär. 2012 (CET)

So toll es wäre, den Artikel verständlicher zu bekommen, bin ich mir nicht sicher, ob die neue Einleitung wirklich in die richtige Richtung geht: Es wird ja praktisch nur noch darauf eingegangen, wie der Median einer geordneten Liste berechnet werden kann, aber kaum noch, was der Median ist und wozu man den braucht. Ich denke mal für den interessierten Laien ist das wichtiger als die Feinheiten (gerade/ungerade) der Berechnung, die in der Praxis meist sowieso keinen großen Unterschied machen und deshalb mMn nicht schon in der Einleitung mit drei(!) Beispielen dargestellt müssen. -- HilberTraum (Diskussion) 20:59, 5. Mär. 2012 (CET)

Du hast recht, die drei Beispiele am Anfang sind evtl. nicht schön, aber imho wird gerade dadurch auf den ersten Blick klar was der Medianwert ist (und warum Extremwerte keinen Einfluß haben!!). Bei allen drei mittlerweile gelöschten Extlinks ist binnen Sekunden für den Laien klar was Sache ist, bei der Lektüre des WP-Artikels braucht man günstigstenfalls mehrere Minuten und bekommt einen Haufen neuer Fagen mit auf den Weg. Unnötigerweise. Beispiel für klare kurze Definition des Median: The Median is the "middle number" (in a sorted list of numbers), siehe: [3]. Die WP bemüht sich redlich die einfachsten Zusammenhänge perfekt mit deutscher Gründlichkeit zu vernebeln, sodaß sich am Ende nichtmal mehr ein Kenner sicher ist. Kein Wissensuchender kann mit dem derzeitigen Einleitungssatz: Der Median ist ein Lagemaß einer Verteilung, zum Beispiel der Häufigkeitsverteilung einer Datenmenge oder Stichprobe oder der Wahrscheinlichkeitsverteilung einer Zufallsvariablen. Im Vergleich zum arithmetischen Mittel, auch Durchschnitt genannt, hat der Median den Vorteil, robuster gegenüber Ausreißern (extrem abweichenden Werten) zu sein und sich auch auf ordinal skalierte Variablen anwenden zu lassen. Der Median gehört zur Gruppe der Quantile und kann auch als 0,5-Quantil bezeichnet werden.- sofort was anfangen. Seriös braucht er erstmal eine halbe Stunde um sich durch den Linktwust durchzuklicken und es entstehen - zig Fragen wenn er doch nur eine hat: Was ist der Medianwert? Besonders g´schmackig und sonnenklar ist auch im zweiten Absatz: Entsprechungen lassen sich für eine gerade Anzahl an Werten verabreden. Aber gerne- verabreden wir uns doch... Gruß --Allander (Diskussion) 13:03, 6. Mär. 2012 (CET)
Wir können gerne über die angemessene Gewichtung von Einführung und Einordnung diskutieren, aber auf Polemik habe ich eher keine Lust. --Erzbischof 19:25, 6. Mär. 2012 (CET)
Keine Ahnung was du meinst mit der Gewichtung ...., aber mit der Lustlosigkeit sind wir auf einer Linie. Zitat : Die Einleitung eines Artikels klärt in groben Zügen und in allgemein verständlicher Sprache, was der Begriff bedeutet und wie er verwendet wird. Da du den von mir gesetzten Baustein "Allgemeinverständlichkeit" ohne Diskussion entfernt hast und als Admin und Schiedsrichter jedenfalls die besseren Argumente hast klink ich mich aus, ich habe dem Gesagten nichts hinzuzufügen.--Allander (Diskussion) 19:43, 6. Mär. 2012 (CET)
Also ich denke, wenn eh schon wie hier mindestens vier Leute darüber diskutieren, wie man den Artikel besser/verständlicher machen kann, braucht's wirklich nicht noch einen Allgemeinverständlichkeitsbaustein ;-) Insofern fände ich es schon gut, wenn du dich weiter an der Diskussion beteiligen würdest. -- HilberTraum (Diskussion) 12:24, 7. Mär. 2012 (CET)

Generalüberholung

Habe reingestellt: Synthese von Disk. Benutzer: Philipendula, Erzbischof, Sigbert, HilberTraum, Kängurutatze + my 5 cents. Die Einleitung erwähnt nicht die drei Konzepte, da hier imho knappest klare Schnellinfo + Tieflinks geboten werden soll. Die Struktur wurde gestrafft. Fehler (<=>=) ausgemerzt.--Allander (Diskussion) 12:03, 9. Mär. 2012 (CET)

Hey, wäre echt nett, wenn du über meine Bearbeitungen von gestern Abend nicht einfach so drüberkopieren würdest! Und heißt lat. medianus nicht der Mittlere? Und die <= m, >= m Aussage ist IMHO jetzt auch falsch. -- HilberTraum (Diskussion) 18:05, 9. Mär. 2012 (CET)
Also ich sehe den Wahrheitsgehalt der Aussage Für ordinale Variablen, bei denen es kein quantitativ sinnvolles Intervall zwischen den Werten gibt, eignet sich der Median am besten. nicht. Läasst sich aus Quelle [2] auch nicht belegen, oder? --Sigbert (Diskussion) 20:02, 9. Mär. 2012 (CET)
PS: Dem stimme ich auch nicht zu: Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.--Sigbert (Diskussion) 20:12, 9. Mär. 2012 (CET)

Ehrlich gesagt bin auch ich wenig begeistert von dieser Rosskur. Schon der erste Satz ist irreführend, weil es ein statistisches/mathematisches Konzept ist und wohl eher in den Wirtschafts- und Sozialwissenschaften als in den Naturwissenschaften angewandt wird. Kängurutatze (Diskussion) 21:44, 9. Mär. 2012 (CET)

  • Den ersten Satz würde ich auch eher auf die Begriffklärungseite setzen.
  • Google translate sagt: medianus = mittlere
  • Der Zentralwert ist das deutsche Wort für den Median. Der zweite Satz erweckt den Eindruck als ob der Median und der Zentralwert etwas Unterschiedliches sein könnten. --Sigbert (Diskussion) 09:44, 10. Mär. 2012 (CET)
Die Einleitung ist zu stark eingeengt und wie Sigbert bemerkt, auch nicht mehr richtig, Median kommt von "medianus=in der Mitte befindlich", nicht von "medianus=Mittler" [4], der Median ist nicht eine Eigenschaft "einer sortierten Liste", Stichproben sind nicht sortiert. Vermute ich richtig, dass ihr die alte Einleitung auch nicht mochtet, und dass wir uns hinsetzen und eine neue Einleitung schreiben sollten? --Erzbischof 10:09, 10. Mär. 2012 (CET)
Also ich fand die Einleitung in dieser Version eigentlich ganz in Ordnung. -- HilberTraum (Diskussion) 14:49, 10. Mär. 2012 (CET)

Uff! Hätte mich auch gewundert, wenn ihr ein gutes Haar gefunden hättet. Eure biskerigen Korrekturen betreffen so weit ich das gesehen habe übrigens nur jene Teile die schon vor der Generalüberholung bestanden. Die Abschnitte 3.1 Median einer Stichprobe 3.1.1 Ober- und Untermedian 3.1.2 Eigenschaften 3.1.3 Median von gruppierten Daten 4 Median einer Verteilung 4.1 Beispiele sind von mir inhaltlich unverändert (bis auf die erg. = bei > und <) zusammengefasst worden. Ref für sigbert erg., lat Übesetztung erg. @erzbischof kann ich nur ein kopfschütteln schicken: Selbstverständlich sind Stichproben im ersten Schritt nicht sortiert, weshalb ja auch eine Voraussetzung zur Ermittlung des Medians ist zu sortieren. Jetzt isses mir aber zu blöd).@hilbertraum sorry obige abschnitte hab ich (leider ohne deine verbesserungen) nur kopiert.@känguruhtatze: Der Begriff Median ist nicht "nur" ein Naturwissenschaftlicher sondern natürlich auch ein Sozial- und Wirtschaftswissenschaftlicher. Lat. trans. erg. --Allander (Diskussion) 17:12, 10. Mär. 2012 (CET)

No te desanimes, Don Allander ;-), nimm's nicht krumm, wenn unsere Vorstellungen, wie eine Einleitung aussehen soll, auseinandergehen. --Erzbischof 18:41, 10. Mär. 2012 (CET)
Sorry, nicht mein sprachschatz, aber pass auf du Erzbischof: Ist dir oder euch tatsächlich nicht aufgefallen, daß ich alle eure inputs in der Disk. berücksichtigt habe? Kein Wort drüber? Nur spontanes uind unüberlegtes rumrotzen? Die Einleitung ist perfekt weil kürzest, klar, wahr, reflektiert und unmißverständlich.--Allander (Diskussion) 19:42, 10. Mär. 2012 (CET)
Ein "lass' den Kopf nicht hängen" du kommst mit "pass auf" und "rumrotzen"... --Erzbischof 19:47, 10. Mär. 2012 (CET)
Lass den Kopf nicht hängen, wenn wir uns nicht einig werden, wie wir die Einleitung gerne hätten. --Erzbischof 20:01, 10. Mär. 2012 (CET)
Die Löscherei ( hier, auf der Disk.) war wohlein Irrtum- kann ja mal passieren.--Allander (Diskussion) 20:12, 10. Mär. 2012 (CET)
Natürlich war es Absicht, nur keine böswillige. --Erzbischof 20:32, 10. Mär. 2012 (CET)
Und sagst du mir auch worum du meine Beitäge absichtlich löschst?--Allander (Diskussion) 20:34, 10. Mär. 2012 (CET)
Es war ein Versuch, das Gespräch noch mal neu zu beginnen und in normale Bahnen zu lenken, aber eine Herzensangelegenheit ist es mir das nicht mehr. --Erzbischof 20:42, 10. Mär. 2012 (CET)
Versteh ich nicht, um besser zu kommuniziern löscht du meine Ausssagen? Kopfschüttel. Apropos Herzensangelegenheit: Viele Stunden bin ich an der Generalüberholung gesessen, habe alle eure Inputs verbraten, eure Diskussionsbeiträge z.T. wortwörtlich uübernommen und hör nur das o.e. Raunzen um nix. Z.T. muss ich eure falschen weil lückenhaften Korr. händisch nochmal tippen. Danke vielmals.:-)(--Allander (Diskussion) 20:57, 10. Mär. 2012 (CET)
  • Ich hatte den Satz Nur für nominale Variablen, die keine numerischen Ausprägungen haben, ist der Modalwert das einzige Maß, das berechnet werden kann. rausgenommen, weil es in dem Abschnitt um Berechnungen des Medians geht. Warum hier also als erstes auf eine anderes Maß, den Modus, eingehen?
  • Sind intervall- und verhältnisskalierten Daten keine metrischen/kardinalen Variablen? Was ist mit absolut skalierten Variablen? Kann der Median da nicht angewendet werden?

Aber ich bin gerne bereit diese Änderungen zu diskutieren, wenn da Bedarf besteht.

Was deine Kritik bzgl. der Umsetzung der Änderungen aus der Diskussion angeht:

  • Wenn ich Dinge auf der Diskussionseite anspreche, dann heisst das erstmal, dass ich da Diskussionbedarf sehe. Ob das dann auch so geändert werden sollte, steht für mich auf einem anderen Blatt.
  • Du hast dankenswerter Weise die Diskussion aufgegriffen und in den Artikel integriert. Ich wünschte mir, ich hätte mich früher mal intensiver mit dem Artikel befasst. Aber es ist so wie immer: viel zu wenig Zeit und viel zu viele andere Baustellen...

Was aus meiner Sicht aber noch viel wichtiger ist: du hast viele Blicke auf den Artikel zum Median gelenkt und ich denke je mehr Leute kritisieren/diskutieren/ändern desto besser ist es für den Artikel. --Sigbert (Diskussion) 08:05, 11. Mär. 2012 (CET)

Zu
1. Denk ich nach. Ziel ist/war alle skalenniveaus anzusprechen, und "ab" zu vermeiden (weil hier dann eine hirarchie der niveaus zu erklären wäre). Außerdem hab ich eine passende ref. dafür, und ohne solche geht ja hier garnix.;-) 2. auch hier hab ich eine schöne ref. für den wortwörtlichen satz 3. Die Diskbeiträge sind ja auch schlüssig. 4. ..und jetzt steht vor allem am anfang eine klare, wahre, kurze, unmißverständliche schnellinfo. Da das Lemma im Grunde ein simples ist, und jeder zweitklassler kompetent: Ich bin neugierig wie lange es dauert bis es eine müllhalde ist. :-( Gruß --Allander (Diskussion) 08:36, 11. Mär. 2012 (CET)

Ist wohl besser ein anderer fängt nochmal an. Ich hab revertiert in die ausgangsposition vor meinen eingriffen. Viel spass.--Allander (Diskussion) 10:23, 11. Mär. 2012 (CET)

Wieso? Der Rest von dir war doch gut, hat doch mit dem Streit über die Einleitung nichts zu tun. --Erzbischof 10:29, 11. Mär. 2012 (CET)
Da die Einleitung und Struktur jetzt OK ist, solls gut sein.--Allander (Diskussion) 21:48, 11. Mär. 2012 (CET)

Boah Leute, wasn hier fürn Stress? Das ist ja schlimmer als beim Ziegenproblem ;-) Ich möchte nochmal versuchen, zu einer sachlichen Diskussion über die Einleitung/Einführung zurückzukommen:
Momentan halte ich die Einleitung für zu kurz. Insbesondere, wenn der Artikel drei leicht unterschiedliche Bedeutungen für Median erklärt (naja, erklären sollte) müssten die auch in der Einleitung angesprochen werden, sonst findet sich jemand, der nur die Einleitung liest, nicht zurecht und er meint, er ist im falschen Artikel. Ich persönlich halte immer noch die Einleitung in dieser Version für ganz brauchbar, zumal sie als Kompromiss die Vorstellungen mehrerer Diskussionsteilnehmer aufgreift.

Bei der Einführung in das Thema ist wohl das Hauptproblem, welche Rolle der Berechnung mittels Sortieren der Liste und Auswählen des mittleren Elements zukommt. Natürlich ist das ein wichtiger Algorithmus, der natürlich im Artikel gebracht und an Beispielen erklärt werden muss, aber ich möchte einige Argumente dafür bringen, das man ihn nicht zu stark herausstellt und möglichst nicht zur Definition macht:

  1. Er ist nicht der einzige und i.A. auch nicht der schnellste Algorithmus zur Bestimmung des Medians. Dazu steht auch schon ein bisschen was im Artikel.
  2. Die Vorstellung vom Sortieren der Werte nützt nichts für das Verständnis des Falls stetiger Wahrscheinlichkeitsverteilungen.
  3. Ich denke die Erklärung ist auch nicht die beste für den absoluten Laien, der vielleicht hierher kommt, weil er was von Medianeinkommen gelesen hat (sollte übigens mMn keine Weiterleitung sondern ein eigener Artikel sein). Der bekommt dann gesagt, dazu müssen alle Einkommen sortiert werden, dann muss man sehen, ob die Anzahl aller Beschäftigten gerade oder ungerade ist (puh, dass wird schwer) und dann kann man den Median bestimmen. Das führt ihn mMn auf den Holzweg. Stattdesssen sollte er hier als erstes verstehen, dass das einfach bedeutet, dass die eine Hälfte weniger verdient und die andere mehr als das Medianeinkommen.

Ich wäre daher dafür, die Einführung samt Definition auch für Zahlenlisten, auf der Eigenschaft aufzubauen, dass die Hälfte aller Werte <= dem Median und die andere Hälfte >= ist. -- HilberTraum (Diskussion) 12:41, 12. Mär. 2012 (CET)

Bei der von dir vorgeschlagener Einleitung steht gleich am Anfang was von spezieller...., also gibts was allgemeines(?) das ist doch unklar, weiters muss man fünf minuten lesen und lang nachdenken, einiges verwirrendes zur Seite schieben, um zum gleichen Ergebnis zu kommen wie 10 Sekunden nach der Lektüre der derzeitigen Einleitung. Ich bin sicher die ist besser weil kürzest, klarest, einfachst. Der Median ist hald erstmal nicht mehr als die Mittlere Zahl einer geordenten Reihe von Zahlen. Da muss ich nicht schon im ersten Absatz draus eine Wissenschaft machen. Seufz. --Allander (Diskussion) 13:47, 12. Mär. 2012 (CET)
Na ja, "ein spezieller" im Sinne von "einer von mehreren verschiedenen", aber man kann dort eigentlich das Wort "spezieller" einfach ersatzlos streichen, wenn's stört. Sicherlich ist die von mir vorgeschlage Einleitungsversion auch noch nicht der Weisheit letzter Schluss. Mich stört daran z.B. wie oben dargestellt, dass dort ebenfalls die "Sortieren"-Definition vor der "Zwei Hälften"-Definition kommt. Und bzgl. "klarest": Es sind halt schon, wie auch von den anderen erwähnt, ein paar Unklarheiten in deiner Einleitung: Die Verlinkung von Zentralwert auf Zentralmaß passt gar nicht (Zentralwert ist Synonym zu Median, Zentralmaß zu Lagemaß) und wenn man ehrlich ist, klingt's halt schon so, als gebe es den Median nur bei sortierten Listen von Zahlen. -- HilberTraum (Diskussion) 14:34, 12. Mär. 2012 (CET)
Die von dir vorgeschlagene Version der Einleitung ist ganz einfach unbrauchbar. Nicht mehr und nicht weniger. Ich mag nicht mehr. --Allander (Diskussion) 19:17, 12. Mär. 2012 (CET)
Letztendlich wirst du überstimmt werden... soll ich es wieder machen, dann kannst du wenigstens mit HilberTraum auf gutem Fuß bleiben ;-) --Erzbischof 23:19, 12. Mär. 2012 (CET)
Wenn du mich schon wieder revertest, bin ich noch lange nicht überstimmt. Du hast nur mit Gewalt deine Meinung reingedrückt. Hilbertraum hat wenigstens einen der dümmsten Fehler deiner Einleitung- die Redundanz von Quartil im ersten Absatz- verbessert. Das ändert allerdings an der Unbrauchbarkeit nicht viel. Dein Stumpfsinn Wort für Wort:
1. Der Median (oder Zentralwert) ist in der Statistik und in der Wahrscheinlichkeitstheorie - Keine lat. transl., es genügt auch: in der Stochastik
2.ein spezieller Lageparameter von Verteilungen, also von Häufigkeitsverteilungen, Stichproben oder Wahrscheinlichkeitsverteilungen. - unenzyklopädisch werden drei Spezialfälle erwähnt. Verwirrung ("spezieller also gibts auch was allgemeines?) durch Fachsprech, Nirgendwo eine Definition.
3.Der Begriff entstammt der Geometrie, wo er eine Grenze zwischen zwei Hälften gleicher Größe bezeichnet. - auch das stellt mehr Fragen als es erklärt.
4.Der Median einer Häufigkeitsverteilung teilt beispielsweise eine Grundgesamtheit in zwei Hälften gleicher Größe, so dass alle Merkmalsausprägungen in der einen Hälfte kleiner als der Medianwert sind, in der anderen größer. - wieder ein Beispiel anhand eines komplexen Spezialfalles. Drei Fachausdrücke, noch immer keine Definition.
5. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median den Vorteil, robuster gegenüber Ausreißern (extrem abweichenden Werten) zu sein und sich auch auf ordinal skalierte Variablen anwenden zu lassen. - Drei Fachausdrücke mehr stellen weitere Fragen.
6. Der Median gehört zur Gruppe der Quantile und kann auch als 50%-Quantil bezeichnet werden. - Noch eine Frage wird geöffnet und ich weis noch immer nicht was der Median ist.
Ende des Einleitungsabschnitts. Hier wird nichts definiert, ein Haufen Nebensächlichkeiten angeschnitten und mit nicht notwendigen Fachausdrücken der Leser schon im Ansatz verwirrt. Der Autor ist Admin und Schiedsrichter der Wikipedia. Im den nächsten Abschnitt "Bildchen " wird es noch schlimmer.--Allander (Diskussion) 13:29, 14. Mär. 2012 (CET) P.s: Der Übersichtlichkeit halber stelle ich obiges, Erzbischofs Werk, meiner Version des Einleitungsabschnitts gegenüber:
Der Median (lat.:medianus - in der Mitte befindlich, der Mittlere) bezeichnet die Grenze zwischen zwei Hälften. Als Zentralwert oder 50%-Quantil ist der Median in der Stochastik die mittlere Zahl in einer sortierten Liste von Zahlen, wie zum Beispiel: 1,4,6,8,19.
Das kann man zwar sicherlich ohne persönliche Angriffe viel besser diskutieren, aber dennoch ein paar Anmerkungen von mir:
zu 1. Da hast du im Prinzip recht, allerdings ist die Abgrenzung von Stochastik nicht ganz einheitlich: Häufig wird die deskriptive Statistik, um die es ja hier zu großen Teilen geht, oft gar nicht zur Mathematik und damit auch nicht zur Stochastik dazugerechnet. Außerdem ist der Artikel Stochastik qualitativ echt bescheiden ;-)
zu 2. zu "spezieller" hab' ich oben schon was gesagt, kann mMn gut raus. Mit den drei Fällen sind aber nicht drei Beispiele gemeint, sondern die drei oben angesprochen unterschiedlichen Begriffsbildungen. Sollte also mMn drinbleiben (eher noch ausgebaut werden).
zu 3. ist halt Begriffsgeschichte, kann in der Einleitung stehen oder anderswo, hab' ich keine Meinung zu.
zu 5. halte ich für wichtig und gut, weil es sagt, warum der Median überhaupt betrachtet wird und was seine Bedeutung in Anwendungen ausmacht.
zu 6. Wenn's einen Oberbegriff "Quantil" gibt, soll der schon erwähnt werden, steht in deiner Einleitung ja auch drin. Ich finde hier aber gut, dass er erst am Ende kommt, denn nach meiner Erfahrung haben viele Anfänger mit dem Begriff Verständnisschwierigkeiten.
zu 4. und der Sache mit der Definition: Da bin ich auch etwas ratlos. Natürlich sollte der Begriff in der Einleitung auch schon "näherungsweise" definiert werden, aber das finde ich hier echt schwer, vor allem wegen der drei Bedeutungsvarianten, die man nur schwer mit einem Satz unter ein Hut bringt. Hinzu kommt, dass jede einigermaßen genaue Definition einen gewissen "Abschreckungsfaktor" in Einleitung haben kann, den du ja vermeiden möchtest. Das sehe ich also noch größeren Überlegebedarf, aber ich habe gerade gesehen, dass du schon bei ein paar Benutzern um Rat nachgefragt hast, vielleicht kommt ja auf diesem Weg noch einiges an Input. Wäre sicher hilfreich. -- HilberTraum (Diskussion) 16:26, 14. Mär. 2012 (CET)
Die drei Bedeutungsvarianten sind nur für Insider interessant, nicht für den Normalleser!Also wenn du schon ratlos mit der Definition bist: Eine Enzyklopädie soll in erster Linie definieren was was ist, was es bedeutet und erklären wo es angewendet wird und wie das Umfeld ist und und und. ERKLÄREN WAS ES IST. Deine restlichen Ansätze rinnen mir durch die Finger. Nochmal: wir reden uber eine Einleitung von 2 1/2 Zeilen KLARTEXT vs. 6 1/2 Zeilen NIX. --Allander (Diskussion) 18:45, 14. Mär. 2012 (CET)
(BK) Hallo HilberTraum, hier hatte ich die Gewichtung in Richtung Allander verschoben, [5], schaust du mal darauf? Fuer die jetztige Einleitung sprach nur, dass es der letzte Status quo war. Die verlinkte Einleitung beruht auf der Version, die du weiter oben auf meine Frage angabst. Ich finde sie besser, weil sie das Rechenbeispiel enthaelt, es in Verbindung mit der Teilung in Haelften setzt und auf Statistik-Sprache wie Merkmalstraeger verzichtet, ueberhaupt passen die Begriffe Merkmalstraeger, Grundgesamtheit und Haeufigkeitsverteilung nicht richtig zusammen. --Erzbischof 18:47, 14. Mär. 2012 (CET)
Warum laberst du noch immer weiter und sagst nach 10 Seiten nicht einfach: Der Allander hat recht. Let´s keep it simple!?--Allander (Diskussion) 19:17, 14. Mär. 2012 (CET)
@Erzbischof: Passt, ist besser als die jetzige. Gut gefällt mir auch die Reihenfolge mit der Begriffsgeschichte am Ende. Ich persönlich würde die Robustheit wieder mit reinbringen, weil's wohl der Hauptgrund ist, warum das Ding überhaupt verwendet wird. Oben hatte ich mal an einem Beispiel (Medianeinkommen) dargestellt, warum ich die "zwei Hälften" vor die "sortierte Liste" ziehen würde, aber mein Herzblut hängt jetzt nicht dran.
@Allander: Du hast recht, dass es wichtig ist, dass die Einleitung möglichst verständlich sein soll. Du hast aus meiner Sicht nicht recht mit deinem Einleitungsvorschlag: Nochmal der Hauptkritikpunkt: Sie ist einfach "zu wenig", sie sagt nicht genug, wie der Median einzuordnen ist, warum er wichtig ist, wozu und warum er angewendet wird. -- HilberTraum (Diskussion) 21:12, 14. Mär. 2012 (CET) PS: Und wenn dir deine Version angeblich so wichtig ist, solltest du wenigstens darin mal den Linkfehler fixen, auf den dich schon mehrere Leute aufmerksam gemacht haben. -- HilberTraum (Diskussion) 21:28, 14. Mär. 2012 (CET)
@ "zwei Hälften sortierte Liste": ich auch ;-) --Erzbischof 21:36, 14. Mär. 2012 (CET)
Für mich ist die Sache jetzt mit einer Kompromissversion nun endgültig gegessen. Danke an alle Mitdiskutanten deren Inputs weitestgehend in den heutigen Artikel mit eingeflossen sind. --Allander (Diskussion) 10:23, 15. Mär. 2012 (CET)

Naechster Akt

Was machen wir denn jetzt? Die neue Version von Allander enthaelt Verbesserungen und Verschlechterungen und Schienbeintritte (so interpretier' ich mal das Rausschmeissen der von mir angefertigten Grafiken und die heisse Schere im Abschnitt "Median von Verteilungen"). Die Einleitung geht so nicht, aber das kann man vermutlich Allander nicht mehr vermitteln. Aber fuer die Mitlesenden (Allander hatte ja bei Logograph und Regiomontanus angefragt) noch einmal den Hintergrund:

  • „Maße der zentralen Tendenz“ oder „Lageparameter“ sollen helfen, einen einzelnen Wert zu benennen, der eine Anzahl von Werten oder auch eine vom Zufall abhängende Groesse (z.B. Zeit bis zum nächsten Zerfalls eines Atoms) möglichst gut repräsentiert. Der Median ist so ein Lageparameter und er fasst Daten deswegen gut zusammen, weil er in ihrer Mitte liegt: Grob die Haelfte der Daten ist kleiner, die andere Haelfte groesser.
    Und im Fall einer Zufallsgroesse: in der einen Haelfte der Faelle ist sie kleiner als der Median, in der anderen groesser. Darum geht's, es geht nicht um die "mittlere Zahl in einer sortierten Liste von Zahlen", das die Berechnungsvorschrift im Fall einer Liste mit einer ungeraden Anzahl von Werten, nicht der Sinn. Die sortierte Liste fuert eher in die Irre.
  • Ausserdem hat der erste Satz die Struktur "[Begriff] bezeichnet als [Oberbegriff] oder [Synonym] ein [Objekt]". Das ist allein schon grammatikalisch hoechst verwirrend.
  • Der Median ist ein Begriff, der im Kontext von Statistik und Zufall betrachtet wird. Es geht nicht nur um Listen von Zahlen, sondern der Median ist auch eine Eigenschaft des Kollektivs aus dem die Werte stammen oder des Zufallsmechanismus, der die Werte liefert.
  • Der Artikel wird von Schuelern bis Hochschulstudenten und Lehrern benoetigt. Ingenieursstudenten freuen sich hoffentlich ueber die Grafik zur Exponentialverteilung, auch wenn Allander sie nicht versteht.
  • Eine Sache, die uns das Leben etwas kompliziert macht: Es gibt nicht den Median einer Menge, mehrere Zahlen koennen die Eigenschaft "nicht mehr als die Hälfte der Werte liegt darunter, nicht mehr als die Haelfte darueber" haben. Darum kommen weiter unten Obermediane, Untermediane, Mittelwerte zwischen den beiden Werten in der Mitte, etc. ins Spiel, wenn man aus den in Frage kommenden Zahlen eine auswaehlen moechte.
  • Zu guter Letzt: Mathe ist nicht pfui und muss nicht versteckt werden. Wenn ihr mir eine Freude machen wollt, bewegt Allander dazu, sprachlich etwas abzuruesten, vergleiche auch seine Benutzerseite.

--Erzbischof 18:38, 15. Mär. 2012 (CET) PS @HilberTraum: Im Abschnitt Verteilung war ein Fehler, die beiden Konzepte ein Median und das 50%-Quantil waren vermengt.

Wenn man sich hier gar nicht einigen kann - und danach sieht's ja fast aus - dann hätte ich noch einen "radikaleren" Vorschlag. Man macht aus diesem Artikel zwei: einen zum Median einer Stichprobe und einen zum Median einer Zufallsvariable/Wahrscheinlichkeitsverteilung. Das wäre dann etwa analog zu Stichprobenkovarianz und Kovarianz (Stochastik). Ich hatte mich mal hier für diese Trennung ausgesprochen, aber beim Median weiß ich nicht, ob das wirklich so leserfreundlich ist, weil der Median ja insgesamt eher ein Konzept der Statistik ist und in der Wahrscheinlichkeitstheorie nach meinem Eindruck nicht so eine große Rolle spielt. Aber vielleicht, wenn's gar nicht anders geht? Was meint ihr? -- HilberTraum (Diskussion) 20:06, 15. Mär. 2012 (CET)
Muss ich mal drüber nachdenken. Wenn eine Aufteilung das Richtige ist, weil das Lemma zu viele Facetten umfasst, ja. Um den Streit zwischen A. und mir zu schlichten, eher nicht. Im Prinzip greift bei letzterem dasselbe Prinzip, warum en:Wikipedia:POV forks nicht erwünscht sind. --Erzbischof 21:09, 15. Mär. 2012 (CET)

Varianten

Ich wollte hier kurz festhalten, dass wie Philipendula schon sagte,

 

damit wir mit den "Hälften" und den Verhältniszeichen nicht immer durcheinander kommen (wegen P(A) ≤ x   P(A^c) = 1 - P(A) ≥ 1 - x)
--Erzbischof 20:54, 16. Mär. 2012 (CET)

Bildchen

 
Here you are! --Erzbischof 22:35, 12. Mär. 2012 (CET)
 
... und passend dazu das Gleichgewichtsbild von dem ich sprach. --Erzbischof 22:35, 12. Mär. 2012 (CET)

Ich lass das mal hier, die sind von gestern und "gingen verloren". Die Beta-Verteilung ist nicht perfekt, weil sie keine closed-form-solution fuer den Median hat, daran habe ich nicht gedacht, als ich das Bild fuer Erwartungswert gemacht habe. Input erwuenscht. --Erzbischof 19:48, 12. Mär. 2012 (CET)

 
Median eines Notenspiegels. Höchstens die Hälfte der Arbeiten sind schlechter und höchstens die Hälfte besser als der Median, in diesem Beispiel 3.
Dankend Grafik 1 eingefügt. Grafik 2 ist imho so unklar. --Allander (Diskussion) 20:03, 12. Mär. 2012 (CET)
Ich finde beide Grafiken recht schön. Bei der Betaverteilung fänd ich's toll, wenn es dazu auch noch parallel ein Bild der Verteilungsfunktion gäbe, wo man sieht, dass sie an der Stelle des Medians den Wert 0.5 hat. Noch besser wäre allerdings, wenn beide Bilder eine Exponentialverteilung zeigen würden, weil die ja schon im Text angesprochen wird. -- HilberTraum (Diskussion) 20:21, 12. Mär. 2012 (CET)
Wow, das ging ja schnell! Aber ist f und F im selben Koordinatensystem nicht etwas verwirrend? Vor allem weil die Dichte auch noch an der Stelle 0 genau den Wert 1/2 hat, und man F im dunkelgrauen Bereich gar nicht sieht. Ich fände eigentlich zwei einzelne Grafiken übersichtlicher. -- HilberTraum (Diskussion) 09:52, 13. Mär. 2012 (CET)
Ich habe es so gemacht, weil dann beide Grafiken nebeneinander passen, vgl. https://en.wikipedia.org/w/index.php?title=Exponential_distribution&diff=481651935&oldid=481588408 . Vielleicht kannst du die Grafik nehmen und mit einem SVG-Programm kurz überarbeiten. Sind ja alle Zutaten für deinen Wunsch drin, müssen nur an die richtige Stelle geschoben werden (und das Koordinatenkreuz dupliziert etc.) --Erzbischof 20:14, 13. Mär. 2012 (CET)
Hallo, hier findet Enzyklopädie statt, hier spielt es nicht Wissenschaft! Hier sollen Zusammenhänge und Wissen an Wissenssuchende vermittelt werden! Was ihr da macht ist keine Artikelarbeit sonder gezielte Verwirrung des Lesers. Und im Übrigen: Die Einleitung eines Artikels klärt in groben Zügen und in allgemein verständlicher Sprache, was der Begriff bedeutet und wie er verwendet wird. --Allander (Diskussion) 11:03, 13. Mär. 2012 (CET)
Was das jetzt genau mit den Bildern zu tun hat, versteht ich leider nicht so recht. -- HilberTraum (Diskussion) 16:28, 14. Mär. 2012 (CET)
Ist das nicht auf den ersten Blick selbsterklärend? Abgesehen davon dass das Bildchen des Notenspiegels ein ganz besonders schlechtes Beispiel für die Anwendung des Medianwertes ist und ohne meinen euch hofierenden Zusatz (... als der Median 3. Das arithmetische Mittel ist 3,26, also ist dieses in diesem Beispiel- je nach Interpretationsgesichtspunkt- möglicherweise die aussagekräftigere statische Kenngröße.) unbrauchbar ist: OK, Ich les dir den Text vor, die Bildchen (mit exp (lamda) und ln2/lamda mal 1/lamda usw.) kann ich leider nicht vorlesen: ..stetige Verteilung ....gleicher Wahrscheinlichkeitsmasse.... Dichtefunktion ...Beta(2,5) erteilung....Gleichgewichtsbild - und diesen Begriffswust gibts komprimiert auf vier Zeilen. Da ist keinerlei Ansatz einer Erklärung. Kapiert ihr wirklich nicht wo ihr hier seid? --Allander (Diskussion) 18:26, 14. Mär. 2012 (CET)p.s.: Ich lach nicht drüber, ich schwörs, aber berühmt könnten wir schon werden mit diesem Thread: Wissenschaftitis ab 18:22, 5. Mär. 2012 (CET) bis dato. Das sind, nur auf der Diskussionsseite ohne konstruktive Artikelarbeit im Moment: 4.124 Wörter auf 10 Din A4 Seiten.
Ich fürchte bis wir in die Profiliga aufgenommen werden, dauert's noch ein bisschen. -- HilberTraum (Diskussion) 21:46, 14. Mär. 2012 (CET)


Ich habe eine Variante der Grafik, ich finde sie besser, weil sie sehr schön zeigt, wie der Median auf ordinalskalierte Werte angewendet werden kann und wie beim Median die Schwelle zu fünfzig Prozent der Werte überschritten wird. A la "Was ist der Durschnitt von 3- und 2+?" --Erzbischof 11:27, 18. Mär. 2012 (CET)

 
Der Median dieses Notenspiegels ist 3-. Etwas weniger als die Hälfte der Noten ist schlechter, gerade etwas mehr als die Hälfte ist schlechter oder genauso gut.

Erzbischöfliche Nebenfront

Nur der Vollständigkeit der Diskussion halber von mir hierher verlinkt: [6]. Duch das Nachtreten von Erzbischof hats bis heute gedauert, aber jetzt verspeche ich ist für mich wirklich Schluß, ich werde nicht mehr antworten. --Allander (Diskussion) 16:50, 17. Mär. 2012 (CET)

Notiz Standardfehler, Konfidenzintervall, Grenzwertsätze für den Stichprobenmedian

Standardfehler

(Data Analysis and Graphics Using R: An Example-Based Approach. John Maindonald, John Braun)
Fuer den Median einer  -elementigen Stichprobe von i.i.d. normalverteilten Zufallsvariablen  

Konfidenzintervall

(Elementare Statistik, Götz Kersting, Anton Wakolbinger, S. 128)
Fuer die Ordnungsstatistiken   einer  -elementigen Stichprobe von i.i.d. reellen Zufallsvariablen gilt (j < n/2)

 
Grenzwertsatz

Noch nicht aufgetrieben, gibt es aber, vermutlich unter dem Thema Ordnungsstatistiken. --Erzbischof 22:43, 19. Mär. 2012 (CET)

Schon der erste Satz ist fehlerhaft

"Der Median oder Zentralwert ist ein Mittelwert für Verteilungen in der Statistik. " und das entsprechende Beispiel (die Zahlen 1, 1, 2, 4, 37 mit der 2 als Median) passen nicht zueinander. --112.198.77.137 13:02, 19. Nov. 2014 (CET)

unsinniger 2. Absatz

"Allgemein teilt ein Median einen Datensatz, eine Stichprobe oder eine Verteilung so in zwei Hälften, dass die Werte in der einen Hälfte nicht größer als der Medianwert sind, und in der anderen nicht kleiner."
Das entspricht aber nicht der darüber befindlichen Aussage und träfe auf jede Zahl in einer der Größe nach sortierten Reihe zu - also Unsinn.
---Lsrider (Diskussion) 10:39, 24. Jan. 2016 (CET)

Die Betonung liegt auf den beiden "Hälften"! Gruß! GS63 (Diskussion) 10:43, 24. Jan. 2016 (CET)
gudn tach!
da eine haelfte nicht immer "1/2" bedeuten muss, sondern auch haeufig als "einer von genau zwei teilen" benutzt wird (vgl. duden) koennte man die stelle vielleicht unmissverstaendlicher schreiben, z.b.: "[...] in zwei (gleich große) Hälften [...]". -- seth 20:36, 24. Jan. 2016 (CET)
In Klammern hätte ich dagegen gar nichts einzuwenden. Gruß! GS63 (Diskussion) 21:06, 25. Jan. 2016 (CET)

Median einer Stichprobe - Formel

Hallo! Es geht um die Formel

 

Ich hab das mal in PHP übersetzt und die Ergebnisse kommen wir komisch vor:

<?php

function median(array $values)
{
  sort($values);
  $n = count($values);

  if (($n % 2) === 0)
  {
    return 0.5*($values[$n/2] + $values[($n/2)+1]);
  }
  else
  {
    return $values[($n+1)/2];
  }
}

var_dump(
  median([1,2,3,4,5]), // Ergebnis: 4
  median([1,1,1,1,1]), // Ergebnis: 1
  median([1,2,3,4]), // Ergebnis: 3.5
  median([1,2,2,2,5]), // Ergebnis: 2
  median([5,4,3,2,1]), // Ergebnis: 4
  median([10, 5, 13, 18]) // Ergebnis: 15.5
);

Nun hätte ich jetzt aber beim ersten und vorletzten Ergebnis den Wert 3 erwartet, es kommt aber 4 raus.

Wenn ich nun für den ungeraden Fall die Formeln auf n-1 statt n+1 ändere passt es:

<?php

function median(array $values)
{
  sort($values);
  $n = count($values);

  if (($n % 2) === 0)
  {
    return 0.5*($values[$n/2] + $values[($n/2)+1]);
  }
  else
  {
    return $values[($n-1)/2];
  }
}

var_dump(
  median([1,2,3,4,5]), // Ergebnis: 3
  median([1,1,1,1,1]), // Ergebnis: 1
  median([1,2,3,4]), // Ergebnis: 3.5
  median([1,2,2,2,5]), // Ergebnis: 2
  median([5,4,3,2,1]), // Ergebnis: 3
  median([10, 5, 13, 18]) // Ergebnis: 15.5
);

Ist die Formel Fehlerhaft oder meine Erwartungen? --Restful~dewiki (Diskussion) 17:07, 9. Aug. 2016 (CEST)

Hallo, im Artikel beginnt der Index der   bei 1, bei PHP beginnt er aber bei 0. Grüße -- HilberTraum (d, m) 17:30, 9. Aug. 2016 (CEST)
Vielen Dank für die schnelle Antwort, das erklärt mein Problem --Restful~dewiki (Diskussion) 18:51, 9. Aug. 2016 (CEST)

Abtrennen des Medians einer Wahrscheinlichkeitsverteilung

Ich bin für das Abtrennen der stochastischen Teils aus diesem Artikel aus den folgenden Gründen: Die beiden Median(s/e?) unterscheiden sich so wie das arithmetische Mittel und der Erwartungswert. Das eine ist Kennzahl einer Stichprobe (und damit eine auf   definierte Funktion), das andere eine Kennzahl eines Wahrscheinlichkeitsmaßes (und damit ein Funktional). So könnte man den stochastischen Fall klarer und besser Auffindbar abhandeln. Wegen Klammernzusätzen und Weiterleitungen müsste man dann nach dem entlinken schauen was am meisten besucht wird. Meinungen? LG --NikelsenH (Diskussion) 19:45, 15. Aug. 2016 (CEST)

Fertig --NikelsenH (Diskussion) 06:41, 24. Aug. 2016 (CEST)

Sortierung der Werte

Für die Ermittlung des Medians ist die Sortierung der Werte wichtig, es ist aber nicht wichtig in welcher Richtung diese sortiert sind. Der Hinweis "aufsteigend" sollte daher geändert werden in "aufsteigend oder absteigend". Das Ergebnis ist in beiden Fällen das Gleiche.--David Bruchmann (Diskussion) 08:27, 12. Sep. 2016 (CEST)

Definition am Anfang

Der erste "richtige" Abschnitt heißt "Beschreibung", zu recht. Ich hätte dort aber gerne eine Definition, möchte aber den Hauptautoren nicht vorgreifen. Ich fand unter Lageparameter (Deskriptive Statistik) einen solchen und würde vorschlagen, das so einzufügen. Hier der Wortlaut:


Der Median, mit  ,   oder   bezeichnet, ist derjenige Wert, der die Stichprobe in zwei Hälften teilt:

  • Eine Hälfte kleiner als der Median
  • Eine Hälfte größer als der Median

Dazu wird zuerst die Stichprobe   der Größe der Werte nach geordnet. Der so entstandene Datensatz wird dann mit   bezeichnet. Somit ist   der  -größte Wert der Ausgangsstichprobe. Der Median wird dann definiert als

 


Was denkt Ihr? --Karl24042017 (Diskussion) 13:04, 9. Dez. 2017 (CET)

Also würdest du quasi die Definition von Lageparameter (Deskriptive Statistik) übernehmen wollen? --JonskiC (Diskussion) 14:54, 9. Dez. 2017 (CET)
Ich glaube du verwechselst da was Karl24042017, ich bin hier nicht Hauptautor;D Aber ich denke dein Vorschlag ist eigentlich gut, da diese Definition für hiesigen Artikel geeigneter ist. Grüße.--JonskiC (Diskussion) 15:00, 9. Dez. 2017 (CET)
Ich habe nicht behauptet, daß du Hauptautor in Median bist, hast du dich durch das "Ihr" angesprochen gefühlt? Ich denke, soweit sind wir noch nicht. --Karl24042017 (Diskussion) 15:36, 9. Dez. 2017 (CET)

Sortierung in O(n), nicht O(n log n)

Bei https://de.wikipedia.org/wiki/Median#Eigenschaften wird davon gesprochen die Sortierung würde O(n log n) dauern, da es sich aber meist um numerische Werte handelt kann man auch auf den https://de.wikipedia.org/wiki/Radixsort verweisen welcher O(n) hat.

Ist der Punkt inzwischen geklärt oder ist hier noch was offen? Gruß! GS63 (Diskussion) 21:55, 30. Mai 2019 (CEST)

Median interessant für Steuerzahler?

 Bei einer Einkommensverteilung interessiert Steuerzahler zumeist, wie viel ein typischer Bürger verdient, was sich deutlicher im Median widerspiegelt.

Wieso ist das für Steuerzahler interessant? Wer mehr zahlt, zahlt mehr Steuern. Und das ist unabhängig gavon, wo der Bürger mit seinem Einkommen in Bezug zum Median liegt. Was soll der Steuerzahler für eine erkenntnis gewinnen? Ich habe auch noch keinen gesehen, der gesagt hat, ich habe lieber ein niedrigeres Einkommen um dann weniger Steuern zu zahlen. Der Satz suggeriert außerdem, dass der typische Bürger ein Einkommen am Median hat. Aber den typischen Bürger gibt es nicht.--Voluntario (Diskussion) 18:12, 2. Nov. 2017 (CET)

Der ganz Absatz ist hier Fehl am Platz:
Ob Median oder arithmetisches Mittel aussagekräftiger ist, hängt von der Fragestellung ab. Bei einer Einkommensverteilung interessiert Steuerzahler zumeist, wie viel ein typischer Bürger verdient, was sich deutlicher im Median widerspiegelt.
Die Sache mit der Einkommensverteilung und dem Steuerzahler ist sachlich falsch und erklärte auch dann nichts, wenn er stimmte.
Dass mal "Median" mal "arithmetisches Mittel" "aussagekräftiger" seihen, ist hingegen genauso inhaltsstark, wie die Feststellung: "Ob Zange oder Hammer besser ist, hängt von der Aufgabe ab." Danach folgt dann dieser falsche Steuerzahlersatz, vom dem man sich doch nur fragt: „Was wollte der Autor damit denn überhaupt sagen?“
Ich habe den Absatz deshalb entfernt.
Allerdings wäre eine brauchbare Erklärung, wann und aus welchen Gründen "Median" und "arithmetisches Mittel" relevant werden schon sehr essenziell. Aber dazu braucht es schon etwas Substanz und vielleicht auch ein paar Zeilen mehr.
Gruß! GS63 (Diskussion) 10:44, 27. Jun. 2019 (CEST)

Warum einfach, wenn’s auch kompliziert geht?

Dieser Artikel ist ein herrliches Beispiel dafür, wie man eine furchtbar einfache Sache so kompliziert erklären kann, dass kein Mensch mehr drauskommt. 127.0.0.1 19:06, 27. Aug. 2020 (CEST) (unvollständig signierter Beitrag von 2A02:1206:4516:11C0:D449:A33F:A9FA:C68D (Diskussion) )

OMA-tauglichkeit und Umbau

Wie so viele Statistikartikel bei deWiki ist auch dieser für den Normalnutzer untauglich. Es stehen viele Mathematische Begriffe unzusammenhängend, unsortiert und unerklärt durcheinander, ohne das eine klare Strategie in diesem Artikel zu erkennen ist. Daher wäre mir daran gelegen diesen und auch weitere Artikel so umzubauen, dass sie sowohl die Mathematik beschreiben, als auch für den Normalnutzer nutzbar ist. Dazu habe ich für diesen Artikel einmal einen ersten Vorschlag unter Benutzer:Maphry/Median gemacht. Er ist noch nicht fertig, aber würde das folgende Verfolgen: Hier einen Übersichtsartikel zum Median, zum Vergleich zu Mittelwert und die wichtigsten Eigenschaften mit Beispielen. Der Stichprobenmedian würde in dem entsprechenden Artikel Weitesgehend ausgelagert und genauso der Artikel Median (Stochastik) nach Median einer Verteilung verschoben. Somit hätte man zwei Hauptartikel für den hier ind er Übersicht dargestellten Inhalt. Die beiden unterartikel müssten dann noch OMA-tauglich gemacht werden. Es ist erstmal ein Vorschlag, der bei nicht.wiederspruchin den nächsten Tagen eingebaut wird. Ich würde mich freuen wenn es Unterstützung gäbe auch weitere Artikel ind er Statistik entsprechend umzubauen, damit man nicht mehr die Leute immer nach enWP verweisen muss wenn man etwas bei deer Statistik verstehen will.--Maphry (Diskussion) 19:26, 30. Mai 2019 (CEST)

man kann fachbegriffe möglichst leicht verständlich erklären oder auch besonders umständlich. aber einen mathematischen begriff so zu erklären, dass ein rezipient, der auch alle anderen mathematischen begriff nicht kennt, indem man die alle in einfache sprache übersetzt, ist unmöglich. wer in dem satz "der median ist ein wert..." schon nicht weiß, was "wert" bedeutet, hat die möglichkeit, "wert" auf wikipedia nachzuschlagen. bei "median" hat es ja immerhin auch geklappt. schwierigere in-kontext begriffe wie "ausreißer" oder "lageparameter" sind zu diesem zwecke ja bereits mit entsprechenden links versehen. --2003:D4:7F15:2AF9:7158:2E9C:8C0B:56A7 16:15, 29. Apr. 2022 (CEST)