Diskussion:Methode der kleinsten Quadrate/Archiv/2009

Überdeterminiertes System linearen Gleichungen

Mmn. ware es besser im Allgemeinen die Methode dkK zu betrachten als annäherendes Losungsverfahren von überdeterminierte Systemen linearer Gleichungen. Nijdam 22:47, 31. Mai 2009 (CEST)

Das ist sie meiner Meinung nach nicht, je nach Problem sind andere Arten der Regression sinnvoller. --P. Birken 16:05, 1. Jun. 2009 (CEST)
Was hat es mit Regression zu tun? Zwar kan man die Meth.dkK in einige Regressionsproblemen anwenden, ansonsten gibt es keine Beziehung. Nijdam 18:55, 1. Jun. 2009 (CEST)
Wenn ich mich mit meinem Lieblingsthema einmischen darf: Die kleinsten Quadrate haben von sich aus überhaupt nichts mit linearen Gleichungen zu tun. Man kann auch Kurvenfitten von Sinussen oder Exponentialkurven machen mit Hilfe der kleinsten Quadrate. Die Fälle mit linearen Gleichungen als Modellfunktion haben nur den Vorteil, dass sie sich bei der Verwendung der kleinsten Quadrate als Fehlerfunktion direkt in ein lineares Gleichungssystem überführen lassen, für das es dann sehr gut bekannte Lösungsverfahren gibt. Wenn die Modellfunktion aber nicht linear ist, dann klappt das nicht mit dem Gleichungssystem, es wird dann auch kein überbestimmtes, sondern man muss ganz andere Optimierungsverfahren anwenden, stets aber immer noch mit den kleinsten Quadraten als Fehlerfunktion, die es zu minimieren gilt. --PeterFrankfurt 23:54, 1. Jun. 2009 (CEST)
Da hast du recht. Ich meinte eigentlich: überdeterminierte Systemen von Gleichungen. Ich wollte betonen, dass es nicht unbedingt Kurvenfitting betrifft, obwohl man es vielleicht immer als solches auffassen kann. 10:31, 2. Jun. 2009 (CEST) (ohne Benutzername signierter Beitrag von Nijdam (Diskussion | Beiträge) )
Ich hab schon verstanden was Du meinst. Lineare Gleichungssysteme kommen immer irgendwoher. Und je nach zugrundeliegendem Problem kann es sinnvoll sein, die Methode der kleinsten Quadrate anzuwenden oder eben eine andere Form der Fehlerbewertung, die einer anderen Form der Regression entspricht. --P. Birken 20:43, 2. Jun. 2009 (CEST)

Wiederwahldiskussion

  • Kontra - Der Artikel ist für einen Laien aufgrund der vielen Fachbegriffe unverständlich, obwohl das Thema für einen Mathematikartikel sehr anschaulich wäre. Meine Versuch zumindest die Einleitung zu vereinfachen wurden nicht angenommen. Ich bin der Meinung es ist eine Grundvoraussetzung für die Exzellenz, dass man auch ohne Studium versteht um was es geht und bin deshalb für eine Abwahl.--G 22:35, 31. Mai 2009 (CEST)
    Mir ist weiterhin nicht begreiflich, was an der Einleitung unverständlich sein sollte. Sie stellt deutlich heraus worum es geht, und im Gegensatz zu den meisten Mathematikartikeln ist eine vernünftige Balance zwischen Anschaulichkeit und formaler Korrektheit gefunden worden. Sowieso bin ich der Meinung, dass ein Abwahlantrag besser begründet sein sollte. --Scherben 13:18, 1. Jun. 2009 (CEST)
Wie gesagt ging es mir selbst so und weiß auch von anderen, dass sie den Artikel unverständlich finden. Der Grund ist meiner Meinung nach die Schwemme an Fachbegriffen, die für auch nicht nötig ist. Es wird sich ja hier in der Abstimmung zeigen, wie das andere Leute sehen. Sicher ist der Artikel noch besser verständlich als viele andere Mathematik Artikel, das liegt aber leider an den anderen Artikeln. Für mich hat auch die totale Korrektheit nur eine geringe Bedeutung. Das heißt nicht, dass etwas falsches drinnen stehen darf, aber man kann "normale" Begriffe verwenden, auch wenn Fachbegriffe das ganze natürlich genauer charakterisieren würden, die exakte Definition kann man dann irgendwo im Artikel machen. Leute die es interessiert lesen die dann auch noch. Ich denke, dass die exzellenten Artikel auch hin und wieder von Schülern oder anderen Laien angeschaut werden und finde es schade, dass die dann von so einer anstrengenden Einleitung abgeschreckt werden. --G 13:22, 1. Jun. 2009 (CEST)
Totale Korrektheit ist gerade bei mathematischen Begriffen von entscheidender Bedeutung. WP fungiert hier nicht (nur) als populärwissenschaftliches Lexikon, das sich damit begnügen mag Begriffe nur anschaulich und im Zweifelsfall ungenau zu erläutern, sonder WP fungiert auch als Fachlexikon, dass mathematische Begriffe exakt erklären muss (wie dies allgemeine Enzyklopädien übrigens normalerweise auch tun, auch wenn weniger ausführlich). Das ist jetzt natürlich ein kein Freibrief für Mathematiker unverständlich daherzuformulieren, aber Exaktheit und "totale Korrektheit" sind unverzichtbar. In Fällen in denen die exakte Formulierung für Laien schwer verständlich ist, kann man allerdings überlegen den Artikel in verschiedene Abschnitte aufzuspalten, bei denen sich ein Abschnitt einer leicht verständlichen (aber unter Umständen nicht exakten oder völlig korrekten) Darstellung widmet.--Kmhkmh 20:42, 1. Jun. 2009 (CEST)
(BK)Das einzige, was mir am Einleitungsabsatz unklar ist, ist das Wort „parameterabhängig“. „Punktwolke“ und „Modellkurve“ erscheinen mir allgemein verständlich, und die Motivation, warum man ausgerechnet die Quadratsumme minimiert, ist im ersten Absatz noch nicht erforderlich. --Joachim Pense (d) 13:34, 1. Jun. 2009 (CEST)
Werter G, was hälst Du davon Deinen Wiederwahlantrag zurück zu nehmen? Als Mathematiklaie ist die Einleitung verständlich und nachvollziehbar. Vielleicht solltest Du einfach mal WP:DM als Lösungsmöglichkeit in Erwägung ziehen? Achso, falls der Antrag nicht zurückgezogen wird: Pro --MfG Markus S. 18:44, 1. Jun. 2009 (CEST)

Pro Mathe läuft auf meinem Gehirn leider sehr schlecht, aber diesen Artikel finde ich dann doch sehr anschaulich und sehr gut gemacht - no need for Abwahl, IMHO. --TRG. 19:05, 1. Jun. 2009 (CEST)

Neutral Ich finde den Artikel tatsächlich exzellent, bemängele dennoch die Verständlichkeit für Nicht-Mathematiker. Ich bin Betriebswirt und denke, dass ich das Thema in den Grundzügen beurteilen kann. Ob für die Diskussion hier die richtige Stelle ist, sei dahingestellt. Ich möchte den ersten Abschnitt hier einmal einem alternativen Textvorschlag gegenüberstellen, der für einen Mathematiker grauenhaft aussehen mag. Er drückt aber für mich besser aus, was da eigentlich gemacht wird.

jetziger Text: Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Es ist eine Wolke aus Datenpunkten gegeben, die physikalische Messwerte, wirtschaftliche Größen oder Ähnliches repräsentieren können. Zu dieser Punktwolke soll eine möglichst genau passende Kurve aus einer Familie von gegebenen Funktionen gefunden werden. Sind diese Kurven (wie in den meisten klassischen Fällen) parameterabhängig, so bestimmt die Methode der kleinsten Quadrate die optimalen Parameter numerisch, indem die Summe der quadratischen Abweichungen der Modellkurven von den beobachteten Punkten minimiert wird.
Variante: Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist ein mathematische Verfahren zur Beschreibung eines Zusammenhangs verschiedener Werte, die in einem Koordinatensystem dargestellt werden. Bei den Werten kann es sich um naturwissenschaftliche Messwerte, wirtschaftliche Größen oder ähnliche Daten zum Beispiel aus der Medizin oder den Sozialwissenschaften handeln. Es wird dabei eine Funktion berechnet, bei der der Abstand der Daten zur Kurve minimal ist. Weil die Abstände zur Funktion positiv oder negativ sein können, berechnet man nicht die Summe der Abstände, sondern die Summe der Quadrate der Abstände und bestimmt deren Minimum. Die Methode der kleinsten Quadrate ist das Standardverfahren zur Ausgleichsrechnung.

Ich hoffe es wird deutlich, wo ein Nicht-Mathematiker einhakt. Gruß Lutz Hartmann 19:17, 1. Jun. 2009 (CEST)

Der untere Absatz stimmt dann nur eben nicht mehr. „Weil die Abstände zur Funktion positiv oder negativ sein können, berechnet man nicht die Summe der Abstände, sondern die Summe der Quadrate der Abstände“: Das stimmt so einfach nicht, man haette dann ja jedebeliebige Funktion, derer Ergebnisse nicht negativ sind waehlen koenen: Beispielsweise die Betragsfunktion oder x4, es hat aber einen bestimmte Sinn, warum quadriert wird. Fossa?! ± 20:49, 1. Jun. 2009 (CEST)
Das die Betragsfunktion als Bewertungsmethode für die Abstände nicht so brauchbar ist, liegt an der nicht vorhandenen Differenzierbarkeit im Punkte 0, d.h. man muss immer Fallunterscheidungen einführen, aber warum soll eine Bewertung mit x4 nicht sinnvoll sein? Mir fällt nur die noch stärkere Betonung von Ausreißern ein, die aber nicht in jedem Datensatz vorhanden seien müssen.--Mirko Junge 06:26, 2. Jun. 2009 (CEST)
Die Dritte Meinung hole ich ja gerade ein. Wenn hier mehr Leute der Meinung sind, dass die Exaktheit wichtiger als die Verständlichkeit ist, werde ich das akzeptieren. Ich bin mir sicher, dass viele Leute ein Problem haben, diesen Artikel zu verstehen. Natürlich sind alle Leute die sich hier beteiligen gewohnt zu recherchieren und mit unbekannten Begriffen zu arbeiten, aber das gilt sicher für viele andere nicht. Ich denke, dass es einigen Leuten helfen würde zuerst zu schreiben, dass man mit diesem Verfahren versucht, eine Funktion möglichst gut an (Mess)punkte anzupassen. Dass man damit nicht alles abdeckt ist mir klar und natürlich gehört das Exakte noch in den Artikel, das reicht aber auch noch im 2. Absatz.--G 10:28, 2. Jun. 2009 (CEST)
Zur Anmerkung von Fossa: Ich möchte darauf hinweisen, dass wir hier über die Einleitung reden. Entweder habe ich es überlesen, oder der Artikel erklärt nicht, warum man Quadrate nimmt und nicht x4. (Ich nehme mal an: So einfach wie möglich (Ockhams Rasiermesser)). Der untere Absatz ist nicht falsch und Erläuterungen im Text braucht der obere Absatz viel mehr (woher kommt die Familie der gegebenen Funktionen? was bedeutet das? was heißt es, dass ein Kurve parameterabhängig ist? Was heißt numerisch?), um für einen Laien etwas auszusagen. Ich möchte auch für den letzten Absatz der Einleitung eine Umformulierung vorschlagen:
Text bisher: Angewandt als Systemidentifikation ist die Methode der kleinsten Quadrate in Verbindung mit Modellversuchen für Ingenieure ein Ausweg aus der paradoxen Situation, Modellparameter für unbekannte Gesetzmäßigkeiten zu bestimmen.
Alternative: Ingenieure verwenden die Methode der kleinsten Quadrate bei Modellversuchen zur Systemidentifikation, um aus vorhandenen Daten Modellparameter zu bestimmen, wenn bisher keine Gesetzmäßigkeiten bekannt sind.
Diese Vorgehensweise ist übrigens nicht paradox, sondern eine Form der Abduktion, der einzigen Schlussweise, mit der man neue Erkenntnisse generieren kann. Wie gesagt, ich werde hier nicht mit Kontra stimmen, weil ich den Artikel insgesamt für sehr gut halten. Lutz Hartmann 10:53, 2. Jun. 2009 (CEST)
Doch, Dein Textvorschlag ist falsch. Wenn Du nicht genau weißt, was Kurvenparameter sind, kannst Du keine Einleitung zu einem mathematischen Artikel neu schreiben. Verfahren zur Beschreibung eines Zusammenhangs verschiedener Werte ist Kokolores, egal was Du mit Zusammenhang eigentlich meinst. Es wird dabei eine Funktion berechnet ist erst recht falsch, wär natürlich prima. woher kommt die Familie der gegebenen Funktionen? Tja, die muss der Physiker/Ingenieur/etc erraten, herleiten usw, das ist sein Job. Abstand der Daten zur Kurve ergibt keinen Sinn. Versteh mich nicht falsch, evtl kann man das alles noch besser formulieren, aber wer noch nie von Ausgleichsrechnung gehört hat, hat natürlich Schwierigkeiten, eine spezielle Methode derselben zu verstehen; deswegen ist der Link zum Hauptartikel im ersten Satz schon gut aufgehoben.--Sommerkom 11:08, 2. Jun. 2009 (CEST)
@Sommerkorn: In diesem Ton solltest Du hier nicht schreiben. Du tust Luha damit mehr als unrecht. Insbesondere ist Luhas Textvorschlag nicht so "falsch", wie Du es darstellst. --Zipferlak 11:33, 2. Jun. 2009 (CEST)
Kokolores etc sollte eigentlich nur launig sein, wenn das Luha gegenüber anders rüberkommt, tut's mir ausdrücklich leid. Das "Wer noch nie" bezog sich sowieso nicht auf Autoren, sondern auf den allgemeinen Leser, dem man die grundlegenden Begriffe im Hauptartikel erklären sollte. --Sommerkom 11:42, 2. Jun. 2009 (CEST)
@ Sommerkom: ich glaube schon, dass ich weiß, wie man durch Einsatz von Parametern und bestimmten Funktionsstrukturen bestimmte Kurvenverläufe erzeugt. Die Fragen die da stehen, sind nicht unbedingt meine Fragen. Darum geht es aber nicht. Dass „mathematisch Gebildete“ den Text nicht exakter formulieren könnten als ich, habe ich ja überhaupt nicht behauptet. Das Problem ist doch, dass die mathematisch korrekte Formulierung, die derzeit im Artikel steht, sehr viel impliziert und einem nicht vorbelasteten Leser nur sehr eingeschränkt vermittelt, worum es eigentlich geht. Die Einleitung sollte unter Verzicht auf die letzte mathematische Feinheit - dafür ist der Artikel dann ja da – dem „normal Gebildeten“ mitteilen, über welch prächtige Möglichkeiten die Mathematik verfügt, um praktische Probleme zu lösen. Irgendwie muss es doch möglich sein, den Sinn des Ganzen und die zugrunde liegende Idee mit nur begrenztem Einsatz des Fachvokabulars auszudrücken. Ja, ich bin tatsächlich der Meinung, dass man verstehen kann, was die „Methode der kleinsten Quadrate“ ist, ohne den Begriff „Ausgleichsrechnung“ zu kennen. Deshalb sollte der Hinweis auf „Ausgleichsrechnung“ durchaus da stehen, aber nicht zur Erklärung verwendet werden. Versucht es doch mal wie der gute Lehrer aus der Feuerzangenbowle: „Wat is änn Dampfmaschin?“. Lutz Hartmann 16:40, 2. Jun. 2009 (CEST)
Zur Wahl der Funktion: Es gibt natürlich auch andere Möglichkeiten, insbesondere wird in der Statistik mitunter auch die Betragsfunktion genutzt, um ausreißerrobust zu minimieren. Sollte tatsächlich noch ergänzt werden. --Scherben 20:51, 2. Jun. 2009 (CEST)
Man könnte das noch klarer formulieren, bisher ist es etwas verschämt versteckt in dem Satz zur Regressionsanalyse in der Einleitung und im geschichtlichen Teil bei der Erwähnung des Satzes von Gauß-Markow. --P. Birken 20:55, 2. Jun. 2009 (CEST)

Nur so als diffuse Bemerkung am Rande: Der Begriff Kurvenschar könnte aus der Schule bekannt sein, so dass er sich evtl. gewinnbringend in der Einleitung verwursten ließe. (Etwa: "Auf der Grundlage eines Erklärungsmodells für die gemssenen Daten wird eine Kurvenschar vorgegeben und die Kurve ermittelt, die am besten zu den Datenpunkten passt. Wie gut eine Kurve zu den Datenpunkten passt, wird durch die Summe der Quadrate der Abstände der Messwerte von den Werten der Kurve bestimmt." Ja, das ist jetzt ins Blaue geballert und sicherlich alles andere als sauber formuliert.) -- Ben-Oni 00:22, 3. Jun. 2009 (CEST)

Kontra - Dem Antragsteller ist insofern zuzustimmen, als in diesem Artikel bei vergleichsweise geringer mathematischer Tiefe des Artikelinhalts ein umfangreiches Werk an Fachbegriffen und fachsprachlicher Ausdrucksweise verwendet wird. MaW: Das hätte man auch einfacher sagen können. Inhaltlich gefällt mir die Fokussierung auf numerische Mathematik nicht - die Stochastik kommt mir zu kurz. Beispielsweise fehlt im linearen Standardmodell y = a + bx das Fehlerglied Epsilon. Es fehlen auch Aussagen zu den Konfidenzintervallen für die gefundenen Schätzer. Die fehlende Gewichtung der Stochastik merkt man auch an den Formulierungen; z.B. "Außerdem sollten die Messfehler normalverteilt sein, was zum einen wahrscheinlichkeitstheoretische Vorteile hat und zum anderen garantiert, dass Ausreißer in y so gut wie ausgeschlossen sind." (welche Vorteile ? was genau soll das heissen; "Aussreisser so gut wie ausgeschlossen"); "Mit Hilfe der Maximum-Likelihood-Methode (maximale Wahrscheinlichkeit) kann letztendlich folgende Vorschrift begründet werden" - Nein, der Grund besteht vielmehr im Satz von Gauss-Markow, was weiter oben auch richtig steht; "Die linearen Regressionsmodelle sind in der Statistik wahrscheinlichkeitstheoretisch intensiv erforscht worden." - dieser Satz schreit nach Literaturangaben; "Besonders in der Ökonometrie werden beispielsweise komplexe rekursiv definierte lineare Strukturgleichungen analysiert, um volkswirtschaftliche Systeme zu modellieren." - das hat wiederum wenig Bezug zum vorherigen Satz; "Strenggenommen ist die Normalverteilungsannahme für die abhängige Variable y nicht zwingend notwendig." - naja, bei Heteroskedastizität gilt der Satz von Gauss-Markow nicht und es ist zumindest aus dem Artikel nicht klar, inwiefern Least-Square dann noch minimalvariant ist. --Zipferlak 01:34, 3. Jun. 2009 (CEST)

Die stochastischen Teile sind absichtlich nicht drin, weil diese (wie es IMHO sein sollte) in Regressionsanalyse behandelt werden. --P. Birken 19:29, 4. Jun. 2009 (CEST)
  • Pro Zunächst einmal: der Artikel wurde 2004 zum EA gewählt. Dass nicht alles so ist, wie manche sich das heute vorstellen liegt in der Natur der Sache; spricht aber nicht zwangsläufig gegen den Artikel. Mit der recht pauschalen Begründung des Antragsstellers kann ich nichts anfangen. Beim Querlesen kann ich keine künstlich gestelzte Verwendung von Fachbegriffen feststellen. Formulierungsvorschläge und Beispiele sollten schon gebracht werden, bevor so ein Abwahlantrag gestellt wird. Ich kann auch nicht feststellen, dass der Hauptautor gebeten wurde, den Artikel ggf. zu überarbeiten. Die Einleitung beschreibt in groben Zügen, was das Verfahren macht. Es folgt ein kurzer, gut geschriebener geschichtlicher Abriss. Danach wird das Verfahren allgemein beschrieben und im Folgenden werden Spezialfälle behandelt. Auch die Grafiken und die Animation verdeutlichen die Methode anschaulich. Nachbesserungen im Detail mögen angebracht sein. Eine generelle Abwahl sehe ich nicht gerechtfertigt. – Wladyslaw [Disk.] 09:22, 5. Jun. 2009 (CEST)
Wenn er heute die Anforderungen für einen exzellenten Artikel nicht mehr erfüllt muss man ihn verbessern oder abwählen. Zum Thema Verbesserungsvorschläge solltest du erst einmal einen Blick auf die Diskussionseite werfen.--G 10:35, 5. Jun. 2009 (CEST)
Oh ja, ich finde da so Erbauliches von Dir wie Ich finde dass Begriffe wie "Punktwolke", "Modellkurve" und "(t;y)-Paare" nicht in der Einleitung auftauchen, Begriffe wie "numerisch", "Ausgleichsrechnung" und "Quadratsumme der senkrechten Abweichungen" irgendwie erklärt werden sollten. Jemand, der vorgibt Mathematik LK gehabt zu haben sollte damit keine wirklichen Verständnisprobleme haben. Derartige mathematische Sachverhalte auf die Ebene herabzutrivialisieren, dass sie auch derjenige versteht, der nur Prozentrechnung versteht ist schlicht unmöglich und würde den Artikel nicht verbessern sondern wirklich zu einem Abwahlkandidaten werden lassen. – Wladyslaw [Disk.] 10:50, 5. Jun. 2009 (CEST)
Es geht nicht darum, dass ich es nicht verstehe. Aber es ist in diesem Artikel definitiv möglich eine eine Erklärung zu finden, die von mehr Leuten verstanden wird. Wikipedia ist kein Mathematik-Lehrbuch sondern eine Enzyklopädie. Warum kann man hier eigentlich nicht seine Meinung äußern mit der man Artikel verbessern will, ohne dass man gleich angegriffen wird?--G 12:35, 5. Jun. 2009 (CEST)
Ich habe Dich in keinem Jota angegriffen. Ich verstehe deine Argumente nicht und artikuliere das. Wieso kann man in diesem Laden keine Gegenposition äußern, ohne dass sie gleich als persönliche Kriegserklärung verstanden wird? Die Wikipedia und besonders ihre stetige Verbesserung lebt vom Disput und der Auseinandersetzung und nicht etwa vom kuschlig-verlogenen Konsens oder von faulen Kompromissen. – Wladyslaw [Disk.] 12:52, 5. Jun. 2009 (CEST)
Die Aussage "der vorgibt Mathematik LK gehabt zu haben sollte damit keine wirklichen Verständnisprobleme haben" ist für mich schon ein persönlicher Angriff, und auch die falsche Behauptung, dass es keine Vorschläge von meiner Seite gab finde ich nicht ok. Ich sehe es auch so, dass Diskussion Wikipedia weiterbringen (aber man wird auch immer Kompromisse finden müssen) und will in diesem Fall, dass über die Prioritäten und die Verständlichkeit von Mathe-Artikeln diskutiert wird.--G 13:08, 5. Jun. 2009 (CEST)
Lass bitte die Kirche im Dorf. Ich schrieb der vorgibt, Mathematik LK gehabt zu haben ... weil Du eben vorgegeben hast, Mathematik LK gehabt zu haben. War doch so? Da ich diese Aussage glauben, aber nicht nachprüfen kann, nehme ich Sie als wahr an und verweise auf deine Vorgabe. Wenn ich eine Aussage von Dir aufgreife, so kannst du das schwerlich zum persönlichen Angriff erklären und nun schlage ich vor, dass wir die Diskussion beenden weil sie dem Artikel nicht weiter hilft. – Wladyslaw [Disk.] 13:23, 5. Jun. 2009 (CEST)

Pro Mathematische Artikel müssen nunmal exakt sein, es geht hier nicht um ein Aufmaß für Malerarbeiten. Die wesentlichen Fachbegriffe sind verlinkt, das Meiste erklärt. Zudem lässt sich auch klar trennen, wo noch der Mathekurs der Oberstufe und der Biologiestudent dabei sind und wo Mathematiker, Physiker und Informatiker unter sich bleiben. Das ist hier doch recht gut gelungen. Wer nicht aus einem der drei Fachbereiche kommt, braucht davon Vieles nicht und steigt halt an genau dieser Stelle aus. So ist das nunmal mit Mathematik. Bei Mathematikfachlexika hat ein Biologe auch keine Chance etwas zu verstehen und selbst Physiker kommen da mitunter an ihre Grenzen (freilich hier nicht, aber deshalb ist der Artikel auch exzellent, vergleiche das einmal mit üblichen Skripten zur Einführung in die Numerische Mathematik aus dem 3. Semester Mathe oder Physik-Nebenfach). --Cup of Coffee 23:37, 5. Jun. 2009 (CEST)

Pro Ich kann zwar rechnen aber habe von Mathematik wenig Ahnung. Wenn ich Formeln sehe, wie in diesem Artikel, klicke ich normalerweise weg. Angestachelt durch die Diskussion, die Unverständlichkeit suggeriert, habe mich dazu aufgerafft den Artikel zu lesen. Und siehe da, ich habe die Einleitung sofort verstanden und nach zweimal lesen auch die Methodik und Anwendungsmöglichkeiten gut nachvollziehen können. Wenn das einem Lexikonartikel bei einem Laien gelingt, ist das in meinen Augen perfekt. Vielleicht könnte die Einleitung noch einfacher formulieren aber die Exaktheit dürfte nicht darunter leiden. Wie wäre es mit einem Abschnitt praktische Anwendungsmöglichkeiten direkt nach der Einleitung? Da könnte man die Formulierungen von Lutz Hartmann aufgreifen. Wer die Einleitung nicht versteht, könnte gleich zu diesem Abschnitt springen und hat dann wenigstens eine praktische Vorstellung worum es geht. -- Mgehrmann 08:43, 6. Jun. 2009 (CEST)

Neutral Kontra Von der Verständlichkeit her finde ich den Artikel insgesamt in Ordnung, aber beim Durchlesen sind mir doch zahlreiche verwirrende Ungenauigkeiten und Inkonsistenzen aufgefallen, vor allem bei den Formeln und Grafiken. Ein paar Beispiele:

  • Die Modellfunktion heißt manchmal  , manchmal y, manchmal f. Überhaupt halte ich die Bezeichnung   für unglücklich, da y mit Index ja die Messwerte sind. Einmal steht sogar   da, was irgendwie gar keinen Sinn macht.
  • Der allgemeine lineare Fall scheint mir nicht sehr allgemein zu sein. Kann es sein, dass hier Linearität in t mit Linearität in x vermischt wird? Linearität bezieht sich hier doch immer auf Linearität in den Parametern, oder? Der genaue Zusammenhang mit dem linearen Ausgleichsproblem   bleibt auch ziemlich vage und wird nur im Zusammenhang mit Beispielen erwähnt.
  • Die Grafik in der Einleitung wirkt insgesamt etwas "schlampig". Grüne Pfeile enden im Nirgendwo, drei der Pfeile sind mit e beschriftet, da kann man auf die Idee kommen, dass die alle gleich lang sein sollen. Auch sollten die y durchindiziert werden.
  • Beim Kriegsschiffbeispiel sollte auf alle Fälle noch die Lösung in die Grafik eingezeichnet werden.
  • Die Animation steht im falschen Abschnitt und, soweit ich sehe, wird nirgends erklärt, was   bedeuten soll. --91.13.195.194 13:39, 6. Jun. 2009 (CEST)

Nach nochmaligem Durchlesen habe ich meine Meinung leider ändern müssen. Weitere Gründe:

  • Es fehlt eine korrekte Definition des allgemeinen Problems: Die Formel   ist nur verständlich, wenn man schon weiß, was gemacht wird. Es müsste doch deutlich werden, dass die   für die gegebenen  -Werte aufsummiert werden. Und dass   der Vektor mit Komponenten   und dass die   die verschiedenen Messwerte sein sollen, muss man an dieser Stelle auch erahnen.
  • Es fehlt, wie oben schon angedeutet, der allgemeine lineare Fall mit Modellfunktionen der Gestalt  . In diesem Zusammenhang sollten auch wichtige Spezialfälle wie Ausgleichung durch Fourierpolynome oder Splines erwähnt.
  • Durch die ausgelagerte Stochastik hängen die gelegentlich eingestreuten Bemerkungen über die Verteilung der Messfehler völlig in der Luft. --91.13.228.1 10:47, 7. Jun. 2009 (CEST)
Danke, das sind sehr nützliche Hinweise, ich habe einiges direkt umgesetzt. Die Notation ist bei diesem Artikel ein echtes Problem und uns ist damals nichts wirklich besseres eingefallen. Ich werde nochmal darüber nachdenken, konkrete Hinweise wären hier hilfreich. In den Büchern die ich so rumliegen habe, mogeln sich die Autoren um das Problem halt irgendwie rum. --P. Birken 20:02, 7. Jun. 2009 (CEST)
Zur Notation: Im Artikel sollte es eine einheitliche Bezeichung für Modellfunktionen geben, die man nicht mit den Messwerten verwechseln kann. Warum nicht einfach   (oder meinetwegen  )? Noch besser würde ich allerdings   finden, wie im englischen Artikel. Das würde auch besser zu Regressionsanalyse passen, aber dann müsste man hier alle t in x und alle x in   umbenennen. --91.13.169.93 18:30, 8. Jun. 2009 (CEST)
  • Ich habe noch folgenden Anmerkung: Man sollte im zweidimensionalen Fall der linearen Modellfunktion sagen, dass die Frage der Minimierung dadurch gelöst wird, dass man annimmt, dass die Gleichung   deshalb die beste Lösung ist, weil man davon ausgeht, dass   und   auf der Geraden liegen. Sonst bleibt die Frage, warum diese und nicht eine parallele Gerade die beste Schätzung ist. Ich bin übrigens auch im ersten Moment darüber gestolpert, dass die :  nicht die Variablen, sondern die Parameter bezeichnen. Lutz Hartmann 09:54, 9. Jun. 2009 (CEST)

Was mir aufgefallen ist:

  • Schon in der Einleitung wird von "Kurve" und "Punkt"wolke gesprochen. Die Methode kann jedoch allgemeiner genutzt werden, z.B. um aus Richtungs- und Streckenmessungen (<> Punktwolke) Koordinaten (<> Kurve) zu schätzen.
  • Die Begriffe "Überbestimmung" und "Redundanz" fehlen hier gänzlich (indirekt kann man das zwar unter Ausgleichungsrechnung nachlesen), dabei wird erst durch die Redundanz an Meßwerten die Methode erforderlich. "Überbestimmung" wird nur einmal unter Multikollinearität genannt.
  • Für ein nichtlineares Beispiel würde sich ein Vermessungsbeispiel vielleicht eignen, da Gauß die Methode ja auch sehr früh hierfür verwendet hat.
  • Betrachtungen zur Gewichtung von Beobachtungen fehlen ganz (außer zur Unterdrückung von Ausreißern). Durch eine Gewichtsmatrix für die Beobachtungen können sowohl unterschiedliche Varianzen als auch Korrelationen der Beobachtungen berücksichtigt werden. Außerdem lassen sich aus der Inversen der Normalgleichungsmatrix Varianzen und Kovarianzen der Schätzwerte ableiten.
  • Die Methode kann man auch mit Regewichtung (abhängig von den Residuen im vorherigen Schritt) verwenden. Mit einer bestimmten Regewichtung erhält man z.B. dasselbe Ergebnis wie bei einer L1-Norm-Schätzung.
  • Auf einen möglichen Rangdefekt der Normalgleichungsmatrix und dessen Behandlung wird nicht eingegangen.
  • Als Literatur sind 4 Werke aus dem Wirtschaftslehre angegeben. Ist sie vielleicht überrepräsentiert?
  • Einzelne Formulierungen:
    • "Sind diese Kurven ... parameterabhängig, so bestimmt die Methode der kleinsten Quadrate ...": was im anderen Fall?
    • Das Verfahren: "Man interessiert sich für eine abhängige Variable y": Eigentlich interessiert man sich doch für die Parameter. Die gemessenen/beobachteten y-Werte dienen dazu, die unbekannten Parameter zu bestimmen oder die Modellfunktion zu prüfen, sind also nur Mittel zum Zweck.
    • "Außerdem sollten die Messfehler normalverteilt sein, was zum einen wahrscheinlichkeitstheoretische Vorteile hat und zum anderen garantiert, dass Ausreißer in y so gut wie ausgeschlossen sind." unglücklich formuliert?
    • "Der einfachste lineare Ansatz ist ym=x0+x1*tm." Der einfachste Fall ist der Mittelwert. Es läßt sich zeigen, daß die L2-Norm-Schätzung in diesem einfachen Fall gerade zum Mittelwert führt, so daß man sie als Verallgemeinerung des Mittelwertes ansehen kann.
    • "es werden etwa 92 Prozent der Information in Breite mit Hilfe des Merkmals Länge erklärt": woher kommt der Wert?
    • Mehrere Variablen: das Beispiel ist kein allgemeiner Fall, da eine Spalte der Matrix A nur mit Einsen besetzt ist.
    • "Diese motivierte auch den Ausdruck der Pseudoinversen" ??
    • "[Ausreißer] verursachen numerische Probleme, ebenso wie Multikollinearität." Ausreißer verursachen in erster Linie Verzerrungen der Schätzwerte, weniger (wenn überhaupt) numerische Probleme.
    • "Als Ausreißer sind Datenwerte definiert, die untypisch weit von der Masse der Daten entfernt sind": Manchmal (auch durch diese Definition) wird der Eindruck erweckt, daß alle Meßwerte, die zu weit von der Modellfunktion abweichen (große Residuen), schädlich sind. Tatsächlich sind jedoch auch die großen Abweichungen wichtig, um z.B. Varianzen korrekt zu schätzen.
    • "Kreuzproduktmatrix": Begriff?

Meiner Meinung nach kann also noch einiges verbessert werden. Bei Interesse kann ich mich an einer Überarbeitung beteiligen. 80.146.55.150 11:36, 11. Jun. 2009 (CEST)

Klar, da der Antragsteller den Artikel einfach so zur Wiederwahl gestellt hat, ohne vorher die Möglichkeit zu geben, den Artikel nochmal zu überarbeiten, bin ich jetzt zeitlich nicht in der Lage, einfach zu springen, weil er "Hopp" ruft. Ein Abschnitt Varianten, bei dem auf weighted Least Squares und Least Squares mit Nebenbedingungen eingegangen würde, wäre auf jedenfall sinnvoll. --P. Birken 15:36, 11. Jun. 2009 (CEST)

Kontra Für einen exzellenten enthält der Artikel mir zu viele Unstimmigkeiten und Schwachpunkte. 1.) Das Ergebnis eines Fits sind Parameter, Fehlerabschätzungen für die Parameter sowie ein statistisches Maß für die Qualität der Anpassung. Im Artikel ist nur der erste Punkt "Parameter" adressiert, der Rest fehlt. 2.) Damit verwandt: Es fehlen Informationen zur Gewichtung von Fehlern (z.B. Chi-Quadrat-Verteilung) 3.) Der eine Satz zum theoretischen Hintergrund (Stichwort "Maximal-Likelihood-Schätzer") ist etwas mager. 4.) Die Inhalte der Tabellen T1 und T2 werden nur unzureichend erläutert. Was ist "Signifikanz"? Warum ist die Signifikanz in den Tabellen fast immer 0? Was ist "T-Prüfgröße"? 5.) Zu der Abgrenzung zur Regressionsanalyse könnte auch etwas erwähnt werden (auf der Diskussionsseite gab es dazu kilobyteweise Diskussionen). -- Belsazar 14:39, 11. Jun. 2009 (CEST)

Siehe den allerersten Satz im Artikel: "Dieser Artikel behandelt die numerischen Aspekte dieser Methode. Für eine stochastische Sichtweise siehe Regressionsanalyse." --P. Birken 15:36, 11. Jun. 2009 (CEST)
Ist mir schon klar. Aus dem Satz geht aber nur hervor, dass es eine Unterscheidung gibt, aber nicht, worin diese besteht. Nachdem so lange über das Thema diskutiert wurde, hätte ich der Abgrenzung etwas mehr als den einen Satz spendiert. Aber um Missverständnisse zu vermeiden: Das alleine wäre für mich natürlich kein Contra-Grund.-- Belsazar 15:56, 11. Jun. 2009 (CEST)
Es sind doch nun eine Reihe konkreter sachlicher Punkte genannt. Kann man nicht das eine oder andere innerhalb der verbleibenden 8 Tage abarbeiten? Einige dieser Punkte scheinen mir gar nicht so schwierig und damit könnte man vielleicht auch schon das eine oder andere negative Votum einkassieren. Aber überhaupt eine Reaktion im Artikel selbst erscheint mir unumgänglich. --Lutz Hartmann 00:00, 12. Jun. 2009 (CEST)
"Überhaupt eine Reaktion" finde ich in Anbetracht dessen, was sich seit Listung hier getan hat, ziemlich ungerechtfertigt. Tatsache ist: G meinte aus Trotz, den Artikel hier einstellen zu müssen und andere machen mit. Ich bin durchaus gewillt, den Artikel zu verbessern und habe das ja auch shcon gemacht nur: Nur weil G Hott schreit, werde ich mich nicht mehr stressen als jetzt schon. Alleine die Notation zu überdenken und zu verbessern würde mich über ne Stunde konzentrierten Arbeitens kosten. In ein paar Wochen mache ich das Thema eh in meiner Vorlesung, jetzt sind aber Eigenwerte dran. Mein Vorschlag: Ein Review draus machen, die Aktion hier finde ich ziemlich Panne. --P. Birken 19:57, 12. Jun. 2009 (CEST)
Wäre für mich auch ok. Wie votiert man dafür?-- Belsazar 20:42, 12. Jun. 2009 (CEST)
Eine Überarbeitung ohne den Zeitdruck dieser KEA-Diskussion bringt mehr, als jetzt hier und da Kleinigkeiten anzupassen. Da eine Überarbeitung angekündigt wurde und vor solchen Abwahlen zuerst versucht werden sollte, den Artikel zu verbessern, plädiere ich auch für eine Beendigung/Zurückstellung dieser Abwahl, bis der Artikel überarbeitet ist. 80.146.114.27 15:00, 13. Jun. 2009 (CEST)
Habe ich richtig gelesen, dass der Hauptautor vorschlägt, die Abwahldiskussion abzubrechen, und dies ausdrücklich vor dem Hintergrund, dass der Abwahlantrag ("Aktion Panne") Erfolg zu haben droht ? Ich bin angesichts soviel Dreistigkeit etwas überrascht. Wenn das Schule macht, brauchen wir keine Abwahldiskussionen mehr. --Zipferlak 17:49, 13. Jun. 2009 (CEST)
Vor dem Wiederwahlantrag sind IMHO nicht alle verfügbaren Möglichkeiten ausgeschöpft worden, den Artikel ohne Aberkennung des Exzellenz-Status zu verbessern. G hat auf der Disussionsseite -wie auch hier beim Abwahlantrag- nur sehr pauschal, d.h. ohne konkrete Nennung von konkreten Schwachpunkten, moniert, dass die Einleitung unverständlich sei. Stattdessen bestand er darauf, dass seine eigene Alternativversion der Einleitung besser sei. Nachdem sich dann niemand seiner Meinung anschloss, stellte er den Artikel hier zur Wiederwahl ein. Hier hätten 1.) zunächst die Kritikpunkte konkret genannt werden müssen, und 2.) die Möglichkeit eines Reviews in Erwägung gezogen werden sollen. Insofern kann ich die Reaktion von P. Birken nachvollziehen.-- Belsazar 19:06, 13. Jun. 2009 (CEST)
Zum Glück haben wir ja Richtlinien zu Abwahldiskussionen, stehen direkt im Kopf über dieser Diskussion und die verlangen zu Recht, dass man solche Aktionen wir hier sein lässt. Extra für Dich, weil Du ja diesen großen Skandal, dass ich es gewagt habe, mich darüber zu beschweren, zum Glück für alle aufgedeckt hast, zitiere ich das nochmal: "Bevor du einen Artikel hier zur Wiederwahl vorschlägst, solltest du dessen Mängel auf der Artikeldiskussionsseite oder bei fehlender Betreuung in einem Fachportal ansprechen, sodass eine Chance zur Verbesserung besteht. Sofern es Hauptautoren gibt, die sich für den Artikel verantwortlich fühlen, kann auch ein vorheriges Review sinnvoll sein." --P. Birken 00:52, 20. Jun. 2009 (CEST)

Von mir ein Pro. Nu auch mal mein Senft (fränkische Schreibweise):

  • Das Gute für das Pro brauche ich wohl hier nicht auszuführen.
  • Die Trennung in die numerische Version (Methode der kleinsten Quadrate) und eine stochastische Version (Regressionsanalyse) war motiviert durch die Erkenntnis, dass Methode der kleinsten Quadrate häufig angewendet wird, ohne dass sich um die stochastischen Bedingungen gekümmert wird. Allerdings vermute ich mal, dass wahrscheinlichkeitstheoretische Folgerungen nur in dem Fall machbar sind, in dem von linearen oder linearisierten Modellen gesprochen wird. Bei iterativen Anpassungen wird das nicht mehr möglich sein. Anderseits kommt erstere "klassische" Variante ohne ein bisschen Stochastik nicht aus. Das ist die Zwickmühle. Man könnte nun in diesem Artikel mal, so weit möglich, die Stochastik rauswerfen und die entsprechenden Sachverhalte "unstochastisch" erklären.
  • Die Verwendung der Symbole x und t irritiert mich als Nichtphysiker auch immer etwas, ist aber sicher auch nicht schlechter als b und x.
  • Die Verwendung von kleinsten Quadraten dürfte zu einem großen Teil darin begründet liegen, dass sich beim Ableiten lineare Funktionen für die optimale Lösung ergeben.
  • Die Einleitung ist IMHO ok. Wenig belastbare Studenten kriegen so oder so Asthmaanfälle.
  • Auch die bemängelten Gleichungen im Text sind im Detail verbesserungsfähig.

Ich frage mich bloß, ob ich da noch Arbeit investieren soll, denn es ist ja offensichtlich erklärtes Ziel einiger Querulanten, den Artikel zu kippen. -- Philipendula 11:26, 18. Jun. 2009 (CEST)

Es hat sich ja eine Menge Text angesammelt seit das letzte Mal hierher geschaut habe, aber Beiträge von Querulanten kann ich hier beim besten Willen nicht finden. Eigentlich hätte ich ja dieses Wochenende etwas Zeit und Lust gehabt, einige der von mir angemerkten Schwachpunkte auszubessern zu helfen (ich bin die 91.13... IP), aber wenn euer Artikel trotz der inzwischen grob überschlagenen 30 konkreten Verbesserungsvorschläge so toll exzellent ist, will ich da als nicht angemeldeter Benutzer natürlich nicht reinpfuschen.--91.13.252.168 22:41, 19. Jun. 2009 (CEST)
Nun, zum einen war schon das Einstellen des Artikels hier eine reine Retourkutsche, zum anderen heißt es nicht automatisch, dass die 30 Verbesserungsvorschläge alle sinnvoll sind. Hier redet ja jeder mit. Außerdem läuft eh morgen die Kandidatur ab. Da müsstest du dich schon ranhalten. -- Philipendula 23:25, 19. Jun. 2009 (CEST)
Ranhalten? Wusste gar nicht, dass es ab übermorgen nicht mehr möglich ist, Fehler im Artikel auszubessern. Er wird doch hoffentlich nicht gleich gelöscht werden ;-) Übrigens, wenn ich Beiträge Verbesserungsvorschläge nenne, heißt das, dass das Umsetzen dieser Vorschläge meiner Meinung nach eine Verbesserung des Artikels bringen würden. --91.13.236.108 23:52, 19. Jun. 2009 (CEST)
Nu, gelöscht wird er wohl nicht werden. Verbesserung schadet ja nie. -- Philipendula 00:16, 20. Jun. 2009 (CEST)
Naja, da über die 30 Verbesserungsvorschläge kein Dialog in Gang kommt, wird die Welt wohl nie erfahren, ob sie sinnvoll waren. Und dass ich hier mitgeredet habe, bitte ich zu entschuldigen. Ich wusste nicht, dass dies nicht gewollt ist. --Zipferlak 23:34, 19. Jun. 2009 (CEST)
Ein Großteil der Verbesserungsvorschläge der beiden IPs ist sinnvoll und ein Großteil dessen wurde auch schon umgesetzt. Und wenn man die Muße hätte, könnte man darüber auch Dialoge führen, ich wusste halt nicht, dass die Autoren die Diskussionsteilnehmer auch noch bespaßen müssen? --P. Birken 00:52, 20. Jun. 2009 (CEST)
6 Pro, 4 Contra, die Contras sind gut begründet, daher abgewählt AF666 10:55, 20. Jun. 2009 (CEST)
Hier wurde gar nichts gemacht. Die Formalien für einen Wiederwahlantrag wurden nicht eingehalten. Das klingt nach Korinthenkacken, Tatsache ist aber, dass bei den Autoren der Wille da war und ist, den Artikel zu verbessern, aber ihnen nicht die Zeit gegeben wurde, das zu tun. Und genau das wird vor einem Wiederwahlantrag gefordert. Es ist einfach superdaneben, das zu ignorieren. --P. Birken 11:58, 20. Jun. 2009 (CEST) P.S. Das ist auch die Meinung zweier Contrastimmer, wie man ja leicht nachlesen kann.
Stimmt. Eigentlich bin ich ja für sowas nicht zu haben, aber ich würde eine eine zweite Meinung einholen. Wenn ich ausgewertet hätte, dann hätte ich wahrscheinlich sogar für exzellent ausgewertet. Es geht halt nicht immer nur ums Auszählen, mE überwiegen die Pro-Argumente klar. --MEWRS Zigarre gefällig? Feuer? 14:26, 20. Jun. 2009 (CEST)
Auf Wikipedia:Kandidaten für exzellente Artikel/Hinweise für die Auswertung#Bei_Abwahlen heißt es: „Ein Wiederwahlkandidat wird abgewählt, wenn es mindestens drei Contra-Stimmen gibt und die Anzahl der Pro-Stimmen weniger als doppelt so groß ist wie die Anzahl der Contra-Stimmen“ Und demnach ist der Artikel abgewählt worden
Es gibt keine drei Contrastimmer, da zwei der Contrastimmer explizit gesagt haben, dass sie eine Abwahl nicht unterstützen, sondern ein Review vorziehen. --P. Birken 19:42, 20. Jun. 2009 (CEST)
Hast Du absichtlich falsch gezählt ? Es gibt vier Contras. Ich bin angesichts des hier gebotenen Schauspiels ziemlich sauer. Du kannst Dir doch den Exzellenzstatus nicht ertrotzen. Mach Dein Review und stell den Artikel dann erneut in die Kandidatur. Etwas anderes kommt angesichts der Diskussion nicht ernsthaft in Betracht. --Zipferlak 21:37, 21. Jun. 2009 (CEST)
Du, sauer bin ich schon lange bei der Hartnäckigkeit mit der Du hier versuchst, anderen ans Bein zu pinkeln. Die Diskussion wurde durch Orci beendet, es wäre schön wenn Du das respektieren würdest. --P. Birken 21:50, 21. Jun. 2009 (CEST)
Orci ist weder befugt, als "Ober-Auswerter" zu fungieren, noch, die Regeln ausser Kraft zu setzen. --Zipferlak 21:54, 21. Jun. 2009 (CEST)
Ich sehe es so, dass dies eine strittige Auswertung war, bei der es mehrere Auswertungen gab (was extra so vorgesehen ist). AF666 hat als erster mit "nicht exzellent" gewertet, MEWRS hat sich als Auswerter Pro exzellent ausgesprochen (damit steht es 1:1) und ich habe es als dritter eben Pro exzellenz gewertet, sehe da kein Problem. --Orci Disk 22:01, 21. Jun. 2009 (CEST)
MEWRS hat sich nicht pro exzellent ausgesprochen (er schrieb lediglich, dass er "wahrscheinlich" für exzellent ausgewertet hätte), sondern vorgeschlagen, eine zweite Meinung einzuholen. Was nicht heissen kann, dass die zweite Meinung (also Deine, Orci) die erste Meinung sticht und die Diskussion damit beendet ist. --Zipferlak 22:09, 21. Jun. 2009 (CEST)
Ich hatte das so interpretiert (was nicht unbedingt richtig sein muss, ich gebe zu das ist nicht ganz eindeutig). Ich kann ihn aber natürlich auch fragen, ob er das als "offizielle" Meinung sieht und ob er (wenn das nur eine allgemeine Bemerkung war) nochmal endgültig und offiziell als dritter Auswerter fungieren möchte und das entgültige "Urteil" fällen möchte. --Orci Disk 22:18, 21. Jun. 2009 (CEST)
Nachdem sich in der Exzellenzkandidatur schon zehn Benutzer ihren Kopf zerbrochen haben, finde ich es nicht so geschickt, wenn jetzt die Schlacht der Auswerter kommt. Eine Auswertung zu kippen, sollte eigentlich nur in Betracht kommen, wenn sie nicht vertretbar war. Hältst Du die Auswertung von AF666 nicht für nachvollziehbar ? Dem Artikel schadet es nichts, wenn er nochmal durch die Kandidaturmühle muss, ganz im Gegenteil. --Zipferlak 22:27, 21. Jun. 2009 (CEST)
Naja, was heißt "nicht vertretbar"? Für Dich als Contra-Stimmer ist die Auswertung durch AF666 natürlich i.O., für den Hauptautoren offenbar nicht (sonst hätte er sich nicht zunächst hier beschwert und dann eine weitere Meinung auf der KEA-Disk angefordert). Meine Meinung ist, dass jeder Beteiligte das Recht haben sollte, durch eine zweite oder dritte Meinung eine Auswertung überprüfen lassen zu dürfen. Das erspart viele Willkür-Vorwürfe, böses Blut o.ä.. Von einer "Schlacht der Auswerter" kann man da imo schlecht sprechen, ist eben so etwas die die Lösch- oder Sperrprüfung eben für Bapperl, bei der eine unzufriedene Partei eine neutrale weitere Stimme anfordern kann,die dann die Auswertung bestätig oder eben widerlegt. Wie ich zu meiner Meinung gekommen bin, steht unten, ich bin aus den vorhandenen Stimmen, Begründungen usw. eben zu einem anderem Ergebnis als AF666 gekommen. --Orci Disk 22:46, 21. Jun. 2009 (CEST)
  • Ich habe in der Diskussion gesagt, dass ich den Artikel für exzellent halte. Ich weiß nicht wie meine Beiträge gewertet worden sind. In jedem Fall bin ich der Meinung, dass die Bitte von P. Birken, ihm Zeit für die Nacharbeit zu geben, maßgeblich sein sollte. Die Auswertung ist so im Rahmen eines vorhandenen Spielraums ziemlich daneben. --Lutz Hartmann 22:14, 20. Jun. 2009 (CEST)
Meine dritte Meinung zur Auswertung auch noch hierher kopiert:
Hm, ist nicht einfach zu entscheiden. Gegen Exzellent spricht die reine Zahlenauswertung (nur die expliziten Pro- und Contra-Stimmen gezählt) und dass es vorwiegend inhaltliche Argmente gegen einen Exzellent-Status sind. Für Exzellent spricht, dass der Hauptautor sehr aktiv bei der Beseitigung der angesprochenen inhaltlichen Schwächen ist und nur mehr Zeit braucht, das fehlende Review und dass auch einige Contra- und Neutralstimmen für die Beibehaltung des Exzellent-Status sind (unter der Bedingung, dass die beanstandeten Mängel beseitigt werden). Letzteres entwertet natürlich die reine Zahlenauswertung. Im gesamten würde ich sagen, dass es für mich knapp pro Exzellent-Status ausgeht unter der Bedingung, dass die angesprochenen inhaltlichen Schwächen in angemesserer Zeit beseitigt werden. Davon gehe ich angesichts der Diskussion aber aus. Viele Grüße --Orci Disk 23:26, 20. Jun. 2009 (CEST)
Danke, in den nächsten Wochen wird sich noch so einiges am Artikel tun und so fühlt man sich doch auch gleich motivierter. --P. Birken 16:16, 21. Jun. 2009 (CEST)
Ich stimme zwar P. Birken zu, möchte mich aber nicht definitiv festlegen, ob ich den Artikel jetzt als exzellent einstufen würde oder nicht. Mir ging es auch weniger um die Qualität desselben, als dass ich der Meinung war, dass man die genannten Mängel in absehbarer Zeit beheben könnte. Ob ihr den Artikel jetzt im Exzellent-Status belasst oder erst ein Review laufen lasst und ihn dann nochmal zur Wahl stellt, ist für mich nicht von besonderer Bedeutung. --MEWRS Zigarre gefällig? Feuer? 22:38, 21. Jun. 2009 (CEST)
Wenn ich mir nach der Lektüre der Versionsgeschichte noch ein P.S. erlauben darf: AF666 hat als nicht exzellent ausgewertet. Jetzt lasst doch erstmal die Version ohne Bapperl, sonst kopmmt ein besonders lieber Admin aud die Idee 1. euch und 2. den Artikel zu sperren. --MEWRS Zigarre gefällig? Feuer? 22:44, 21. Jun. 2009 (CEST)

(BK)Wie schon oben erwähnt, gemäß den Regeln ist der Artikel abgewählt. Bei der Auswertung aller Stimmen kommt man zu dem Schluss, dass die Argumente auf beiden Seiten ihre Berechtigung haben, so dass alle Stimmen zu zählen sind.
Auf Grund der bisherigen Diskussion hier dachte ich, Benutzer:G hätte die Abwahl einfach ins Blaue gestartet, doch er hat ja bereits letztes Jahr (7. September 2008) den Grund für seine Abwahlbegründung vorgebracht. Er sieht dabei nichts umgesetzt und stellt daher den Abwahlantrag. Hier nun ein Review zu fordern, weil der Antragsteller dem Artikel im Vorfeld kein Review einräumte, finde ich nicht richtig. Es wurden zahlreiche Argumente vorgebracht, die gegen eine Exzellenz des Artikels sprechen und die auch niemand anzweifelt. Also ist der Artikel momentan nicht exzellent und sollte daher aus der Vorbildliste herausgenommen werden, zumal der Hauptautor von Wochen spricht, die eine Überarbeitung dauern wird. Um mal auf den von mir eigentlich nicht geliebten Begriff Glaskugel zurückzugreifen: Wer garantiert, dass der Artikel wirklich in ein paar Wochen auf exzellentem Stand sein wird? Was ist, wenn dem Hauptautor etwas dazwischen kommt und sich keiner um den Artikel kümmert? Dann gibt es einen abgewählten Artikel, der trotzdem exzellent ist. Folgt man dem Beispiel hier, kann sich jede gescheiterte Exzellenz-Kandidatur darauf berufen, in nächster Zeit eine exzellente Version zu verfassen und sich das "grüne Bapperl" verpassen.
Fazit: Der Artikel ist momentan nicht exzellent und somit muss ihm dieser Status aberkannt werden. --Kauk0r 22:45, 21. Jun. 2009 (CEST)
Nachtrag: Ich finde es auch nicht in Ordnung, dass die Auswertung von AF666 nach nur einer anderen Meinung rückgängig gemacht wird, das ist genau dieselbe Willkür, die der ersten Auswertung unterstellt wird. --Kauk0r 22:52, 21. Jun. 2009 (CEST)

Wie gesagt, ich hatte MEWRS' Bemerkung so interpretiert, dass dies schon die 2. Auswertung war und meine als dritte gesehen. Da er sich aber offenbar nicht entscheiden möchte und Du ihn als nun endgültig dritter als "nicht exzellent" wertest, habe ich nichts dagegen, dass Du das Bapperl entfernst. Die weitere Vorgehensweise sollte also so sein, dass der Artikel nun zunächst überarbeitet wird (ggf. mit Review) und dann erneut auf KEA antritt. --Orci Disk 23:05, 21. Jun. 2009 (CEST)
Es ist genau diese Art von Vorwürfen, die das Arbeiten hier so unangenehm macht. Aber mal konkret: Die Diskussion ist ein Musterbeispiel, warum das reine Stimmen zählen nix taugt und warum die Auswertung durch Benutzer:AF666 in allen Fällen wo man nicht einfach die Pro und Kontra-Vorlage zählen kann, seit Jahren jedesmal zu Streit führt. Nehmen wir mal Benutzer:G. Sein einziger Kritikpunkt am Artikel ist, dass die Einleitung Mist ist. Diese Einschätzung konnte sich auf der Diskussionsseite nicht durchsetzen und sie wurde ihm in dieser Diskussion von zahlreichen Benutzern um die Ohren gehauen, aber ohne dass diese eine Vorlage hingepackt hätten. Ich weiß trotzdem nicht, wie man das, wenn man die Aussage von G als Contra wertet, anders werten will als gegen die Abwahl. Und mal zu Deinem Analogon: Der wesentliche Unterschied von einer Wiederwahl zu einer normalen Kandidatur ist, dass die Kandidatur auf Wunsch der Hauptautoren kommt und das bedeutet insbesondere zu einem Zeitpunkt, wo sie im Thema drinstecken und Zeit haben, sich drum zu kümmern. Das ist bei einer Wiederwahl nicht der Fall und deswegen gibt es Regeln für Wiederwahlen, die hier nicht eingehalten wurden und daraus den Hauptautoren einen Strick zu drehen, konterkarikiert den Sinn dieser ganzen Veranstaltung, als Motivation für Autoren zu dienen, exzellente Arbeit zu leisten. Wenn die Hauptautoren sich nicht um den Artikel kümmern? Ja, dann stell halt nen Wiederwahlantrag, so ist das Problem? --P. Birken 23:15, 21. Jun. 2009 (CEST)
Ja gut, dann werten wir Benutzer:G nicht, dann dürfen die Stimmen von Benutzer:Trg und Benutzer:Mgehrmann auch nicht gewertet werden, denn diese sagen sie hätten keine Ahnung von der Materie. In diesem Fall sind ihr Stimmen gegen fundierte Kontras wertlos. Dann hätten wir 4 Pro und 3 Kontra, bleibt also dasselbe Ergebnis.
Ich gebe zu mein Beispiel war überspitzt. Trotzdem: Der Antrag war korrekt. Das er sich als falsch herausstellte ist nicht relevant, da weitere Mängel aufgezeigt wurden. Diese waren im Vorfeld nicht abzusehen, also konnte auch kein Review durchgeführt werden. Zudem ist ein Review keine Pflicht, bevor ein Abwahlantrag gestellt wird, es wäre lediglich sinnvoll.
In diesem Fall sehe ich es eher als deine Aufgabe, wieder eine KEA zu starten, wenn der Artikel überarbeitet ist, denn das es meine ist, hier dafür zu sorgen, dass die Verbesserungen durchgeführt werden. --Kauk0r 23:28, 21. Jun. 2009 (CEST)
Dann hätte G, nachdem er auf der Diskussionsseite nicht Recht bekommen hat, damit Erfolg, dass er es trotzig den Autoren zeigen wollte. Wenn er mit so einer Aktion durchkommt, dann wird Trollerei belohnt. Ein Review hatte ich ja schon länger angeregt, was dann von Zipferlak mit höhnischen Kommentaren quittiert wurde. Wenns nur darum geht, andere zu ärgern, dann können wir uns das auch gerne direkt sparen, dann entferne das Bapperl, nur ist mir die Sache dann zu blöd, dann überarbeite ich den Artikel erst gar nicht und eine Wiederwahl wird es dann garantiert nicht geben. So eine Aktion gebe ich mir garantiert dann nicht nochmal. --P. Birken 23:37, 21. Jun. 2009 (CEST)
Wieso denn? Wäre der Artikel eindeutig exzellent, wäre die Abwahl gescheitert. Da sie dies jedoch nicht ist zeigt, dass der Artikel momentan nicht exzellent ist. Ich finde es nicht gut, dass du jetzt damit drohst, dem Artikel den Rücken zuzuwenden, wenn er nicht exzellent bleibt. Ob du ihn jetzt mit oder ohne Bapperl überarbeitest, spielt doch keine Rolle. Wenn er überarbeitet ist, dann spricht doch nichts gegen eine Exzellent-Status, was die Diskussion unstrittig gezeigt hat. Also wirst du damit (wohl) keine solche Aktion mehr erleben. --Kauk0r 23:46, 21. Jun. 2009 (CEST)
Der Artikel wurde 2004 als exzellent gewählt, seitdem sind die Ansprüche unglaublich stark gestiegen. Deswegen ist es nicht verwunderlich, dass der Artikel im Rahmen einer Wiederwahl überarbeitet werden muss. Und genau deswegen macht man so eine Wiederwahl nicht einfach so, sondern in Absprache mit den Hauptautoren. Es gibt keinen einzigen exzellenten Artikel aus dieser Zeit, bei dem die Diskussion nicht genauso aussehen würde. Schau Dir mal Relativitätstheorie an. Wenn ein Exzellenz-Bapperl für mich bedeutet, dass ich auf der Diskussionsseite erpressbar werde, indem jemand, dem ein winziger Teilaspekt des Artikels nicht passt, so eine Diskussion lostritt, in der dann Kritik kommt, auf die ich aus Zeitgründen gar nicht eingehen kann, gepaart mit Seitenhieben durch Typen wie Zipferlak, dann erwarte ich vom Prozess selbst Rückendeckung. Wenn das aber erwünscht ist, dass solche Aktionen kommen, dann verzichte ich da ganz einfach lieber drauf. Die Bapperl sind etwas, was mich motiviert. Wenn sie den gegenteiligen Effekt haben, dann brauche ich sie nicht, die Artikel werden dadurch nicht schlechter. --P. Birken 23:57, 21. Jun. 2009 (CEST)
Du bist doch nicht erpressbar (genausowenig wie ich es bin, weil ich den Artikel als "nicht exzellent" auswerten will), ein exzellenter Artikel wird nicht abgewählt. Der Weg war nicht der richtige, doch sehe es doch mal so: Der Zweck heiligt die Mittel. Exzellente Artikel sollten es auch sein, ich denke da stimmen wir überein. Wenn dir aber schon von vorneherein klar war, dass der Artikel nicht mehr den Anforderungen entspricht, warum hast du ihn dann nicht selbst in den letzten Monaten/ Jahren mal ins Review gestellt? Ich bitte dich um deine ehrliche Meinung: Hättest du auch ohne Abwahl-Diskussion den Artikel in den nächsten Wochen grundlegend überarbeitet? Wenn nicht, dann hatte die Abwahl etwas Gutes, nämlich das der Artikel vorankommt.
Ein anderer Punkt: Schau mal hier...da geht es auch nicht seinen geregelten Weg, doch auf Grund größerer Mängel, wird es hingenommen. So schlimm steht es um den Artikel hier nicht, aber es zeigt, dass die Art und Weise der Abwahl nicht ganz abwegig ist. --Kauk0r 00:31, 22. Jun. 2009 (CEST)
Nein, der Zweck heiligt nicht die Mittel. Wenn hier Autoren harte Arbeit reinstecken und dafür andere Dinge vernachlässigen, um sich um exzellente Artikel zu kümmern, dann hat dem ein gewisser Respekt vor dieser Arbeit entgegenzustehen. Faktisch geht alles was ich hier tue, auf Kosten meiner wissenschaftlichen Karriere. Wenn das dann noch auf so eine Weise belohnt werden sollte, dann kann die Konsequenz nur sein, aus dem Verfahren auszusteigen.
Ansonsten stellst Du die falsche Frage: Wenn dieser Artikel oder ein beliebiger anderer aus dieser Liste von 2004 heute kandidieren würde als Neuling, dann würde 80% durchfallen. Und genau deswegen gibt es Regeln für die Wiederwahl, damit das nicht zur Schikane für Autoren ausartet. Wie ich diesen Artikel in der heutigen Version sehe? Lesenswert allemal, von heutigen Exzellenzstandards noch etwas Arbeit weg, deutlich über den Standards von 2006. Ich würde ihm aus diesen Überlegungen raus ein klares Pro für die Wiederwahl geben. Der krasse Unterschied zu Vagina muss Dir doch klar sein: Bei Vagina gibt es nicht nur keine aktiven Hauptautoren, nein, es hat noch nie welche gegeben! --P. Birken 09:15, 22. Jun. 2009 (CEST)
Ja sicher muss man sich die Zeit irgendwo selbst wegnehmen, das ist aber mit allem so, was in der Freizeit gemacht wird. Ob nun WP, Sport, Musikverein oder Sonstiges. Aber tust gerade so, als ob man dir alle Auszeichnungen aufeinmal wegnehmen und nie wieder geben will. Das will ja niemand, keiner bestreitet das Potential des Artikels, aber dazu muss noch an ihm gearbeitet werden (übrigens auch ein häufiges Argument bei Neukandidaten, in die ein Autor genauso sein Herzblut steckt).
Also gut, eine andere Frage: Wann genau ist der Artikel wieder exzellent?
Sicher sind da viele Artikel bei, die nicht mehr den heutigen Standards, so nach und nach werden sie wohl auch alle irgendwie verbessert werden. Ich weiß das du mit Pro stimmen würdest, aber für mich geht es um die Auswertung der Abwahl-Diskussion und die ist für mich erfolgreich. --Kauk0r 12:21, 22. Jun. 2009 (CEST)
Ich muss mich da wiederholen: Wenn das Bapperl für mich bedeutet, dass ich, nachdem ein Benutzer auf der Diskussionsseite nicht Recht bekommen hat, mich mit Arbeit überschütten darf, wann immer er das will und nicht, wann ich dazu überhaupt Zeit habe, dann diskutiere ich in Zukunft lieber ohne Bapperl in meinen Artikeln. Deswegen gibt es die Regeln zu Wiederwahlen, um solche Schikane und Demotivation von Hauptautoren zu verhindern. Wenn Du mal was richtig trolliges machen willst: Stell einfach zu den zehn der hundert ältesten exzellenten Artikel nen Wiederwahlantrag. Einfach so, weil dir irgendein Abschnitt nicht passt. Diese Position wurde in dieser Abwahldiskussion bestätigt: Dem Antragsteller wurde der Antrag sofort von fünf (!) Benutzern um die Ohren gehauen, er war nicht zulässig, so einfach ist das.
Will man das ganze tatsächlich inhaltlich auswerten, dann ist Zipferlak derjenige, der eine echte Abwahldiskussion einläutete und damit den Antrag von G adelte. In dieser dann beginnenden Diskussion (die Stimme von Luha sollte man aber noch mitnehmen), sind alle Stimmen inhaltlicher Natur, es sind drei Contras und vier Pros. Zwei der Contras äußern sich explizit so, dass sie eine Überarbeitung einer Abwahl vorziehen würden, sie ändern also ihr Contravotum, eben weil ihnen das mit dem Abwahlantrag nicht gefällt. Die IP sagt explizit: "Da eine Überarbeitung angekündigt wurde und vor solchen Abwahlen zuerst versucht werden sollte, den Artikel zu verbessern, plädiere ich auch für eine Beendigung/Zurückstellung dieser Abwahl, bis der Artikel überarbeitet ist." Wie man dann noch davon reden kann, dass der Artikel abgewählt sei, ist mir schleierhaft, insbesondere wo ich diese Überarbeitung auch noch explizit anbiete.
Wann der Artikel wieder exzellent ist? Ich interpretiere das mal als: "Wann wird die Überarbeitung stattfinden?" Ich schlage wie gesagt ein ganz normales Review vor, ab Ende dieser Woche mache ich das Thema eh in meiner Vorlesung und muss mich stärker einarbeiten, bis Mitte Juli bin ich damit durch. --P. Birken 20:10, 22. Jun. 2009 (CEST)
Du wirst aber nicht zu unrecht mit Arbeit überschüttet und es zwingt dich auch keiner dazu, die Arbeit zu machen. Doch die Arbeit ist nötig, wie die Diskussion gezeigt hat.
Die Interpretation ist falsch, hier die richtige: Wann ist die Überarbeitung abgeschlossen? Bist du damit in drei Wochen fertig oder gehts da erst los und wie lange dauert es dann noch? --Kauk0r 20:39, 22. Jun. 2009 (CEST)
Das ist eine Sache von maximal vier Wochen. Es sind im wesentlichen noch drei Dinge zu tun, die Notation zu überarbeiten, etwas zu "gewichteten Ansätzen" zu schreiben und den Artikel zu Regressionsanalyse besser abzugrenzen. --P. Birken 22:18, 22. Jun. 2009 (CEST)
Also gut, dann muss man in vier Wochen nochmal schauen, wie weit der Artikel gediehen ist. --Kauk0r 12:10, 23. Jun. 2009 (CEST)

Mir ist AF666 bisher nicht als derjenige in Erscheinung getreten, der sich in mathematischen Themen auskennt. Wie kann so jemand überhaupt eine Auswertung vornehmen, wo es bei KEA um Argumente und deren Gewichtung und nicht um eine reine Stimmauszählung handelt. Und selbst wenn wir das Verhältnis von 6 pro und 4 contra ansetzten und alle Argumente außen vor lassen dann wäre das m.E. für eine Abwahl nicht ausreichend. Bei WP:KEB ist eine Abwahl eines Bildes nur dann möglich, wenn mindestens 2/3 der Gesamtstimmen sich für eine Abwahl aussprechen. – Wladyslaw [Disk.] 10:00, 23. Jun. 2009 (CEST)

Das ist jetzt ja lustig, mir wurde neulich in einer Diskussion um die Auswertung strittiger Kandidaturen gesagt, es geht nicht um Fachwissen sondern rein um die Gewichtung der Argumente und das könnten andere genauso. Nach den Vorgaben ist die Stimmenzahl ausreichend: mindestens drei Contra-Stimmen gibt und die Anzahl der Pro-Stimmen weniger als doppelt so groß ist wie die Anzahl der Contra-Stimmen. Sollte vielleicht geändert werden. --Kauk0r 12:10, 23. Jun. 2009 (CEST)
Und wie soll jemand ohne wenigstens elementare Fachkenntnis (er muss ja nicht mal Fachmann auf dem Gebiet sein) Argumente gewichten können? Selten so einen ausgemachten Quatsch gehört. – Wladyslaw [Disk.] 12:23, 23. Jun. 2009 (CEST)


  • Beim Stellen des Wiederwahlantrages ist anerkanntermaßen etwas falsch gelaufen und zwar zu Ungunsten der Autoren. Das ist ein Grund, das Verfahren abzubrechen. Falls ein Auswerter darauf entscheidet, das nicht zu tun, muss er in seiner Entscheidung darauf eingehen. Insbesondere ist es eindeutig ein falsches Verfahren, in so einem Fall dann lapidar ein paar Stimmen zu auszählen. Erinnerung: "Äußerungen werden als Meinungsbild gewertet, nicht ausgezählt". Es ist daher ein Fehler bei der Auswertung zu erkennen. Eine Revision der Entscheidung ist angebracht, nur gibt es dafür kein Verfahren.
  • Die Entscheidung, wie die Einleitung aussehen soll, ist jedoch eine fachliche Entscheidung; und die ganze Wiederwahlgeschichte ist in meinen Augen nur ein Streit um die richtige Einleitung am falschen Ort (per Wiederwahl/Abwahl sind wohl keine inhaltlichen Konflikte zu klären, im Gegenteil) - den anderen Einwänden wurde ja entsprochen. Anstelle ein wie auch immer geartetes Revisionsverfahren ist ein Review und - für die Autoren - Bearbeitungszeit die einzig mögliche Lösung.
  • Konkret: Die Einleitung ist nicht zu schwer, im Gegenteil, sie ist für meine Begriffe sehr entgegenkommend. Es wird zum Beispiel sehr bildlich "durch eine Datenpunktwolke eine Kurve gelegt, die möglichst nahe an den Datenpunkten verläuft". Über Funktionen und Werte ausschließlich mit der "Kurven"- und "Punkte"-Metapher zu sprechen, wie es in der Einleitung geschieht, ist eigentlich eine simplification terrible, aber da in diesem Fall die Einleitung ergänzend zu formalen Definition ein anschauliches Bild von der ganzen Sache liefert, ist es schon in Ordnung. Schön wäre, die "Kurven" und "Punkte" in der formalen Definition noch mal aufzugreifen, aber für solche Kleinigkeiten ist wie gesagt, das Review das richtige Forum.

Fazit: Die Entscheidung von Benutzer:AF666 wird zurückgenommen, das Wiederwahlverfahren wird abgebrochen und es wird ein Review mit für die Autoren komfortabler Bearbeitungszeit veranstaltet, um einen exzellenten Artikel den wachsenden Ansprüchen anzupassen. --Erzbischof 13:28, 23. Jun. 2009 (CEST)

Der Autor sagt er braucht noch vier Wochen. Das nehme ich jetzt mal als Dead-Line, da schon drei Wochen während der Wiederwahl zur Verfügung standen. Somit wäre man auch im Rahmen der vier bis sechs Wochen Review. Wie oben schon gesagt, nicht ganz glücklich gelaufen, aber eindeutige Missstände aufgedeckt, so dass etwas geschehen muss. --Kauk0r 13:51, 23. Jun. 2009 (CEST)
Ich denke mit der Entscheidung, den Autoren noch vier Wochen zu geben und dann mal zu gucken was passiert, können alle leben. Und ich glaube, wir müssen die Sache dann hier auch nicht weiter vertiefen, aber vielleicht sollte man das Wiederwahlprozedere nochmal auf Wikipedia_Diskussion:Kandidaten_für_exzellente_Artikel thematisieren. --P. Birken 19:22, 23. Jun. 2009 (CEST)

Meine erste Kritik an dem Artikel war schon lange vorm Stellen des Antrags. Da nur meine Änderungen rückgängig gemacht wurden, aber keine Änderung des Artikels von anderer Seite erfolgte habe ich in der Diskussion darauf hingewießen, dass ich ihn zur Abstimmung stellen will und dies 3 Wochen später gemacht. Es ist nicht so, dass ich es den Autoren zeigen wollte. Ich finde den Artikel nicht exzellent. Die meisten anderen finden die Einleitung gut und dann kann sie natürlich so bleiben. Dass der Artikel dann trotzdem abgewählt wurde freut mich nicht, aber wenn die Ansprüche inzwischen gestigen sind ist das auch richtig.-- G 18:20, 23. Jun. 2009 (CEST)

Fitting

"In der mathematischen Statistik nennt man das Verfahren auch Kleinste-Quadrate-Schätzung, während in der Physik die Bezeichnung Fitting verwendet wird." - das stimmt so nicht. Fitting bezeichnet allgemein die Anpassung einer Kurve an eine Punktwolke, unabhängig davon, welches Verfahren zur Ermittlung der Fitkurve verwendet wird. --Zipferlak 10:06, 22. Jun. 2009 (CEST)

Ist es nicht umgekehrt: Wenn von Fitting gesprochen wird, ist implizit die Methode der kleinsten Quadrate gemeint, wenn man anders fittet, erwaehnt man das explizit (etwa Interpolation)? --P. Birken 10:15, 22. Jun. 2009 (CEST)
Leider kann ich nur mit meiner eigenen Erfahrung argumentieren. Demnach entspricht das "Fitting" eher der "Ausgleichungsrechnung" als der "Methode der kleinsten Quadrate". Der englische Artikel en:Curve fitting ist mit seinem Einschluss von Interpolation m.E. unzutreffend, da eigentlich nur überbestimmte Systeme "gefittet" werden, d.h. in der Physik werden aus naheliegenden Gründen mehr Messpunkte erhoben als dies mathematisch erforderlich wäre. --Zipferlak 10:48, 22. Jun. 2009 (CEST)
Ausgleichsrechnung und Methode der kleinsten Quadrate werden in der Regel synonym verwendet, da die Methode der kleinsten Quadrate _das_ Standardverfahren zur Ausgleichsrechnung ist. --P. Birken 10:59, 22. Jun. 2009 (CEST)
Warum gibt es dann zu den beiden Lemmata zwei verschiedene Artikel ? --Zipferlak 11:06, 22. Jun. 2009 (CEST)
Weil die Methode der kleinsten Quadrate das Standardverfahren ist, es aber noch weitere Verfahren gibt, etwa die Minimierung der Summe der Beträge (ohne diese zu quadrieren). --P. Birken 19:54, 22. Jun. 2009 (CEST)
Genau. Wie gesagt, kann ich nur mit meiner Erfahrung argumentieren, die besagt, dass unter "Fitting" jedes Verfahren der Anpassung einer Kurve an eine Punktwolke verstanden wird - nicht nur die Anpassung mit der Methode der kleinsten Quadrate (wenngleich diese auch das Standardverfahren des "Fittings" ist). --Zipferlak 22:41, 22. Jun. 2009 (CEST)
Endlosschleife? --P. Birken 23:09, 22. Jun. 2009 (CEST)

Zurück zum Anfang: Die Behauptung, in der Physik würde man die Methode der kleinsten Quadrate auch als "Fitting" bezeichnen, ist unpräzise, weil mit "Fitting" auch andere Verfahren der Ausgleichsrechnung gemeint sein können. --Zipferlak 23:17, 22. Jun. 2009 (CEST)

Also ich als Physiker muss Zipferlak hier zustimmen: "Fitting" (oder Fitten) kenne ich als alles übergreifenden Begriff, identisch mit der Ausgleichungsrechnung, und die Kleinsten Quadrate sind dann schon ein Spezialfall davon. --PeterFrankfurt 01:48, 23. Jun. 2009 (CEST)
Ja, das wissen alle hier. Ich wiederhole mich dann tatsächlich, wenn das hier nicht anders funktioniert: Wenn man von Fitting spricht, meint man implizit die Methode der kleinsten Quadrate, soweit ich das verstanden habe. Wenn man etwas anderes meint, erwähnt man das explizit. --P. Birken 09:03, 23. Jun. 2009 (CEST)
Habs mal entschärft. Der Begriff Fitting müsste eigentlich auch in anderen Disziplinen bekannt sein. -- Philipendula 09:21, 23. Jun. 2009 (CEST)
Ja, danke, so passt es. --Zipferlak 09:41, 23. Jun. 2009 (CEST)

Symbole

Ist es in deutsche Literatur üblich die Punktenpaare mit (t,y) zu bezeichnen, statt (x,y)? Eine Gerade z.B. würde ich notieren wie: y=α+βx, mit Parametern α und β. Nijdam 20:59, 24. Jun. 2009 (CEST)

Siehe Diskussion oben. --Lutz Hartmann 21:29, 24. Jun. 2009 (CEST)
Habe sie gelesen, aber sie überzeugt nicht. Ich weiss leider nicht was man so in jedes Fachbereich schreibt, aber jedenfalls ist oft die Rede von eine Funktion y=f(x), wobei f zu einer parametrisierte Familie gehört. Das würden die Leser auch besser verstehen. Nijdam 23:57, 24. Jun. 2009 (CEST)
Wenn ich das da oben richtig verstanden habe, wird P. Birken auch das Thema der Bezeichnungen angehen. Lutz Hartmann 07:53, 25. Jun. 2009 (CEST)
Wenn mir auch die Notation x;β vertrauter ist, fände ich es trotzdem überlegenswert, es so zu belassen, wie es ist. Denn dieser Artikel beschreibt nur die numerische Vorgehensweise, wo die Lösung eines Gleichungssystems die "Regressionskoeffizienten" betrifft. Als Unbekannte müssten sie dann als x bezeichnet werden. Man hätte dann auch eine klare Abgrenzung zum statistischen Modell der Regressionsanalyse. -- Philipendula 08:45, 25. Jun. 2009 (CEST)
Ein Problem bei t könnte sein, dass man da unwillkürlich an eine Zeitvariable denkt und dann (vielleicht auch unbewusst) verwirrt wird, wenn plötzlich t mehrdimensional ist. Andererseits ist natürlich x als Unbekannte schon irgendwie ideal. Noch eine Anmerkung: Aus rein numerischer Sicht spielt die Variable t doch so gut wie keine Rolle. Da kann man das Problem als Spezialfall der Minimierung von   mit einer vektorwertigen Funktion F auffassen. Im linearen Fall ist   und wie die Matrix A entstanden ist, durch Einstzen von t in f oder irgendwie anders, ist eigentlich egal. Wahrscheinlich ist das etwas zu abstrakt, um den Artikel von Anfang an so aufzuziehen, aber erwähnen sollte man es in einem Artikel, der die numerische Sichtweise darstellen soll, wohl schon.--91.13.168.79 20:23, 25. Jun. 2009 (CEST)
Also ich würde x für die unbekannten Parameter beibehalten. Überdenkenswert finde ich die Benennung der Modellfunktion als y_m und der allgemeine Ansatz sollte noch irgendwie rein. Den allgemeinen Fall des Minimierungsproblems habe ich unter Methode_der_kleinsten_Quadrate#Nichtlineare_Modellfunktionen als   formuliert. Dass das Problem diese Form mit einem Konstanten vektorwertigen Anteil hat, spielt in den Lösungsverfahren schon eine wesentliche Rolle. --P. Birken 20:31, 25. Jun. 2009 (CEST)
Na ja, im nichtlinearen Fall ist es wohl nur Geschmacksache, ob man das b mitschleppt. Im Artikel Levenberg-Marquardt-Algorithmus ist z.B. kein b. Im Artikel Gauß-Newton-Verfahren anscheinend schon, aber der macht einen so chaotischen Eindruck, dass ich den gar nicht durchlesen mag.--91.13.210.252 22:36, 25. Jun. 2009 (CEST)
Also ich für meinen Teil verwende gerne Messpunkte (Punktwolke) (x,y) und für die Theorie zusätzlich einen Parametersatz pi. Aber das ist jetzt nicht durch ein Buch autorisiert. --PeterFrankfurt 02:41, 26. Jun. 2009 (CEST)

*wieder links anfang* Das mit dem b als y-Vektor ist wohl wirklich nicht so richtig sexy, weil das die Statistiker wieder mit dem Parametervektor verwechseln. Im Bronstein-Nachfolger werden die Beobachtungswerte im Zusammenhang mit der Methode der kleinsten Quadrate als (x,y)-Paare notiert. Da dieses Buch doch eher allgemein angewendet wird, könnte man vielleicht diese Notation übernehmen. Dort werden die gesuchten Parameter als a bezeichnet, da könnten wir dann b nehmen, dann fühlen sich alle jemals mit diesem Thema Befassten zu Hause, also dann doch   --Philipendula 11:04, 26. Jun. 2009 (CEST)

Gene sagte gerne: Let's take our favourite combination of the three letters A, b and x. Dass dann so zu permutieren und auszutauschen, dass sich gar keiner mehr wiederfindet wäre zwar total lustig, aber vielleicht nicht so leserfreundlich ;-) --P. Birken 22:24, 26. Jun. 2009 (CEST)
Och, was bist du humorlos. Nee, es müsste selbstverfreilich der ganze Artikel umgesymbolt werden. Das würde hier aber eine grundsätzliche Entscheidung erfordern. Die Arbeit selber ist dann schnell gemacht. -- Philipendula 10:42, 27. Jun. 2009 (CEST)
Das befürwortete ich, die Grundform   empfinde ich als eine unnötige Klippe. --Erzbischof 11:14, 27. Jun. 2009 (CEST)
Ich auch. Nijdam 11:58, 27. Jun. 2009 (CEST)
Was befürwortet ihr? --P. Birken 20:51, 29. Jun. 2009 (CEST)
Klar, wenn man die Notation ändert, dann im ganzen Artikel. Was ich meinte ist: Beim linearen Ausgleichsproblem muss aus meiner Warte am Ende   stehen. x für den Vektor der Parameter halte ich für absolut sinnvoll. Ich habe nochmal Bücher gewälzt, speziell im numerischen Kontext würde ich das als Standard bezeichnen. Abweichungen gibt es vor allem dabei, wie man die Komponenten von x nennt. Eine Möglichkeit wäre beispielsweise   und später zu sagen, dass  . Nur mal so als Beispiel. Das würde das gleichzeitige Auftauchen von x und t vermeiden und Variablen und Parameter stärker voneinander abgrenzen. --P. Birken 20:51, 29. Jun. 2009 (CEST)
Wie schon oben erwähnt: Bronstein nennt es  . -- Philipendula 21:16, 29. Jun. 2009 (CEST)
Präziser: Ich denke, dass der Durchschnittsleser bei   erstmal eine Funktion   mit Parameter   herauslesen würde. Wenn man x für die Parameter beibehält, dann vielleicht nicht y für die linke Seite nehmen. --Erzbischof 21:30, 29. Jun. 2009 (CEST)
@Phili: Ja, sieht aber trotzdem aus wie vom Praktikanten ausgedacht ;-) @Erzbischof: y_m ist auf jedenfall blöd, aber wenn ich so drüber nachdenke, finde ich y oder f ganz gut.   magst Du nicht? --P. Birken 21:40, 29. Jun. 2009 (CEST)
Doch,   wäre gut, weil man da intuitiv weiß, was die Parameter sein sollen. --Erzbischof 21:47, 29. Jun. 2009 (CEST)
Auch wenn das noch lang nichts heißt, aber die englische, französische und niederländische Wikipedia verwenden auch "meine" Symbolik. -- Philipendula 21:49, 29. Jun. 2009 (CEST)
Für mich wäre   durchaus verständlich, weil b für mich einen Parameter beichnet. Bei   gibts keinen Zähler für die Parameter. Lutz Hartmann 22:07, 29. Jun. 2009 (CEST)
Das würde ich dann so lösen, dass hier die eben genannte Notation verwendet würde und dann dort ein allgemeiner linearer Ansatz gebracht werden würde, dann mit durchnummerierten Parametern. --P. Birken 22:40, 29. Jun. 2009 (CEST)
*quengel* Könnte man dann die Parameter wenigsten b statt   nennen? Im statistischen Modell ist Beta der unbekannte Parameter der Grundgesamtheit, der durch b geschätzt wird. -- Philipendula 09:37, 30. Jun. 2009 (CEST)
Auch in der Ökonomie ist   etwas, was man schätzt, z.B. bei der Ermittlung des WACC spielt der Betafaktor im CAPM eine wichtige Rolle. Lutz Hartmann 20:07, 30. Jun. 2009 (CEST)
Ach, das war eigentlich nicht das Problem. Aber amüsiert euch ruhig weiter ... -- Philipendula 21:04, 30. Jun. 2009 (CEST)
Also: Ich würde gerne die Notation aus dem Björck weitestgehend übernehmen. Das ist das numerische Standardwerk zu den kleinsten Quadraten und da kommt man bei Ax-b raus. Da ich auch der Meinung bin, dass vieles am Ende Geschmackssache ist, würde ich vorschlagen, dass ich den Artikel an diese Notation anpasse und bei der Gelegenheit den Abschnitt zum allgemeinen linearen Ansatz neuschreibe. Insofern: wenn jemand bei dieser Notation tot umfällt, bitte schreien, denn ich würde jetzt einen Admin bitten, den Artikel zu entsperren und einfach mal mutig sein und loslegen, ich hätte nämlich heute und morgen Abend etwas Zeit, am Artikel zu arbeiten. Viele Grüße --P. Birken 20:34, 1. Jul. 2009 (CEST)
Ich kann mit vielem leben, ohne tot umzufallen. Wichtig ist nur, daß die Notation am Anfang erkärt und dann einheitlich durchgezogen wird. Unschön bei Ax-b ist nur, daß der Beobachtungsvektor mit b und die einzelnen Beobachtungen (seine Elemente) mit y_i bezeichnet werden. 80.146.67.35 10:35, 2. Jul. 2009 (CEST)

Hab mal entsperrt. -- Philipendula 11:37, 2. Jul. 2009 (CEST)

Also hab das mal durchgezogen und den allgemeinen linearen Fall eingefügt. An mehreren Stellen habe ich den multivariaten Fall ignoriert. Die Namen der Parameter im Fall einer Ausgleichsgeraden habe ich jetzt erstmal doch nicht angepasst, passte IMHO irgendwie doch nicht. --P. Birken 21:23, 2. Jul. 2009 (CEST)

Artikelaufbau

Der Abschnitt Das Verfahren beginnt mit dem Satz "Häufig ist für ein gegebenes Problem keine formelhafte Beschreibung zur Hand." Ist es günstig, so zu beginnen? Bei der Methode der kleinsten Quadrate wird doch erst einmal ein gegebenes, überbestimmtes Gleichungssystem gelöst (d.h. der funktionale Zusammenhang zwischen den unbekannten Parametern und den gemessenen Werten ist bekannt). Wenn man verstanden hat, wie das geht, kann man auch die Methode auch anwenden, um zu einer "Punktwolke" eine Modellfunktion auszuwählen und deren Parameter zu bestimmen.

Die Begriffe "Punktwolke" und "Kurve" sollten in der Einleitung nicht als alleiniges Anwendungsgebiet, sondern eher als anschauliches Beispiel genannt werden. Ein Anwendungsbeispiel, bei dem der Begriff "Kurve" nicht paßt, ist die Bestimmung von Transformationsparametern bei Koordinatentransformationen.

Mein Vorschlag für einen neuen Aufbau:

  • Zuerst wird das Prinzip erklärt: Es liegen Meßwerte   vor, die von den gesuchten unbekannten Paramtern   abhängen und wobei der funktionale Zusammenhang gegeben (bekannt oder angenommen) ist. Da mehr Meßwerte vorliegen als zu Bestimmung der Parameter nötig sind und das Gleichungssystem wegen Meßungenauigkeiten nicht konsistent ist, ist ein Approximationsproblem zu lösen. Es sollte auch auf eine mögliche Gewichtung der Beobachtungen hingewiesen werden. Vielleicht kann auch an dieser Stelle auf die (mich) verwirrenden Variablen   verzichtet werden, da der funktionale Zusammenhang durch die Funktionen   beschrieben wird.
  • Danach könnte das allgemeine lineare Modell Ax=b+e, Xb=y+e oder wie auch immer beschrieben werden (Die Residuenvektoren sind erforderlich, da sonst das Gleichheitszeichen nicht streng gilt). Außerdem liefert die Methode nicht nur Schätzwerte der unbekannten Parameter, sondern auch Genauigkeitsmaße. An dieser Stelle würden auch Hinweise auf einen möglichen Rangdefekt passen.
  • Die Beispiele zum linearen Modell würde ich nach der Beschreibung des allgemeinen Falls zu dessen Veranschaulichung in konkreten Fällen beschreiben. Hier kann auch erläutert werden, wie zu einer Punktwolke eine Modellfunktion und deren Parameter gefunden werden* Schließlich müßte der nichtlineare Fall behandelt werden, d.h. wie man diesen ein nichtlineares Problem in ein lineares überführt.

80.146.67.35 10:40, 2. Jul. 2009 (CEST)

Als ich flüchtig lass dachte ich: doch y = f(x), aber dann sah ich dass x die Parametern bedeuten. Also das ist keine Verbesserung. Die vorliegende Punktepaare (?i,yi) sollen deutlich introduziert werden, und danach die Gedanke dass yi=f(?i,Parametern). Nijdam 12:51, 2. Jul. 2009 (CEST)
Mit diesem Vorschlag ging es mir um einen anderen Artikelaufbau sowie darum, von den Punkten (x,y) weg zu allgemeinen Funktionen zu kommen, und nicht um eine Notation (die im vorherigen Abschnitt behandelt wird). Wenn man sich für b als Parameter entscheidet, müßte das natürlich f(b_i) heißen, mit b als Beobachtungsvektor entsprechend b=f(..).
Wenn zuerst die Beispiele aufgeführt werden, müßte bei jedem Beispiel eine eigene Auswertsstrategie genannt werden oder man müßte sich auf das noch nicht behandelte allgemeine Modell beziehen. Im anderen Fall kann man bei jedem Beispiel ein Bezug zum allgemeinen Modell, eventuell mit Angabe von Besonderheiten, bilden. An dem allgemeinen Modell können auch schon verschiedene Eigenschaften dieser Methode erläutert werden, wogegen man sich sonst erst durch mehrere Sonderfälle lesen müßte. 80.146.67.35 13:26, 2. Jul. 2009 (CEST)
Trotdem, wenn man die Meßwerte y als Wert einer Funktion fpar auffassen möchte, dann kommt man nicht aus ohne das Argument x, t oder irgendwas der Funktion zu nennen. In deinem Form: fi scheint es alsob es für jeden index i um einer anderen Funktion handelt. Nijdam 16:32, 2. Jul. 2009 (CEST)
Das war auch so gemeint. Die Beriffe "Kurve" und "Punktwolke" im Artikel suggerieren, daß es immer um eine Funktion geht. Die Methode wird aber auch verwendet, um z.B. aus Richtungs- und Streckenmessungen Koordinaten zu schätzen. Dann ist z.B. die 1. Beobachtung eine Strecke, die von den Koordinaten der Punkte A und B abhängt, die 2. Beobachtung eine Strecke, die von den Koordinaten der Punkte A und C abhängt, ... Schließlich kommen noch Richtungsbeobachtungen hinzu, die von Koordinaten und Orientierungsunbekannten abhängen ... Es werden sogar ungleichartige Beobachtungen gemischt, so daß dieses Beispiel nicht ohne Gewichte auskommt. 80.146.95.100 17:10, 2. Jul. 2009 (CEST)
Also das mit den Gewichten beim Prinzip zu erklären finde ich ne gute Idee. Ich hatte ja eh vor, Gewichte noch als Extraabschnitt hinzuzufügen, dann passt das gut, wenn das schon vorher mal erklärt wird. Ansonsten sehe ich als wesentlichen Unterschied, dass die Anzahl der konkreten Beispiele reduziert werden würde. Ist das wirklich wünschenswert? --P. Birken 21:26, 2. Jul. 2009 (CEST) P.S.: Bis vermutlich Sonntag unterwegs
Der wesentliche Unterschied ist eigentlich, daß man zuerst den allgemeinen Fall einführt und dann durch Beispiele (die nicht unbedingt reduziert werden müssen) erläutert. Und insbesondere wollte ich von der Konzentrierung auf Kurven wegkommen. Aber davon kann ich wohl keinen überzeugen.
Der allgemeine lineare Fall ist eigentlich  , die   müssen nicht unbedingt - wie im Artikel dargestellt - durch bei allen Meßwerten gleiche Funktionen   beschrieben werden können. Man kann die Methode der kleinsten Quadrate ganz allgemein als Verfahren sehen, um ein überbestimmtes (linieares) Gleichungssystem zu lösen. Im englischen Artikel en:Linear least squares wird auch zuerst im Abschnitt The general problem der allgemeine Fall und denn unter Uses in data fitting der speziellere auf Kurven bezogene Fall erläutert. Oder ist diese Betrachtungsweise zu abstrakt? 80.146.64.122 17:27, 4. Jul. 2009 (CEST)
Ja, das ist meiner Meinung nach zu abstrakt und gehört zum Thema Pseudoinverse. Die Methode der kleinsten Quadrate ist nur sinnvoll, wenn da hinter gewisse stochastische Modellannahmen stehen. Es klingt aber sinnvoll, zu diesem abstrakten Ansatz noch einen Satz an geeigneter Stelle zu spendieren. --P. Birken 17:05, 5. Jul. 2009 (CEST)
Zugegeben, der Hinweis auf die Lösung von überbestimmten linearen Gleichungssystemen ohne stochastisches Modell war nicht gut. Aus dem Studium kenne ich es auch so: Die Beobachtungen   werden als Zufallsvektor mit der Kovarianzmatrix   (  = bekannte, positiv definite Gewichtsmatrix) eingeführt. Der Erwartungswert der Beobachtungen ist eine Linearkombination der unbekannten Parameter  , also:   mit der bekannten Matrix  . Dieses allgemeine Modell läßt sich (u.U. nach einer Linearisierung) in vielen Bereichen, in denen Meßwerte zufällige Größen sind, einsetzen - nicht nur bei Kurven und Punktwolken.
Bei der Konzentration des Artikels auf die Schätzung von Kurvenparametern aus gegebenen Punkten (x,y) fehlt meiner Meinung nach ein wesentlicher Aspekt. Vielleicht ist es auch hilfreich, am Anfang (noch vor den Details des Verfahrens) zwei Beispiele für den Zweck der Methode anzugeben: einmal eine Kurve (z.B. Gerade aus mehr als zwei Punkten) und Punktbestimmung in der Ebene (zwei Koordinaten eines Neupunktes aus mehr als zwei Streckenmessungen). Dann ist der "abstrakte Ansatz" möglicherweise nicht mehr ganz so abstrakt. 80.146.84.206 17:03, 6. Jul. 2009 (CEST)
Mhmh. Also ich denke schon, dass der Kurvenaspekt der wichtigste ist. Und wenn man im Spezialfall nur Punkte betrachtet, kriegt man das ja auch durch Anpassung der Modellkurve hin oder nicht? --P. Birken 22:05, 7. Jul. 2009 (CEST)
Das mit der Wichtigkeit sieht wohl jeder etwas anders. Dieser Kurvenansatz wird jedenfalls dann schwierig, wenn unterschiedliche Beobachtungsarten mit unterschiedlichen Funktionen auftreten. Aber da von anderer Seite kein Interesse an einer ensprechenden Überarbeitung des Artikels besteht, will ich diese Diskussion beenden. 80.146.103.193 11:06, 9. Jul. 2009 (CEST)

?

Basis war eine Idee von Pierre-Simon Laplace, die Beträge von Fehlern aufzusummieren, so dass sich die Fehler zu Null addieren. Soll das bedeuten, dass die Summe der Beträge minimiert wurde unter der Nebenbedingung, dass sich die Fehler saldieren, oder sollen sich nur die Fehler zu Null addieren ohne irgendwelche Beträge? -- Philipendula 15:30, 10. Jul. 2009 (CEST)

Die Summe der Beträge wurde minimiert, unter der Nebenbedingung, dass sich die Summer der Fehler (ohne Beträge) zu Null addiert. --P. Birken 19:13, 10. Jul. 2009 (CEST)

Kandidatur Methode der kleinsten Quadrate

Der Artikel stand im Juni schon einmal zur Wiederwahl (Siehe: Diskussion), weil der Antragsteller die Einleitung für nicht exzellent erachtete. Daraufhin wurden weitere Mängel des Artikels aufgedeckt. Im Zuge der umstrittenen Auswertung bekamen die Autoren die Möglichkeit, den Artikel erstmal nach den neuen Punkten zu überarbeiten, da sie im Vorfeld der Wiederwahl keine Chance dazu hatten. Seitdem sind knapp zwei Monate vergangen. Ich habe nun die Hauptkritiker Benutzer:Belsazar und Benutzer:Zipferlak (eine fundierte Kontra-Stimme kam von einer IP), ob sie ihre Kritikpunkte abgearbeitet sehen und den Artikel aufgrund dessen als Exzellent ansehen, was sie verneinten. Deshalb stelle ich den Artikel hier zur Wahl, um den aktuellen Status feststellen zu lassen. --Kauk0r 10:54, 17. Aug. 2009 (CEST)

Oh danke für den Link, so etwas wollte ich eigentlich eingebaut haben. --Kauk0r 11:05, 17. Aug. 2009 (CEST)
  • Abwartend Im Abschnitt Lösung des Minimierungsproblem sollte wenigstens eine Referenz zum QR-Verfahren, das ohne die Normalengleichung auskommt, angegeben werden. Besser wäre es, die Idee zu schildern. Andim 12:20, 17. Aug. 2009 (CEST)
Das QR-Verfahren ist etwas anderes, Du meinst die QR-Zerlegung, die im Abschnitt Lösung des Minimierungsproblems erwähnt wurde. Ich habe die Idee mal ausgeführt. --P. Birken 23:42, 22. Aug. 2009 (CEST)
Jetzt Lesenswert. Andim 15:06, 24. Aug. 2009 (CEST)
  • keine Auszeichnung wegen der grösseren Mängel und Auslassungen. Wie bereits hier ausführlich beschrieben, hat der Artikel einige sehr grobe Mängel, die erst teilweise behoben worden sind. Weiterhin hätte eine etwas stochastischere Behandlung hier nicht geschadet, zumindest bei den Grundlagen. Insbesondere wird nirgends erklärt, wieso denn die Punkte nicht auf einer Linie sind wenn sie das doch sein sollten, also zumindest der Fehlervektor   sollte da auftauchen (im Text wird das zwar erwähnt aber nirgendwo mathematisch). Dass die Geschichte dann noch so kurz ist und gerade einmal eine Anwendung aus der Enzymkinetik diskutiert wird, unterstreicht die Probleme des Artikels noch. Auch die Notation ist mir nicht so geläufig, wenn x für die Paramater benutzt wird, da wäre   oder   mehr im Einklang mit anderen Artikeln wie Regressionsanalyse oder en:Linear regression und den Lehrbüchern. Insbesondere ist es nur beschränkt sinnvoll, y wird manchmal für eine Funktion zu verwenden und manchmal für die Messwerte. Aber die Notation ist nicht das Wichtigste. Insbesondere ist mir aufgefallen
Das Beispiel mit dem Alter / Gewicht ist kein Beispiel mit Mehreren Variablen, das müsste nach oben
Dafür dass angeblich numerische Aspeket behandelt werden, finde ich erstaunlich wenig Numerik - die Kondition wird in einem Satz abgehandelt und nirgendwo erklärt, wieso sich das auf die Stabilität der numerischen Methoden auswirkt. Auch QR bzw Cholesky wird nur knapp erwähnt und deren Wichtigkeit entspricht nicht den paar Sätzen im Artikel
Weiterhin ist die Varianz und das Vertrauensintervall in keinster Art und Weise erwähnt. Klar braucht es hier keinen Beweis aber zumindest wie das gemacht würde gehört in einen numerischen Artikel, damit man weiss, wie R sowas berechnet; zB  
Die Gewichtete Regression wird unter "Ausreisser" diskutiert; allerdings wird "generalized least squares" nur am Rande mit ien zwei Sätzen abgehandelt. Zumindest die Formel gehört da hin.
Eine extrem grosse Lücke findet sich bei der nichtparametrischen Regression (en:Kernel Regression) wo zumindest Nadaraya-Watson, Lokale Polynome und Splines erwähnt werden müssten.
Eine weitere grosse Lücke ist, dass zumindest so etwas wie eine Methode der kleinsten Quadrate bei der Cross-Validation benutzt wird, so bei der „generalized cross validation“, welche hier gar nicht erwähnt wird
Weiterhin fehlt Lasso/Ridge Regression vollkommen - ja ein Satz darüber wurde sogar gelöscht
Weiterhin wurde forward und backword regression gelöscht - etwas das ja genau eines der versprochenen numerischen Verfahren gewesen wäre
Bei dem Thema „Ausreisser“ kommt einem als erstes "Jacknife" in den Sinn doch im Artikel fehlt man vergeblich danach. Weiterhin wird von gewichteten Regression gesprochen, was aber auch die Gewichtung der Residuen mit der Varianz bedeuten kann (glr). Nach den versprochenen numerischen Verfahren sucht man vergeblich.
Insbesondere aufgrund der obigen Auslassungen denke ich nicht, dass der Artikel momentan auch nur lesenswert ist. Das Thema ist sehr breit gewählt und deshalb sehr schwierig, abschliessend und vollumfänglich zu darzustellen. Der hier besprochene Artikel geht sehr ausführlich auf die einfache lineare Regression mit einer Prediktorvariable ein, lässt aber sehr viele andere Techniken aussen vor. Eine Auszeichnung würde aber implizieren, dass das Thema mehr oder weniger vollständig abgehandelt wurde, was nicht der Fall ist.
Weiterhin verstehe ich nicht, wieso der Artikel nicht zuerst in die Review kam. Ich hätte diese Punket viel lieber dort vorgebracht, statt dass ich jetzt hier den Buhmann spielen muss und für die Abwahl plädieren soll. Ich würde sogar vorschlagen, die Kandidatur/Wiederwahl abzubrechen und eine Review zu starten.
IMHO fehlt zu Lesenswert insbesondere eine bessere Einleitung, die nicht zu 1/3 aus der Abgrenzung zu Regressionsanalyse, weiterhin sollten die oben beschriebenen Lücken gestopft werden (es fehlen mehr als nur Teilaspekte des Themas). Die etwas eigenwillige Notation hilft dem Anfänger auch nicht, das Thema zu verstehen. Gruss -- hroest Disk 15:00, 17. Aug. 2009 (CEST)
Auf eine Erwähnung des Fehlervektors haben wir absichtlich verzichtet, wie meiner Einschätzung nach fast alle Autoren numerischer Fachliteratur. Betrachtet man nur die Standard-Kleinsten-Quadrate ist die Erwähnung überflüssig und macht die Notation nur komplexer, darauf wollten wir verzichten. Auch sonst kann ich die Kritik an der Notation nicht verstehen: warum sollte sie unüblich sein? Einen absoluten Standard gibt es nicht, die Notation war eines der Sachen die seit der letzten Kandidatur überarbeitet wurden. Dem Urteil hätte ich vorher zugestimmt, nun eigentlich nicht mehr? Insbesondere die Verwendung von x ist Standard in der numerischen Fachliteratur, damit man dann am Ende bei Ax-b rauskommt.
Was die Kondition angeht, so ist die ein numerischer Grundbegriff, der in jeder Einführungsveranstaltung behandelt wird. Sollte die wirklich erklärt werden?
Varianz und Konfidenzintervall könnte man überlegen für den konkreten Fall.
Generalized Least Squares warten seit längerem unter Benutzer:P. Birken/Skizze, die Urlaubszeit hat die Diskussion torpediert, ich bin erst seit kurzem wieder da, Philipendula weiterhin weg. Ich habe sie nun in den Artikel gepackt.
Die weiteren Themen sprengen IMHO hier den Rahmen, wobei Phili bei ihren Löschungen vielleicht etwas übermotiviert gewesen sein könnte. Das wichtigste Thema des Artikels ist die Methode der kleinsten Quadrate für lineare Modelle. Entsprechend groß ist der Raum, der diesem Thema gegeben wird. Zweitwichtigstes Theme ist, neben Geschichte etc. das nichtlineare Modell. Das wird behandelt, bei allem weiterem muss man sich fragen, wie groß die Gruppe der Leser überhaupt noch ist und ob das nicht zu Regressionsanalyse gehört. Themen, die nur noch für wenige Tausend Spezialisten interessant sind, gehören meiner Meinung nach nicht in einen Überblicksartikel.
--P. Birken 00:06, 23. Aug. 2009 (CEST)
Lesenswert nach Überarbeitung und weiterem Nachdenken.
Ja, es kann durchaus Sinn machen, den Fehlervektor nicht einzuführen, aber zumindest die unterliegenden Annahmen sollten besprochen werden und die beziehen sich nun mal teilweise auf den Fehlervektor (zB Homoskedastizität und Korrelation der Fehler sowie auch iid für die Fehler...). Bei den Anforderungen an die Daten wird das abgehandelt, allerdings stark praxisorientiert (was auch für einen Lesenswerten Artikel io ist).
Die Notation is einheitlich aber zumindest für mich unüblich aber wie gesagt, die Notation war für mich nie ein Argument und ich finde es genügend, wenn sie innerhalb des Artikels konsistent ist. Wünschenswert wäre natürlich eine Konsistenz mit Regressionsanalyse aber ist nicht zwingend.
Gerade weil sich der Artikel an Laien richtet, wäre es sinnvoll, die Kondition zu erklären.
Varianz und Konfidenzintervall würde ich sehr gerne sehen, auch wenns kein statistischer Artikel ist (die Herleitung kann ja aussen vor bleiben)
GLS ist imho sehr wichtig für den Artikel gerade weil es darum geht, was man macht, wenn gewisse Annahmen verletzt sind (Homoskedastizität und Korrelation der Fehler)
Klar kann man nicht ein ganzes Lehrbuch in den Artikel packen und ich war vielleicht etwas überschnell mit meinem Urteil. Trotzdem sollten weiterführende Hinweise gerade zu Methoden wie Kernel regression vorhanden sein. Ich habe nach einigem Nachdenken den Sinn eines Artikels für lineare Modelle bzw vorgegebene Modelle durchaus gesehen und bin da vielleicht auch mit falschen Erwartungen in den Artikel eingestiegen. Ich halte es auch nicht für realistisch, alle diese Themen zu behandeln, deshalb kann ich sie dir auch kaum als grössere Auslassungen ankreiden - aber ich glaube du siehst mein Problem wenn ich das Prädikat "vollständig und vollumfänglich behandelt" abgeben muss? Ich denke, da ist es sehr wichtig, darauf hinzuweisen, dass es noch viele weitere Methoden gibt, damit der Leser eben nicht denkt, hier sei fertig. Nichtparametrische Regression und CV können mit ein paar Sätzen abgehandelt werden aber Lasso und forward/backward wäre doch nice to have zumindest dann in einem exzellenten Artikel. Aufgrund der schönen Beispiele und der wie gesagt auf die meisten Anwender fokussierten Themensetzung komme ich zum Schluss, dass Lesenswert gerechtfertigt ist. Exzellent ist für mich noch ein paar Schritte mehr - vor allem was Abgrenzung und Erwähnung weiterführender Methoden angeht und den Bereich "Anforderungen an die Daten" könnte man etwas theoretischer aufbauen. Sprich die Annahmen an die Fehler und deren Verletzung aufzeigen. Gruss -- hroest Disk 18:34, 26. Aug. 2009 (CEST)
Also Anforderungen und GLS wurden im laufe der Diskussion in den Artikel gepackt, ein Satz zur Kondition auch. Über Varianz, Konfidenzinterval und die Ridge Regression denke ich mal am Wochenende nach. --P. Birken 22:25, 26. Aug. 2009 (CEST)
  • keine Auszeichnung Weitgehend unverständlich für Laien und Nicht-Experten, etwas unstrukturiert, Sätze wie "Ausreißer müssen daher entdeckt und aus der Messreihe ausgeschieden werden." halte ich für nicht allgemeingültig, und auch so Sätze, den den Artikel beschreiben, wie "Der vorliegende Artikel befasst sich vor allem mit der Numerik der Methode der kleinsten Quadrate." halte ich für unpassend und zu Essayartig. Imsgesamt auch überhaupt nicht gut zu lesen. Wo da Quadrate im Verfahren vorkommen erfährt man nur ganz am Rande. -- Jonathan Haas 16:37, 17. Aug. 2009 (CEST)
Wer bestreitet denn bitte, dass Ausreißer entdeckt und eliminiert werden müssen? Die Methode funktioniert(im Gegensatz zu anderen) schlicht nicht, wenn Ausreißer in den Daten enthalten sind. Zum anderen Satz: Was ist an besagtem Satz "essayartig"? Er stimmt doch.
Man kann ja gern gegen Auszeichnungen für diesen Artikel sein, aber vernünftige Begründungen sollten es dann schon sein. --Scherben 19:13, 17. Aug. 2009 (CEST)
Ich bin nicht der ultimative Experte, aber ich denke mir, dass unter Umständen "Außreißer" auch berücksichtigt werden müssen. Z.B. wenn es eben normal ist, dass einzelne Werte abweichen und diese auch für die Kurve berücksichtigt werden müssen. Gut vielleicht sind ausreißer anders definiert, dann kannst du diesen Punkt streichen. An den anderen Anmerkungen ändert das jedoch nichts. Und bloß weil etwas stimmt, heißt das doch nicht, dass es nicht Essayartig wäre, oder in den Artikel gehört. Wenn überhaupt gehört der betreffende Satz IHMO ganz oben ala Vorlage:Dieser Artikel eingebaut. -- Jonathan Haas 22:18, 17. Aug. 2009 (CEST)
In der Registrierung von Arzneimitteln, die in den meisten Faellen auf einer Intention-to-treat-Analyse, in der moeglichst wirklich jeder geteste Patient in die Analyse eingehen sollte und in der die Analysemethode vor "Entblindung" genau vorgegeben werden muessten, wuerden einem die Registrierungsbehoerden einen husten, wenn man einfach mal so nach Beschau der Faelle als "Ausreisser" ausschliesst. Die geplante Analyse wuerde ueblicherweise mit allen Faellen durchgefuehrt, und nebenbei waeren dann zusaetzlich Sensitivitaetsanalysen vorzulegen. In der gegebenen Form ist die Aussage eindeutig zu apodiktisch. -- Arcimboldo 11:47, 18. Aug. 2009 (CEST)
Es geht darum, daß verfälschte Beobachtungen (aus irgendeinem Grund wurde der Messung falsch durchgeführt, der Meßwert falsch notiert, ...) bei der Methode der kleinsten Quadrate einen großen Einfluß haben können das Ergebnis verzerren. Daher muß man sich Gedanken über die Behandlung der Ausreißer machen: z.B. Streichen der verfälschten Beobachtungen (nicht unbedingt Beobachtungen mit großen Residuen) oder anderes Berechnungsverfahren. Das kann ja gerne jemand besser formulieren. Details über weitere Verfahren gehören jedoch nicht in diesen Artikel, wenn dieser nur die „Numerik der Methode der kleinsten Quadrate“ behandeln soll. 80.146.67.103 16:58, 18. Aug. 2009 (CEST)
Daher muß man sich Gedanken über die Behandlung der Ausreißer machen - dazu volle Zustimmung; wie beschrieben, es geht um die zu apodiktische Formulierung, dass solche Werte auszuschliessen sind. Mit einer Umformulierung sollte das Problem loesbar sein. -- Arcimboldo 02:03, 19. Aug. 2009 (CEST)
Jetzt ok? Das Drei-Gruppen-Verfahren sagt mir nichts. Ich habe es aber dringelassen, da es jemand mal als relevant ansah und ich es nicht einfach löschen wollte. 80.146.64.77 09:34, 20. Aug. 2009 (CEST)
Was bemängelst Du denn an der Struktur? Die Abgrenzung zur Regressionsanalyse habe ich mal aus der Einleitung rausgeschmissen. Was liest sich denn nicht gut? --P. Birken 00:19, 23. Aug. 2009 (CEST)
OK. Was sich nicht gut ließt: Die Einleitung könnte wesentlich OMA-freundlicher sein. Während Teile noch halbwegs gut verständlich sind („Dabei wird durch eine Datenpunktwolke eine Kurve gelegt, die möglichst nahe an den Datenpunkten verläuft.“) könnten meiner Ansicht nach andere Sätze auch einfacher formuliert werden, z.B. „Diese sind in der Regel parameterabhängig, und so bestimmt die Methode der kleinsten Quadrate die optimalen Parameter numerisch, indem die Summe der quadratischen Abweichungen der Modellkurven von den beobachteten Punkten minimiert wird.“. Diesen Satz finde ich sehr wichtig, umso mehr ist es schade, dass er durch die ganzen Fachwörter und die Satzlänge so stark untergeht. Man kann das doch ganz relativ einfach erkären. Man hat parameterabhängige Daten und bestimmt eine mathematische Funktion bzw. Kurve, die ebenfalls diese Parameter hat, und wo die quadrierten Abweichungen zu den Messdaten möglichst klein sind. Der Abschnitt unter Verfahren ist dann völlig unverständlich, weil man erstmal zig Variablen entgegengeschleudert bekommt und erstmal gar nicht (allgemeinverständlich) gesagt bekommt, ob das jetzt die Parameter der Kurve, die Abweichungen, oder was auch immer sind. Im weiteren Verlauf zerstören die ganzen Bilder und Diagramme das Layout ziemlich, mal sind sie links, mal rechts, mal ist da ne einsame 1-Bild-Galerie (bzw. etwas, das so aussieht) usw. - Jonathan Haas 10:34, 23. Aug. 2009 (CEST)
Ich habe den Bandwurmsatz mal zerteilt, wies war bevor G den Aufstand gemacht hat. Die Bilder habe ich mal massiert, vermutlich ist es besser, wenn man die Tabellen in Wikiformat bringt. Deine Kritik am Verfahrensabschnitt kann ich nicht verstehen: Parameter, Variablen und abhängige Variablen werden an konkreten Beispielen erklärt? Die Notation zu erklären ist ebenfalls unumgänglich? --P. Birken 12:44, 23. Aug. 2009 (CEST)
Ich habe die Probleme vor allem mit der Wortwahl. In der Einleitung: "parameterabhängigen problemangepassten Familie von Funktionen". Find ich viel zu kompliziert. Sag einfach "geeignete Funktion" o.ä. Dann: "Die Parameter werden numerisch bestimmt", ich kann mir was darunter vorstellen, OMA aber wahrscheinlich nicht. "Angewandt als Systemidentifikation ist die Methode der kleinsten Quadrate in Verbindung mit Modellversuchen für Ingenieure ein Ausweg aus der paradoxen Situation, Modellparameter für unbekannte Gesetzmäßigkeiten zu bestimmen." ist mir komplett unverständlich. Wieso ist die Situation paradox, wenn die Methode doch genau das macht? Was ist eine Systemidentifikation? Nein, ich will nicht jedem Link folgen müssen, schon gar nicht in der Einleitung. Außerdem wieder Satz zu lang. Dann zu Verfahren: "Man betrachtet eine abhängige Variable y, die von einer vorgegebenen Variablen t oder auch von mehreren Variablen t1 bis tq beeinflusst wird", ich hatte Mathe im Abi-Leistungskurs, aber den Begriff "abhängige Variablen "hatten wir nicht. Sag doch einfach y(t) bzw. y(t1,t2,3,...,tn) ist die Funktion der annährenden Kurve, die eben diese Modellparameter tn als Parameter kriegt, oder so. Du schreibst unten, dass es gut wäre, wenn der Laie bis zur Fünftletzten Zeile in diesem Abschnitt kommen würde. Ich behaupte: Aktuell kommt er nicht über den dritten Satz in der Einleitung hinaus. Wenn überhaupt. Deswegen für mich auch nicht lesenswert. -- Jonathan Haas 13:49, 23. Aug. 2009 (CEST)
Ich denke wir haben eine unterschiedliche Auffassung des Sinns einer Einleitung. Die Einleitung soll zum einen dem völlig unbedarften Leser eine Definition und einen Eindruck dessen geben, worum es überhaupt geht. Dabei darf Korrektheit nicht vernachlässigt werden, deswegen ist das Wort Parameter in der Einleitung IMHO notwendig. Darüberhinaus soll sie aber auch denen, die grundsätzlich wissen worum es geht, das aber nochmal genauer wissen, einen Überblick geben. Man kann nie beide Gruppen gleichzeitig befriedigen, was bedeutet dass der Laie in einer Einleitung eines mathematischen Artikels nie alles verstehen wird. Auch in Satz des Pythagoras findest Du beispielsweise den Satz: "In der modernen Mathematik motiviert der Satz das Konzept des Senkrechtstehens in abstrakten Räumen."
Ansonsten habe ich die Einleitung nochmal überarbeitet und auch den Abschnitt zum Verfahren. Lies doch bitte nochmal drüber, ob Du es nun besser findest. Danke! --P. Birken 22:00, 24. Aug. 2009 (CEST)
OK, schon deutlich besser. Ich habe meine Stimme mal gestrichen, da ich alles weitere mangels Fachkenntnis nicht einschätzen kann. -- Jonathan Haas 22:25, 24. Aug. 2009 (CEST)
  • Lesenswert - komplette Abwahl halte ich für übertrieben, exzellent ist er aber trotzdem nicht. Der Artikel beginnt gut, der mathematische Teil ist für Laien vielleicht tatsächlich etwas schwer verständlich (aber das darf er bei Lesenswerten ja sein und das wird wohl sowieso bei den meisten mathematischen Themen so sein - auf jedenfall ist es kein absichtliches Fachgeschwurbel), dafür ist er aber weitestgehend vollständig und auch schön bebildert. --maststef 23:31, 19. Aug. 2009 (CEST)
Der mathematische Teil ist aufgrund des Themas für Laien nur schwer verständlich. Ziel des Artikels ist es, dem Laien i) das grundsätzliche Problem zu erklären, verbunden mit der Bedeutung, ii) die grundsätzliche Lösungsidee und iii) dass es von Gauß ist. Wenn der Laie also bis zur fünftletzten Zeile von Methode_der_kleinsten_Quadrate#Das_Verfahren gekommen ist, ist alles gut. Ich behaupte mal, dass man dem mathematisch nur aus der Schule vorgebildeten Laien den mathematischen Teil nicht mehr verständlich komplett nahebringen kann. Das Konzept ist schon, die Schwierigkeit stückweise zu erhöhen. --P. Birken 00:19, 23. Aug. 2009 (CEST)
  • Knapp Lesenswert. Für einen exzellenten enthält der Artikel mir zu viele Unstimmigkeiten und Schwachpunkte (Punkte i.w. aus der letzten Abwahldiskussion übernommen): 1.) Das Ergebnis eines Fits sind Parameter, Fehlerabschätzungen für die Parameter sowie ein statistisches Maß für die Qualität der Anpassung. Im Artikel ist nur der erste Punkt "Parameter" adressiert, der Rest fehlt. 2.) Damit verwandt: Das Thema "Gewichtung von Residuen" ist nicht systematisch dargestellt. Die Behandlung von Ausreissern sollte als Spezialfall in einem Kapitel "Gewichtung" dargestellt werden. 3.) IMHO würde der Artikel gewinnen, wenn die zugrundeliegenden Prämissen der Methode dargestellt würden: Auf welchen Verteilungsannahmen basiert die Methode? (->Normalverteilung der Messpunkte um einen "wahren Wert"), warum wird gerade die Summe der Fehlerquadrate als Fehlermaß verwendet? (->Fehlerfortpflanzung normalverteilter Größen), warum wird die Fehlerfunktion minimiert? (->größte Wahrscheinlichkeit, dass die Abweichungen nicht durch falsch gewählte Modellparameter, sondern nur noch durch Messfehler bestimmt sind) 4.) Zu der o.g. Diskussion zum Thema "nichtlineare Fits": Zumindest in der Physik sind nichtlineare Fits keine Exoten, sondern tagtägliche Routineaufgaben. Gaussfits von irgendwelchen Messwertverteilungen, Peakprofilen oder ähnlichem hat sicher jeder Physiker schon oft durchgeführt. IMHO wäre der Gaussfit ein wesentlich relevanteres Beispiel als die erweiterte Michaelis-Menten-Beziehung (ist aber vielleicht Geschmackssache). 5.) Die Inhalte der Tabellen T1 und T2 werden nur unzureichend erläutert. Was ist "Signifikanz"? Warum ist die Signifikanz in den Tabellen fast immer 0? Was ist "T-Prüfgröße"? -- Belsazar 09:17, 23. Aug. 2009 (CEST)
1.) Ja, das könnte man noch reinnehmen. 2.) Stimmt, da muss man den neuen Teil zu den Ausreißern noch mit dem neuen zu den verallgemeinerten kleinsten Quadraten in Einklang bringen. 3.) Die Verteilungsannahmen sind nun wieder drin, nachdem sie kürzlich gelöscht wurden. 4.) Ich sagte doch, dass ich die nichtlinearen Modelle für das zweitwichtigste halte und sie sind im Artikel drin? 5.) Ja, das sollten wir wohl noch verbessern. --P. Birken 12:56, 23. Aug. 2009 (CEST)
zu 2.) Stimmt nicht. Gewichtung ist dazu da, um unterschiedliche Genauigkeiten der Beobachtungen zu berücksichtigen. Das hat noch nichts mit Ausreißern (fehlerhafte Beobachtungen) zu tun. Die nachträgliche Anpassung von Gewichten ist lediglich ein mögliches Verfahren (von mehreren), um den Einfluß von Ausreißern auf die Schätzergebnisse zu reduzieren. 80.146.119.46 19:48, 23. Aug. 2009 (CEST)
  • Meiner Meinung nach hat der Artikel folgende wesentliche Schwächen:
    • Grad für Laien wäre ein Hinweis auf "Überbestimmung" oder "Redundanz" der Daten hilfreich, der bis jetzt fehlt. Stattdessen steht im Artikel "Im Allgemeinen sollen aus methodischen Gründen mehr Datenpunkte als Parameter vorliegen."
    • Es wird teilweise der Eindruck erweckt, daß die Wahl einer Modellfunktion ein wesentlicher Bestandteil der Methode der kleinsten Quadrate ist (z.B. "Um Informationen über die Art des Zusammenhangs zu erhalten, ..." am Anfang des Abschnitts Das Verfahren). Dabei ist die Idee der Methode doch, bei einem bekannten Zusammenhang zwischen Parametern und Beobachtungen die Parameter so zu bestimmen, daß sie möglichst gut zu den Beobachtungen passen. Erst wenn der Zusammenhang nicht bekannt ist, kann man das mit mehreren Modellfunktionen ausprobieren und die beste davon auswählen.
    • Mit der Darstellung der Punktwolke als allgemeinen Fall kann ich mich immer noch nicht anfreunden.
    • Behandlung von Gewichten fehlt. Vielleicht auch Genauigkeitsmaße für die Schätzwerte.
    • Ich hatte schon überlegt, einen Abschnitt einzufügen, in dem Gründe für die Minimierung der Quadratsumme dargestellt werden, da diese Frage schon öfter gestellt wurde. Dazu fehlt aber die Einführung eines allgemeinen Modells, auf das man sich beziehen kann. Außerdem sind dazu auch stochastische Aspekte (Erwartungswert, Verteilung) erforderlich, die bisher aus dem Artikel ausgeschlossen werden sollten.
    • Gerade die letzten beiden Punkte lassen mich zu dem Schluß kommen, daß es sinnvoll ist, bereits ziemlich früh im Artikel ein allgemeines Modell einzuführen (ein solches gibt es z.B. in Lineares Modell), das vielleicht auch die notwendigen stochsatische Aspekte enthält. Auf das kann man sich denn im weiteren Artikel beziehen. Dadurch wird auch die Notation einmal erklärt.
Der Artikel kann kaum vollständig laienverständlich werden. Wie oben schon steht, sollte die laienverständliche Erklärung von Problem, Lösungsidee und Geschichte zuzüglich Bedeutung ausreichen.
Auch kann der Artikel nicht allen Spezialisten gerecht werden, die die Behandlung ihrer Besonderheiten und Verwendung ihrer Notation wünschen, wie es in der Diskussion manchmal anklingt. Es sollte bei einem Übersichtsartikel bleiben. Daher erwarte ich auch nicht, daß sich alle angesprochenen Punkte einvernehmlich verbessern lassen. In der Summe halte ich den Artikel jedoch nicht für exzellent, bei lesenswert abwartend. 80.146.119.46 19:48, 23. Aug. 2009 (CEST)
Ich habe das mal mit den mehr Datenpunkten als Parametern stärker formuliert, ebenso die Wahl der Modellfunktion besser erklärt. Das mit den Gewichten ist unter Methode_der_kleinsten_Quadrate#Verallgemeinerte_Kleinste-Quadrate-Modelle angerissen oder meinst du etwas anderes? Ich stimme zu, dass, um mathematisch zu verstehen was passiert (BLUE), die Stochastik das beste Werkzeug ist. Allerdings trifft das nicht darauf zu, das Verfahren und die dafür notwendigen Schritte nachvollziehen zu können. --P. Birken 22:23, 24. Aug. 2009 (CEST)
  • Knapp Lesenswert. Ich habe bei der letzten Wiederwahl für kontra gestimmt. Inzwischen hat sich einiges verbessert, wofür ich den Autoren danken möchte. Das Hauptproblem ist aus meiner Sicht immer noch die Stochastik. Allerdings finde ich die Grundidee, in diesem Artikel vor allem die numerische Seite zu behandeln, gut. Es ist nur nicht richtig umgesetzt: Ganz ohne Stochastistik geht es natürlich hier nicht, aber die sollte überblicksartig in einem eigenen Abschnitt behandelt werden, nicht über den ganzen Text verteilt und damit unverständlich, wenn man nicht gleichzeitig Regressionsanalyse liest. Die numerische Seite (Kondition, Stabilität) kommt für mich auch noch deutlich zu kurz. Außerdem würde ich mir noch etwas "ordentlichere" und klarere Grafiken wünschen und ordentliche Weblinks (die etwas mit dem Thema zutun haben) wären auch nicht schlecht.--91.13.223.239 13:53, 24. Aug. 2009 (CEST)
Bei den Weblinks habe ich mal aufgeräumt und einen Satz zur Kondition spendiert. Was würdest Du denn zur Kondition und der Stabilität noch erwarten? Der Abschnitt zur Stochastik ist für mich grundsätzlich Methode_der_kleinsten_Quadrate#Verallgemeinerte_Kleinste-Quadrate-Modelle. Das ist dann der Punkt, wo man die numerische Sichtweise im wesentlichen verlässt und auf die stochastischen Modelle kommt. --P. Birken 22:13, 24. Aug. 2009 (CEST)
Zur Stochastik sollte es weiter vorne einen Abschnitt gegeben, der den Artikel Regressionsanalyse kurz zusammenfasst und in dem die Fachbegriffe zur stochastischen Sichtweise erklärt werden. Der Rest sollte dann aber wie angekündigt hauptsächlich die Numerik behandeln. Zur Kondition: Es wird nichts zur Kondition des linearen Ausgleichsproblems an sich gesagt, insbesondere nicht, was die Kondition von A damit zu tun hat. Zur Stabilität: Ich weiß nicht, wie viel sich genauer zur Stabilität der Verfahren sagen lässt, im Moment erfährt man nur, dass das QR-Verfahren "stabiler" als das Cholesky-Verfahren ist.--91.13.249.74 22:55, 24. Aug. 2009 (CEST)
OK, ich habe mir das gerade im Björck genauer angeschaut, das ist irgendwie nicht so klar, wie das in allen sonstigen Numerikbüchern drinsteht. Ich forsch nochmal etwas nach. --P. Birken 22:25, 26. Aug. 2009 (CEST)

es mag natürlich an meiner subjektivität liegen, dass ich den vorgang einen artikel nicht-abzuwählen (sinnvoll) und die im gegenzug zugesagte weiterbearbeitung (es geht hier immernoch um inhalte, nicht um klickibunti) dann während der umarbeitung mit einem folgeantrag zu torpedieren für optimierbar halte. imho theater wieder beenden, die mathematiker machen lassen und den prozess gern kritisch begleiten (OMA-tauglichkeit, anwendbarkeit in anderen disziplinen). statustheater trägt weder zur verbesserung des artikels bei (Prinzipal-Agent-Theorie) noch ist es sinn dieser seite hier vorlesungsskripte zum maßstab zu erheben, gruß --Jan eissfeldt 22:47, 24. Aug. 2009 (CEST)

Lesenswert Hinsichtlich der engeren mathematischen Inhalte bin ich Volllaie und verstehe sie nicht. Ich erlaube mit trotzdem das Urteil lesenswert. Einmal, weil ich ziemliches Vertrauen in das Urteilsvermögen P. Birkens habe und denke, dass, selbst wenn hier und da noch Mängel vorhanden sind, diese offenbar nicht allzu gravierend und inzwischen zum Teil behoben sind und weiter abgearbeitet werden sollen: „lesenswert“ heißt für mich, einige kleinere Mängel sind erlaubt. Zum anderen bekomme ich als Laie immerhin eine Ahnung, worum es geht, der geschichtliche Teil ist allgemeinverständlich und informativ. Sprachlich sehe ich den Artikel auf hohem Niveau. Und: Wikipedia ist immer noch eine allgemeine Enzyklopädie und kein mathematisches Fachkompendium. --Lienhard Schulz Post 22:50, 24. Aug. 2009 (CEST)


Exzellent Übersichtsartikel der prinzipiell nicht alle Wünsche gleichzeitig erfüllen kann und bei den erfüllten Wünschen die richtige Wahl trifft.

Allgemein.

  • Konzeption: Die numerische Seite der Methode der kleinsten Quadraten zu behandeln halte ich auch für eine kluge Zielsetzung und ein Zusammenführen von Stochstastik und Numerik täte dem Leser keinen Gefallen.
  • Umfang und Richtigkeit: Der Artikel behandelt ein schwieriges Thema fachlich korrekt und deckt gerade die wichtigen Aspekte ab, den Wunsch nach Bezug auf nichtparametrische Regression (en:Kernel Regression) kann ich nicht zum Beispiel nicht nachvollziehen. Verfahren, die eher weit entfernt sind, anzureißen, hat auch wenig Sinn, wenn keine Artikel zu ihnen vorliegen.
  • Umgang mit dem Leser: Die Wahl, die Geschichte vorzuziehen finde ich gut, weil sie von allgemeinen Interesse ist, der geschichtliche Teil ist auch lebendig geschrieben. Der Artikel richtet sich nicht in höherem Maße an ein Fachpublikum als dies exzellente Artikel aus anderen Gebieten auch tun, und auf vielfachen Wunsch geht der Artikel sehr behutsam vor, man kommt ohne Oberstufenmathematik durch Einleitung und geschichtlichen Teil, man vergleiche http://eom.springer.de/L/l057780.htm, lineare Algebra kommt entsprechend spät und Beispiele sind im Überfluss vorhanden.

Zu einzelnen Abschnitten/Review:

  • Einleitung: Die Einleitung ist angemessen, dem Stoff entsprechend erfüllt sie die Aufgabe einer kurzen Einführung eher als die der Zusammenfassung, sie führt zum Verständnis des geschichtlichen Teils. Der erste Satz sitzt.
  • Geschichte: Auch Kleinigkeiten sind richtig wiedergegeben, zum Beispiel wird die Überbestimmtheit der Bahnellipse gut untergebracht. Die Originaltabelle aus der Monatliche Correspondenz, Bild hier [1] von http://wlym.com/~animations/ceres wäre wünscheswert, ich kenn mich aber mit der Rechtslage "Scan von gemeinfreien Vorlagen" nicht aus, wenn's rechtlich geht, kann's ja jemand mal hochladen. Was man noch erwähnen sollte, wäre, dass Gauß durch seine Methode zu linearen Gleichungssystemen geführt wurde, deren Lösung durch das Gaußsches Eliminationsverfahren (Quelle: http://books.google.com/books?id=JSCHFC9zaD4C&pg=PT6&dq=Elimination+Ceres+gauss&lr=&hl=de#v=onepage&q=Elimination%20Ceres%20gauss&f=false) gelang und damit lineare Algebra ins Spiel kommt, sonst hängt die QR-Zerlegung ein bißchen in der Luft. Am liebsten hätte ich noch einen Hinweis, wie stark kleinste Quadrate und lineare Algebra einander in der Entwicklung beeinflusst haben, aber das ist eine Vermutung und ich habe keine Quelle.
  • Das Verfahren: Die Wahl von Fehlerquadraten statt Beträgen wurde wird im geschichtlichen Teil angesprochen, da sollte auch hier ein Satz zu fallen. Hier wäre auch eine Gelegenheit auf die "Asymmetrie" des Verfahrens hinzuweisen und dass man auf andere Verfahren umsteigt wenn zum Beispiel Fehler in beiden Beobachtungen vorliegen.
  • Lineare Modellfunktion: Ein Einleitungssatz wäre schön, dass sich das linear entweder nur auf die Parameter oder auf Parameter und modellierten Zusammnenhang bezieht, sonst kriegt der Leser bei "Der allgemeine lineare Fall" einen Schreck. Könnte man noch einen Hinweis auf den Aufwand der Lösung des Gleichungssystems einbauen?
  • Verallgemeinerungen: Der letzte Abschnitt ist mir für heute zu hoch, dazu kann ich nichts beitragen.

--Erzbischof 17:27, 25. Aug. 2009 (CEST)

Das mit der Geschichte war ein guter Hinweis, ich hatte das ja mal für Gaußsches Eliminationsverfahren und das nun auch hier ergänzt. Der Zusammenhang ist also eng, da mit der Methode der kleinsten Quadrate plötzlich eine Quelle zahlreicher linearer Gleichungssysteme auftauchte. Die Tabelle könnte man ohne Probleme hochladen, wir stehen auf dem Standpunkt, dass Scannen aus gemeinfreien Werken nicht plötzlich geschützte macht. Nur, woher weißt du, dass das die Originaltabelle ist? Ich habe leider keine Bildbeschreibung gefunden. Ansonsten bin ich nochmal rüber, schau am Wochenende aber nochmal genauer. --P. Birken 22:35, 26. Aug. 2009 (CEST)

Auswertung: Der Artikel wurde sehr intensiv diskutiert, auf Kritikpunkte wurde weitestgehend eingegangen. Insgesamt überwiegt das Votum für lesenswert deutlich gegenüber allen anderen Optionen, besondres schwerwiegende Argumente gegen diese Auszeichnung waren nicht erkennbar. -- Achim Raschka 07:09, 27. Aug. 2009 (CEST)

Editwar

Erst mal ein bisschen Ruhe bis zur Einigung über das weitere Vorgehen reingebracht. --Seewolf 09:58, 23. Jun. 2009 (CEST)

erl. 217.230.97.115 13:17, 10. Aug. 2011 (CEST)

Neue Wiederwahl

Nachdem es um die Wiederwahl einige Diskussionen gab, habe ich als Auswerter den Autoren Zeit gegeben, die Mängel zu beheben. Belsazar und Zipferlak sehen aber ihre Kontra-Argumente nicht umgesetzt. Deshalb werde ich den Artikel wieder zur Wiederwahl/Abwahl stellen. --Kauk0r 23:35, 13. Aug. 2009 (CEST)

erl. 217.230.97.115 13:17, 10. Aug. 2011 (CEST)

Ceres

nur ein Kleinigkeit: Ceres ist ein Zwergplanet (laut Ceres Wikiseite) (nicht signierter Beitrag von 85.179.238.56 (Diskussion | Beiträge) 21:01, 8. Okt. 2009 (CEST))

geändert. 217.230.97.115 13:33, 10. Aug. 2011 (CEST)

Weshalb Quadratabweichungen?

Mir als Mathe-Laie wird beim Lesen des Artikels nicht klar, warum zur Bestimmung der Kurvenparameter die Summe der QUADRATE der Punktabweichungen minimiert wird - und nicht die Summe der Absolutabstände. Steh ich da auf der Leitung? Oder sollte das nicht schon in der Einleitung erklärt werden? Luuukas 20:01, 25. Dez. 2009 (CET)

Könnte auch, würde dann aber nicht "kleinste Quadrate" heisen.Nijdam 09:42, 28. Dez. 2009 (CET)
Die Quadratfunktion   kann man Differenzieren und deswegen einfach minimieren,   ist in 0 nicht differenzierbar. Mehr unter en:Least_absolute_deviations (englisch) --Erzbischof 13:28, 28. Dez. 2009 (CET)
Das ist IMHO nicht der ausschlaggebende Punkt (mit der Begründung könnte man genausogut   oder   verwenden). Ich habe es so in Erinnerung, dass die Wahl einer quadratischen Fehlerfunktion ihren Hintergrund in der Messtheorie für fehlerbehaftete Messwerte hat. Die zugrundeliegenden Annahmen sind: 1.) die Modellfunktion hat keine systematischen Fehler, 2.) die Messfehler sind normalverteilt, und -im Falle mehrerer anzupassender Parameter- 3.) die anzupassenden Parameter sind statistisch unabhängig voneinander. Unter diesen Prämissen kann gezeigt werden, dass sich Messfehler (d.h. deren Standardabweichung) proportional zur Wurzel der Summe der Fehlerquadrate summieren. Die least-squares-angepasste Funktion ist dann diejenige Funktion, bei der die Wahrscheinlichkeit am größten ist, dass die beobachtenen Residuen auf Messfehler und nicht auf fehlerhafte Anpassung zurückzuführen sind.-- Belsazar 14:32, 28. Dez. 2009 (CET)
Siehe auch Satz von Gauß-Markow und den vorletzten Absatz in "Geschichtliches". --Zipferlak 14:34, 28. Dez. 2009 (CET)
(BK) Jepp, der Satz von Gauß-Markow... ist ja auch im Artikel verlinkt. --Erzbischof 14:37, 28. Dez. 2009 (CET)
Wobei der Vollständigkeit halber im Artikel evtl. noch ergänzt werden könnte, warum bzw. in welcher Hinsicht "minimalvariant = optimal" ist. --Zipferlak 14:42, 28. Dez. 2009 (CET)
Also diese Bedingungen, die Belsazar da angibt, erklaeren nicht, warum man x^2 nimmt, das sind zwar die Annahmen, die man machen muss, aber sie erklaeren nicht, warum man nicht nx^2m (wobei n und m beliebige natuerliche Zahlen ausser 0 sind) nimmt. Ich habe da nicht lange drueber nachgedacht, aber ich tippe zumindest nx^2 koennte man genausogut nehmen, bloss setzt man n=1 wegen Occams Rasiermesser, oder? Fossa?! ± 15:18, 28. Dez. 2009 (CET)
Nein, es hat eben keine pragmatischen Gründe. Siehe oben: Die least-squares-angepasste Funktion ist diejenige Funktion, bei der die Wahrscheinlichkeit am größten ist, dass die verbleibenden Residuen auf Messfehler und nicht auf fehlerhafte Anpassung zurückzuführen sind. Das gilt nur für die least-squares-angepasste Funktion.-- Belsazar 15:37, 28. Dez. 2009 (CET)
Hmm... "Wahrscheinlichkeit am größten" ist nicht genau die Aussage von Gauß-Markov. --Zipferlak 15:41, 28. Dez. 2009 (CET)
Ich weiß gerade gar nichts mehr: in den Satz von Gauß Markow geht ja die Minimal-Varianz ein, kein Wunder, dass Fehlerquadrate rauskommen, ich muss mir das noch mal anschauen, am Ende läuft es vielleicht darauf hinaus, dass Varianz das geeignete Maß für Abweichungen ist :-) --Erzbischof 15:47, 28. Dez. 2009 (CET)

Dies sollte schon in der Einleitung behandelt werden. Da fast immer dieses verfahren benutzt wird, entsteht der eindruck, es sei das einzige oder "beste". Dieses Verfahren unterliegt aber ganz bestimmten Annahmen/Voraussetzungen, diese sollten an prominenter stelle genannt werden, nicht bloß irgendwo als Verweiß und Nebensatz. Für Messwerte mit starken Ausreißern in eine Richtung ist es ungeeignet! Bei meiner BA hatte ich daten die systematisch einen anderen Effekt beinhalteten der zu Signaleinbrüchen führte (höhere Moden und Interferenzen) da wäre diese Methode fatal gewesen. --Moritzgedig 11:20, 17. Jul. 2011 (CEST)

Das wird ja nicht nur in einem Nebensatz erwähnt, sondern es gibt sogar einen Abschnitt über Anforderungen an die Daten. Die Begründung für die Minimierung der Quadratsumme und die Voraussetzungen für das Verfahren in der Einleitung kurz und allgemeinverständliche zu behandeln, halte ich für schwierg. Denn ein Satz wie "Der Ansatz der Minimierung der Quadratsumme hat bestimmte Vorteile, ist aber nicht in allen Fällen geeignet." wirft auch eher Fragen auf als daß er weiterhilft. Das Verfahren ist ja nicht nur bei Ausreißern nicht optimal. Und ich hoffe, bei Deiner BA hast Du nicht nur diesen Artikel oder gar die Einleitung als theoretische Grundlage benutzt. 217.230.97.115 13:08, 10. Aug. 2011 (CEST)
Ein sehr schwacher Absatz, der sich weniger mit den Annahmen und Voraussetzungen für Eignung, sowie Nachteilen auseinandersetzt als mit Wegen die Eignung herzustellen.--Moritzgedig 15:47, 21. Nov. 2011 (CET)
Es gibt einen weiteren mögliche Grund: Manches Mal möchte man die Fehlerleistung und nicht die Fehleramplitude minimieren. --Moritzgedig 21:32, 26. Nov. 2011 (CET)

Ich will mal versuchen, ganz naiv die Frage des Themenstarters anhand eines Beispiels zu beantworten: Angenommen, ein Experiment liefert zwei Ergebnisse: die Zahlen 3 und 4. Wann wird die Summe der quadratischen Abweichung minimal? Genau für den Mittelwert 3,5. Wann wird die Summe der Absolutfehler minimal? Für jeden Wert zwischen 3 und 4! --Boobarkee 00:52, 27. Nov. 2011 (CET)

Interessant, das war mir noch gar nicht aufgefallen. Aber es beantwortet die Frage eigentlich nicht. Es beantwortet die Frage "Warum nicht einfach die Beträge?" Die Argumentation schließt nur die 1-Norm aus, also nur genau die 1. Potenz, nicht aber ^1,000001 oder ^0,999999. --Moritzgedig 19:33, 28. Nov. 2011 (CET)
Genau das war die urspr. Frage: "warum zur Bestimmung der Kurvenparameter die Summe der QUADRATE der Punktabweichungen minimiert wird - und nicht die Summe der Absolutabstände." --Boobarkee 20:28, 28. Nov. 2011 (CET)
Für den Fall das die Fehler der Daten unabhängig und normalverteilt sind, ist die Minimierung der Summe der Quadrate gleich der Maximum-Likelihood-Methode und damit oft (aber zumindest asymptotisch) der beste Schätzer. Die Normalverteilung ist oft keine so schlechte Annahme für reale Messwerte, wenn auch nicht immer. Dazu kommt noch ein praktischer Grund: Bei linear auftretenden Parametern (z.B. Polynomkoeffizienten) führt die Minimierung der Quadrate zu einem lösbaren linearen Gleichungssystem, ist also vergleichsweise leicht auch ohne Computer zu lösen.--Ulrich67 (Diskussion) 22:45, 1. Apr. 2012 (CEST)
Es ginge bei den Beträgen der Abstände ganz einfach das Vorzeichen der Abweichung(Differenz) nach der Differenziation verloren. Diese Identität ist ja weiterhin eine notwendige Information. Ist zumindest meine persönliche Erklärung. (nicht signierter Beitrag von 128.131.194.69 (Diskussion) 12:27, 12. Mai 2012 (CEST))