Diskussion:Ausgleichungsrechnung

Letzter Kommentar: vor 3 Jahren von OlafTheScientist in Abschnitt Beispiel: Ebene bester Anpassung

Zusammenfassung

Bearbeiten

Dieser Artikel sollte mit Methode der kleinsten Quadrate und Regressionsanalyse verwurstet werden. Dabei steht fuer mich erstmal die Frage im Vordergrund: ist Ausleichungsrechnung synonym mit Regressionsanalyse oder nicht? Viele Gruesse --DaTroll 14:25, 7. Okt 2004 (CEST)

Wie immer, teils MKQ, teils RA. Ich schaus mir mal morgen (eig. heute) an. Viele Grüße --Philipendula 01:22, 12. Okt 2004 (CEST)


Es fehlt ein REDIRECT von Parameteranpassung auf Ausgleichsrechnung. 84.154.229.216 10:45, 22. Aug 2006 (CEST)
Nein, das eine ist ein Problem, das andere ein Verfahren zur Loesung von Problemen. Entsprechend sind die Begriffe nicht synonym. --P. Birken 11:04, 22. Aug 2006 (CEST)


Hab grade bemerkt, dass dieser Artikel mit dem englischen Artikel "Curve Fitting" verknüpft ist. Das halte ich für nicht ganz korrekt. Allein schon, dass die gebräuchlichste Übersetzung des festen Begriffs "Ausgleich(ung)srechnung" der englische Term "adjustment theory" ist.

Statistik

Bearbeiten

Der ganze Themenbereich der Statistik krankt an der Mangelnden Unterscheidung zwischen Fits, Regression, Ausgleichsrechnung usw. Da werden DInge in einen Topf geworfen, die zwar verwandt sind, aber doch unterschiedlich sein können! Ich habe einen ersten Versuch unternommen, wenigstens hier eine Unterscheidung einzubauen. Die Formatierung ist im Moment noch nicht so doll. Ich Werde auch mal probieren, einen schönen Plot mit der Einhüllenden aller Kurvenscharen der Beispielfits im 65% Konfidenzgebiet (Ebene der Funktionsparameter a,b) hinzubekommen.Nummer62 15:06, 12. Nov. 2009 (CET)Beantworten

Der Versuch hier eine sinnvolle Verbindung zwischen Ausgleichungsrechnung und Regressionsrechnung bzw. den Unterschied herauszuarbeiten ist wenig hilfreich für die Definition dafür, was man unter Ausgleichsrechnung versteht. Klar da gibt es viele Gemeinsamkeiten und ein paar kleine, aber feine, Unterschiede. Fakt ist, das die eine Wissenschaft die Methode "Ausgleichungsrechnung" pflegt und hegt und die andere die Methode "Regression". Es kann nicht unsere Aufgabe sein, an dieser Stelle diese Wissenschaften zu vereinheitlichen. Ich kenne mich in Sachen Ausgleichsrechnung recht gut aus und weiß, das sie auch die Regression mit abdeckt. Man muss nur andere Wörter benutzen. Mein Vorschlag: Weg mit dem Vergleich Ausgleichungsrechnung-Regression --Xdesy 23:06, 21. Dez. 2009 (CET)

Debn Begriff Fit im Zusammenhang mit Ausgleichungsrechnung zu verwenden zeugt von mangelndem Wissen über die Ausgleichungsrechnung. Fit ist doch nur das englische Wort für Anpassung. Oder? Was soll das? --Xdesy 23:06, 21. Dez. 2009 (CET)

"Fit" ist halt eine der am häufigsten benutzten Bezeichnungen für solche Rechnungen. Ich komme ja mehr von der Messungsauswertung und tatsächlicher Anpassungsrechnung (aka Fit) zur Ermittlung von physikalischen Stoffparametern, die als Funktionsparameter aus der Kurvenanpassung herauskommen, die Statistik interessiert da nur nebenbei zur Abschätzung der verbleibenden Fehlerbalken bei jenen Parametern. Ich sage auch eher Anpassungs- als Ausgleichungsrechnung. Das gehört aber schon zu diesem Lemma, ist bloß je nach Fachrichtung (oder Uni) eine leicht variierende Ausdrucksweise, denke ich, nicht unbedingt mit tieferen Sachunterschieden. --PeterFrankfurt 01:17, 22. Dez. 2009 (CET)Beantworten
Offenbar ist niemand mit der Änderung von Nummer62 einverstanden und trotzdem wird meine Nachfrage zu Belegen für den Abschnitt grundlos rückgängig gemacht. Was soll das? -- 129.247.247.239 11:18, 19. Aug. 2010 (CEST)Beantworten
Offenbar siehst Du das nicht richtig. Ich finde die Darstellung durch Nummer62 (Unterschiede zwischen Regression und Fit) völlig korrekt und sehe auch keinerlei Belege zu Deinen Einwänden. --PeterFrankfurt 01:43, 20. Aug. 2010 (CEST)Beantworten
Pardon, da hatte ich dich missverstanden. Der Revert von papinian war jedenfalls unbeabsichtigt: Benutzer_Diskussion:-papinian-#Ausgleichsrechnung.
Worum es mir geht, sind Aussagen wie "Dabei haben die Datenpunkte keine Unsicherheiten bzw. Messfehler." im Abschnitt über die Regression und "Die geläufigste Methode eines Fits ist die Methode der kleinsten Quadrate, wobei eine gaußverteilte Messwertunsicherheit angenommen wird." im Abschnitt über den Fit. Im Artikel Regressionsanalyse wird mehrmals auf die Methode kleinster Quadrate als Beispiel hingewiesen und das Residuum wird explizit auch als Fehler bezeichnet. Und so findet man es auch häufig in der Literatur. Die hier gemachte Unterscheidung zwischen Regression und Fit ist so nicht nachvollziehbar. Deswegen sollte der Abschnitt überarbeitet werden. -- 129.247.247.239 14:05, 20. Aug. 2010 (CEST)Beantworten

MSE

Bearbeiten

"Bei zufällig verteilten Modell- oder Messfehlern führt dies zum wahrscheinlichsten Wert für die zu berechnenden Unbekannten."
"nach der Methode der kleinsten Quadrate ... dass die Quadratsumme der Messabweichungen aller Beobachtungen minimal wird. Die Messdaten stimmen dann erwartungstreu mit dem theoretischen Modell überein."
Das stimmt so allgemein nicht, sondern nur für bestimmte Zufallsprozesse wie solche die Normalverteilt sind. Warum wird hier der Median nicht einmal genannt?
02:17, 19. Sep. 2013‎ PeterFrankfurt (Änderung 122666175 von Moritzgedig rückgängig gemacht; das ist hier fehl am Platz, müsste anders eingeführt werden und ist mir praktisch auch noch nie untergekommen)
Was soll das? Wenn es anders eingeführt werden muss, dann machen Sie es doch. Der Rest ist entweder falsch oder kein Argument. --Moritzgedig (Diskussion) 22:08, 25. Sep. 2013 (CEST)Beantworten

Oh, kann es sein, dass es da in den Anwendungsgebieten viel größere Unterschiede gibt als gedacht? So, wie ich die Ausgleichungsrechnung angewendet habe (als Physiker eine Messung durchgeführt, per Ausgleichungsrechnung daraus meine Stoffparameter ermittelt), wurde niemals auch nur im entferntesten ein Median verwendet. Dagegen kann ich mir theoretisch vorstellen, dass der bei Statistikauswertungen durchaus eine Rechnung spielen könnte. Ist dem so? Dann müsste man gewisse Passagen womöglich etwas allgemeiner formulieren oder explizit auf verschiedene Ausprägungen eingehen. - Zu den Punkten davor: Soviel ich mich erinnere, ist der Einwand "Das stimmt so allgemein nicht" selber nicht, weil genau diese geforderten Fallspezifikationen schon hinreichend/ausreichend in den Einschränkungen genannt sein sollen, hat mal ein Mathematiker so eingebracht. --PeterFrankfurt (Diskussion) 03:40, 26. Sep. 2013 (CEST)Beantworten
"So, wie ich die Ausgleichungsrechnung angewendet habe (als Physiker eine Messung durchgeführt, per Ausgleichungsrechnung daraus meine Stoffparameter ermittelt)" Das habe ich nicht anders gemacht. Was wir beide in unserer Praxis gemacht haben ist aber unwichtig. Die Frage ist doch welches Minimierungskriterium Sie wählen oder genauer: "Welche statistische Verteilung haben die Fehler?" In Ihrem Fall haben Sie offenbar MSE gewählt. Vermutlich "weil man das halt so macht". Ich habe aber "Minimum der absoluten Differenzen" gewählt. Und was ist das Minimum der absoluten Differenzen? Der Median. "Soviel ich mich erinnere, ist der Einwand "Das stimmt so allgemein nicht" selber nicht, weil genau diese geforderten Fallspezifikationen schon hinreichend/ausreichend in den Einschränkungen genannt sein sollen, hat mal ein Mathematiker so eingebracht." Den Satz verstehe ich kaum. --Moritzgedig (Diskussion) 20:28, 28. Sep. 2013 (CEST)Beantworten
Der letzte Satz sollte zart andeuten, dass nicht ich jene Passagen formuliert habe, sondern meiner Erinnerung nach einer der anwesenden Mathematiker, der meinte, dass die Voraussetzungen wie z. B. Normalverteilung (o. ä. mehr) erwähnt seien, und dass dann die Methode der kleinsten Quadrate fugendicht angewandt werden könne. In dieser Richtung bewegten sich damals auch die Untersuchungen, die ich selbst zu meinen Messergebnissen angestellt hatte. Ist das nicht im zweiten Absatz der Einleitung angesprochen? --PeterFrankfurt (Diskussion) 03:12, 30. Sep. 2013 (CEST)Beantworten
Ich hab die fragliche Stelle mal ein bisschen umformuliert und umgestellt, besser? Das mit der Erwartungstreue sollte aber schon so stimmen, zumindest braucht man da keine Normalverteilung, oder übersehe ich was? -- HilberTraum (Diskussion) 12:39, 29. Sep. 2013 (CEST)Beantworten
Was mir immer noch nicht gefällt, ist dass die Begriffe "Median" und (arithmetischer) Mittelwert\Durchschnitt nicht genannt werden. Ich habe einen Hinweis auf den Median eingebaut und dieser wurde entfernt. Bei Ausgl.rech. mit MSE ist es das Ziel, die Parameter so zu bestimmen, dass die Funktion durch den Durchschnitt der Messwerte verläuft. (Das gilt nur wenn man an einer Stelle mehrere Messwerte hat, bei regression, fit hat man aber messwerte an verschiedenen Stellen.) Median und Durchschnitt sind also wichtig für die Ausgleichsrechnung. --Moritzgedig (Diskussion) 11:26, 30. Sep. 2013 (CEST)Beantworten
Hmm, ich denke, dass das an dieser Stelle eigentlich nicht so wichtig ist: Primär geht es ja erst mal darum, die unbekannten Parameter zu finden, die die Residuen im betrachteten Sinn minimieren und erst in zweiter Linie um die Verteilung der Residuen bzw. deren Kennzahlen wie dem Median. Auch wenn man die Summe der Absolutbeträge betrachtet, bestimmt man ja nicht irgendwelche Mediane, sondern verwendet ein Simplexverfahren oder ähnliche Algorithmen. -- HilberTraum (Diskussion) 20:22, 30. Sep. 2013 (CEST)Beantworten
Wenn der Median bei bestimmten Anwendungen wichtig ist, dann sollte er auch erwähnt werden. Nur war die damalige Formulierung so pauschal, als ob das die einzige, standardmäßige Methode wäre. Wenn das entsprechend eingeschränkt wird, z. B. auf statistische Anwendungen, dann kann das locker wieder rein. Es darf nur keinen Alleinvertretungsanspruch reinbringen. Genauso mit dem Mittelwert. Weder ein Mittelwert noch ein Median kamen in den von mir durchgeführten Rechnungen vor, aber dazu langt meine Vorstellungskraft noch aus, dass das in anderen Fällen vorkommt. --PeterFrankfurt (Diskussion) 02:32, 1. Okt. 2013 (CEST)Beantworten
Weil Sie vermutlich bei verschiedenen Frequenzen indirekte Messwerte hatten, die mit einer nicht umkehrbaren (nicht bijektiven) Funktion vom eigentlich gesuchten Wert abhängig sind. Was hätten Sie gemacht wenn Sie den gesuchten Wert direkt hätten messen können, aber an 5 unterschiedlich geformten Materialproben oder die Funktion umkehrbar gewesen wäre? Da zeigt sich der Zusammenhang; der MSE ist für die A. das, was für eine direkte Messung der Durchschnitt ist. Hätten Sie den MSE auch genutzt, wenn Sie gewusst hätten, dass Ihre Messungen sporadisch von externen Ereignissen wie Radioaktivität oder Höhenstrahlung gestört werden? Ich gebe zu, dass die Art und Weise wie ich versucht habe es hier einzubringen unzureichend war. Wenn die Ausgleichsrechnung nur für einen Parameter statt findet, besteht ein direkter Zusammenhang zu Punktschätzern. --Moritzgedig (Diskussion) 13:07, 1. Okt. 2013 (CEST)Beantworten
Wir kommen anscheinend aus ziemlich verschiedenen Welten. Ich kann diese Darstellung leider überhaupt nicht nachvollziehen. Zur Illustration, was ich zur Anwendung kennengelernt und für mich ausgebaut habe, kann vielleicht der Artikel Reflexionsspektroskopie beitragen. Es geht mitnichten nur um einen Parameter, sondern um eine ganze Reihe davon, bei deutlich mehr Messwerten als Parametern. Damals wurden Kurven noch analog aufgenommen und dann von Hand digitalisiert, um sie fitten zu können, da hat man sich (auch angesichts der Rechenzeiten im Bereich mehrerer Stunden) mit z. B. 45 Messpunkten für 7 Parameter begnügt. --PeterFrankfurt (Diskussion) 03:32, 2. Okt. 2013 (CEST)Beantworten

"Wir kommen anscheinend aus ziemlich verschiedenen Welten." Nein, ganz und gar nicht. Ich habe das Selbe im Bereich um 1 GHz gemacht. Auch ich hatte mehr als einen Parameter, aber das macht dann keinen Unterschied mehr ob 2 oder 3. Ich konnten deshalb keinen Durchschnitt oder Median nehmen, weil in Messwert=f(g(Frequenz)) die bekannte Funktion f nicht umkehrbar war. Sonst hätte ich für jede Probe und Frequenz das Mittel von f^(-1)(Messwert) nehmen können und hätte die Funktion g() nur noch interpolieren müssen um auf ein vergleichbares Ergebnis zu kommen. --Moritzgedig (Diskussion) 15:08, 2. Okt. 2013 (CEST)Beantworten

Das ist ja wohl der Normalfall, dass die Theoriefunktion nicht umkehrbar ist (bei mir: Schleife zur Aufsummierung der Beiträge mehrerer Einzelterme plus weiterer). Aber es gibt dann halt am Ende eine Theoriefunktion f(x), wobei f die gemessene physikalische Größe ist und x die variierte. Man wertet mehrere Messpunkte einer Kurve aus, bildet daraus die Fehlerquadratsumme und benutzt diese als zu minimierende Fehler-/Kostenfunktion. Wenn ich keine Gewichtung einführe, und dafür gab es bei mir keinen Anlass, gehen alle Punkte gleichwertig in die Rechnung ein. Ob ich das als arithmetischen Mittelwert ansehen kann, ist mir nicht ganz klar, denn für die Funktion f selbst würde ein Mittelwert keinerlei Sinn ergeben, nur für die Fehlerbetrachtung. Ein Median ist das keinesfalls, und der würde für dieses Problem auch keinerlei Sinn ergeben. --PeterFrankfurt (Diskussion) 04:20, 3. Okt. 2013 (CEST)Beantworten

"zufällig"

Bearbeiten

Zur Methode der kleinsten Quadrate die hier ja auch angeschnitten wird:

"Bei zufällig verteilten Modell- oder Messfehlern führt dies zum wahrscheinlichsten Wert für die zu berechnenden Unbekannten."

Das zufällig gefällt mir hier nicht, wie wäre es mit "Wenn die Verteilung von Modell- oder Messfehlern bestimmte Eigenschaften erfüllt (Satz von Gauß-Markow), führt dies […]" und wäre das auch richtig? --Unverbluemt (Diskussion) 12:42, 26. Aug. 2014 (CEST)Beantworten

Regression

Bearbeiten

Wenn ich mir den Artikel durchlese, habe ich den Eindruck, dass das, was umseitig einfach „Regression“ genannt wird, tatsächlich das stochastische Verfahren der Linearen Regression meint. Falls dem tatsächlich so ist, sollte der entsprechende Artikel auch verlinkt werden, ansonsten käme noch jemand auf die Idee, dass das umseitig als „Regression“ beschriebene Verfahren etwas eigenes, unabhängiges wäre. Auf der BKS Regression wird das jedenfalls aktuell suggeriert... --Gretarsson (Diskussion) 10:10, 25. Jan. 2017 (CET)Beantworten

Momentan ist Regressionsanalyses gelinkt. (?) StatistikusMaximus (Diskussion) 23:06, 1. Mai 2020 (CEST)Beantworten

Beispiel: Ebene bester Anpassung

Bearbeiten

@Biggerj1: In dem kürzlich hinzugefügten Beispiel sehe ich zwei formale Probleme: die Exponenten-Schreibweise für die drei Raumkoordinaten und die Vektorschreibweise ohne Pfeil. Beides verwirrt mich doch ziemlich. Anstatt der Exponenten-Schreibweise könnte man doch einfach x, y, z nehmen. Und wenn du beim Vektor keinen Pfeil verwendest, dann muss es wenigstens fett geschrieben sein. Ansonsten besteht die Gefahr, dass man es mit der x-Koordinate verwechselt. --OlafTheScientist (Diskussion) 03:50, 2. Aug. 2021 (CEST)Beantworten

Darüber hinaus bin ich doch etwas verwirrt über dieses Beispiel. Die Ausgleichungsrechnung, die ich vom Studium Vermessungswesen kenne, benötigt irgend ein Normalgleichungssystem, welches gelöst werden muss. Das finde ich hier nicht!? Und dass die Lösung der Ausgleichung durch Bestimmung des Eigenwertes gefunden wird, hab ich noch nie gehört - was nichts heissen muss. Ist das tatsächlich eine Methode der kleinsten Quadrate? Oder vereinfacht sich da was im linearen Fall gegenüber dem nicht-linearen Fall, letzteres muss ja mittels Taylor-Approximation und geeignetem Iterationsverfahren gelöst werden? --OlafTheScientist (Diskussion) 03:50, 2. Aug. 2021 (CEST)Beantworten

Hallo Olaf, gerne können wir die Notation ändern. Sie kommt, wie im Kommentar festgehalten, von einem anderen Autor. Die Funktion, die minimiert wird, misst die quadratische Abweichung der Punkte von der Ebene. Statt wie vom ursprünglichen Autor beschrieben, könnte man auch direkt damit anfangen. biggerj1 (Diskussion) 12:56, 2. Aug. 2021 (CEST)Beantworten
Bezüglich der Notation: wäre ich sehr dafür die so zu ändern, wie man das üblicherweise macht, Vektor   und deren Koordinaten   oder alternativ  .
Nachdem ich in den letzten Tagen ziemlich viel recherchiert habe, bin ich zu der Erkenntnis gelangt, dass ich eine Wissenslücke hatte (oder ich hab's einfach wieder vergessen) bezüglich der Lösung mittels Bestimmung der Eigenwerte. Tatsächlich handelt es sich bei der Berechnung um ein lineares Ausgleichsproblem, dass mittels Eigenenwertermittlung (z. B. durch QR-Zerlegung) gleichzeitig die L_2-Norm minimiert (s. QR-Zerlegung#Lösung_regulärer_oder_überbestimmter_Gleichungssysteme). Das war mir nicht bekannt. In der Literatur zur Ausgleichungsrechnung in der Geodäsie wird die Lösung i. d. R. anders beschrieben. Das macht es zusätzlich schwierig die Beispiele zu verstehen.--OlafTheScientist (Diskussion) 22:23, 4. Aug. 2021 (CEST)Beantworten