Diskussion:Anwendung von Gaußprozessen

Zur Entstehung des Artikels

Bearbeiten
  • Teile dieses Artikels waren zunächst Bestandteil des Artikels Gauß-Prozess. Dort wurden sie am 29. Juli 2023 um 16:42 von Physikinger gelöscht und von diesem angegeben, es handele sich um eine „Auslagerung nach Anwendung von Gaußprozessen“.
  • Am 29. Juli 2023 um 16:21 wurde von Physikinger der Artikel Anwendung von Gaußprozessen angelegt und angegeben, es handele sich um eine „Auslagerung aus Gauß-Prozess“.
  • Dieser Vorgang erfolgte nicht nach den Wikipedia-Regeln zur Auslagerung. Insbesondere erfolgte keine Ankündigung und keine lizenzkonforme Auslagerung durch Duplikation, so dass Autorschaften nur noch über alte Versionen des Artikels Gauß-Prozess ermittelbar sind. Auch wurde die betreffenden Diskussionsinhalte nicht übertragen.
  • Eine weitere Besonderheit ist, dass am 29. Juli 2023 nicht die dem Artikel Gauß-Prozess entnommenen Teile in den Artikel Anwendung von Gaußprozessen eingestellt wurden, sondern Teile aus einer älteren Version des Artikels Gauß-Prozess. Es wurde dabei nicht dokumentiert, auf welche ältere Version (wahrscheinlich vor dem 27. Juli 2023) zurückgegriffen wurde.
Durch dieses Vorgehen wurden durch Physikinger meine Korrekturen und Verbesserungen so gelöscht, dass diese Löschungen nicht mehr rückgängig gemacht werden können, da sie nicht mehr in der Versionsgeschichte des neuen Artikels erscheinen. Dies betrifft mindestens die folgenden Änderungen aus den Tagen 28. und 29. Juli 2023: Spezial:Diff/235930049, Spezial:Diff/235929240, Spezial:Diff/235924571, Spezial:Diff/235922522, Spezial:Diff/235909976, Spezial:Diff/235909953, Spezial:Diff/235909961, Spezial:Diff/235909967, Spezial:Diff/235909950, Spezial:Diff/235891457, Spezial:Diff/235924258, Spezial:Diff/235891405, Spezial:Diff/235891159, Spezial:Diff/235891138.
  • Physikinger hat am 2. August 2023 einen Löschantrag für den Artikel Anwendung von Gauß-Prozessen gestellt.
  • Physikinger hat am 6. August 2023 große Teile des Artikels gelöscht, ohne das Ergebnis der Löschdiskussion abzuwarten.
  • Physikinger hat am 8. August 2023 die am 6. August 2023 gelöschten Teile wiederhergestellt und den Löschantrag zurückgezogen.

--Sigma^2 (Diskussion) 13:24, 14. Sep. 2023 (CEST)Beantworten

Diese Diskussionseite dient ausschließlich der Verbesserung des Artikels. Wenn du hier auf persönliche Angriffe aus bist, dann suche dir bitte jemand anders. --Physikinger (Diskussion) 23:38, 14. Sep. 2023 (CEST)Beantworten
Es geht nicht um persönliche Angriffe, sondern um die Wikipedia-übliche Dokumentation der Historie aller Änderungen und Autorschaften eines Artikels. Zudem sind über zwanzig meiner Korrekturen und Verbesserungen mit einem Trick (Löschen in einem Artikel, Einfügen einer älteren Version in einem neuen Artikel, angebliche "Auslagerung") so gelöscht worden, dass ich die Löschungen nicht rückgängig machen konnte. Noch bin ich nicht dazu gekommen, meine ursprünglichen Korrekturen und Verbesserungen durchzugehen. Zunächst habe ich mal die einschlägigen Diskussionen aus dem Artikel Gauß-Prozess hierher kopiert, die noch mehrere unerledigte Kritikpunkte beinhalten. --Sigma^2 (Diskussion) 00:17, 15. Sep. 2023 (CEST)Beantworten
Du hast deine Änderungen mit einem Ziel vorgenommen, die nicht dem des Artikels entsprachen. Inzwischen habe ich den Artikel umbenannt, so dass die Zielsetzung klar ist. Die meisten deiner Verbesserungen sind trotzdem im Artikel integriert, ich habe sie zum Teil nachgetragen. Aber ich war nicht mit allem einverstanden. Z.B. deine erweiterte Tabelle hat ganz und gar nicht zu meiner ursprünglichen didaktischen Intention gepasst, die drei Arten von Verteilungen zu zeigen, die eindimensionale, mehrdimensionale und unendlichdimensionale. Die zusätzliche Zeile und zusätzliche Spalte ist schon wieder zu viel Information an dieser Stelle und wirft neue Fragen auf. Ich fände es auch nicht verkehrt, wenn du die von dir erweiterte Tabelle zusätzlich in den Artikel Gauß-Prozess integrierst, wenn es in einen bestimmten Abschnitt passt. Aber hier geht es nur um die Symmetrie zwischen den drei Notationen. --Physikinger (Diskussion) 23:29, 18. Sep. 2023 (CEST)Beantworten

Erzeugung von Realisierungen von Gauss-Prozessen

Bearbeiten

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger aus dem Artikel Gauß-Prozess in den Artikel Anwendung von Gaußprozessen migriert wurde.

Der Artikel befasst sich sehr viel mit der statistischen Inferenz. Wäre nicht ebenso der ein Verweis auf die Langevin-Gleichung angebracht um aufzuzeigen, wie in manchen Anwendungsfeldern Daten erzeugt werden, die Gauss-Prozesse sind? Langevin-Gleichungen werden häufig in Molekulardynamik-Simulationen numerisch gelöst. biggerj1 (Diskussion) 21:55, 16. Jan. 2022 (CET)Beantworten

Das sehe ich anders. Was ich völlig vermisse, ist irgendetwas zur statistischen Inferenz (Schätzung von Parametern eines Gauß-Prozess aus einer beobachteten Prozessrealisation, Tests, Konfidenzbänder usw.). Der Abschnitt Gaußprozess-Regression ist wesentlich von einem Nicht-Statistiker aus einem Anwendungsbereich geschrieben, in dem kalibriert, aber nicht statistisch geschätzt wird. Alle Begriffe wie "A-priori-Schätzung" usw. sind nicht verlinkt, nicht belegt und klingen nach WP:TF. Es mag sein, dass es in irgendeinem Anwendungsbereich (Physik, Finanzmarktanalyse oder Maschinelles Lernen) so gemacht und auch diese Begriffe erfunden wurden, aber als enzyklopädischer Beitrag zu Gaußprozessen ist der Abschnitt problematisch. Mit dem A-priori und A-Posteriori der Bayesschen Statistik besteht wohl kein Zusammenhang. Falls doch, werden statistische Fachbegriffe nur so ungefähr verwendet und neue Begriffe erfunden.--Sigma^2 (Diskussion) 12:25, 28. Jul. 2023 (CEST)Beantworten
Die gesamte Sprechweise ist an die Literatur von C. E. Rasmussen angepasst, der dem Gebiet der Gaußprozesse zum Durchbruch verholfen hat. Der gesamte Artikel orientiert sich im Wesentlichen am Lehrbuch. --Physikinger (Diskussion) 20:51, 28. Jul. 2023 (CEST)Beantworten
Gaußprozesse sind in der Theorie stochastischer Prozesse nicht sonderlich neu, sondern eine der zuerst behandelten Klassen stochastischer Prozesse. Dabei geht es um das 19. und 20. Jahrhundert. Wo soll denn da Rasmussen einen Durchbruch gebracht haben? Ich bitte Dich, die neu eingeführten Begriffe zu verlinken oder mit einem Einzelnachweis auf das Buch von Rasmussen zu versehen. Ich habe auch ernsthafte Zweifel, ob überhaupt ein Artikel über Gaußprozesse in einer Enzyklopädie die richtige Stelle ist, um ausführlich darzustellen, wie ein Informatiker in einem Lehrbuch über maschinelles Lernen seine Sicht über stochastische Prozesse wiedergibt. Viele Begriffe wirken auf mich wie ad hoc erfunden, aus der Informatik übernommen oder falsch übersetzt.--Sigma^2 (Diskussion) 00:12, 29. Jul. 2023 (CEST)Beantworten
Die gesamte Literatur zum Thema Gaußprozess ist sehr von der Anwendung geprägt und ich bin überzeugt, dass die meisten Leser der Wikipedia auch dieser Aspekt am meisten interessiert. Für die mehr mathematischen und theoretischen Details ist der Artikel zum stochastischen Prozess ideal geeignet. Du hast dort auch einen sehr guten Anfang gemacht, den Artikel zu verbessern und da der Artikel immer noch relativ kurz ist, wäre dort der ideale Ort, um die theoretischen Aspekte zu vertiefen.
Ich habe hier mit Sicherheit nichts erfunden, aber die verschiedenen Wissenschaften haben da durchaus andere Sprechweisen. --Physikinger (Diskussion) 09:53, 29. Jul. 2023 (CEST)Beantworten
Um den Konflikt zu umgehen, habe ich jetzt im Wesentlichen alles von mir hinzugefügte ausgelagert in einen speziellen Artikel zur Anwendung von Gaußprozessen. Siehe neuen Abschnitt unten. --Physikinger (Diskussion) 18:45, 29. Jul. 2023 (CEST)Beantworten

Aus der Diskussion zum Artikel Gauß-Prozess hierher kopiert. Die Diskussionspunkte sind inhaltlich nicht erledigt.--Sigma^2 (Diskussion) 13:39, 14. Sep. 2023 (CEST)Beantworten

Einleitung

Bearbeiten

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger aus dem Artikel Gauß-Prozess in den Artikel Anwendung von Gaußprozessen migriert wurde.

Erster Satz

Bearbeiten

„Ein Gaußprozess (nach Carl Friedrich Gauß) ist in der Wahrscheinlichkeitstheorie ein stochastischer Prozess mit der Eigenschaft, dass jede endliche Teilmenge mehrdimensional normalverteilt (gaußverteilt) ist.“ Endliche Teilmenge von welcher Menge? Ein Gaußprozess ist keine Menge. Fachbegriffe sollten auch in der Einleitung nicht falsch verwendet werden. --Sigma^2 (Diskussion) 11:41, 28. Jul. 2023 (CEST)Beantworten

Bei Rasmussen findet man auf Folie 10 diese Definition: "a Gaussian process is a collection of random variables, any finite number of which have (consistent) Gaussian distributions." --Physikinger (Diskussion) 21:25, 28. Jul. 2023 (CEST)Beantworten
Mit dieser Vortragsfolie hätte niemand ein Problem. Dort steht gerade nichts von Mengen. Verstehst Du denn nicht, dass Teilmenge ein mathematischer Fachbegriff und keine Umgangssprache ist? Dass es dann, wenn es eine Teilmenge gibt, auch eine Menge geben muss. Vorbeugend für diesen Fall des Nichtverstehens habe ich weiter unten das Beispiel 1 geschrieben. Mach Dir bitte klar, was der Unterschied zwischen einer Menge einerseits und einem Vektor (einer Folge, einer Familie) andererseits sind. Eine collection ist keine Menge, sondern mathematisch gesehen eine Familie. --Sigma^2 (Diskussion) 23:32, 28. Jul. 2023 (CEST)Beantworten
Wollen wir den toxischen Ton nicht einfach mal sein lassen. "Du verstehtst nicht...". Was habe ich dir denn getan? Ich weiß noch nicht mal, ob ich den ersten Satz überhaupt geschrieben habe. --Physikinger (Diskussion) 09:59, 29. Jul. 2023 (CEST)Beantworten
Wenn Du das als toxisch empfunden hast, tut es mir leid. Ich habe - nicht an Dich adressiert - geschrieben: „Endliche Teilmenge von welcher Menge? Ein Gaußprozess ist keine Menge. Fachbegriffe sollten auch in der Einleitung nicht falsch verwendet werden.“ Was ist daran nicht zu verstehen? Ich erhalte dann einen Satz von einer Vortragsfolie, an dem nichts falsch ist, der aber weder das Wort Teilmenge noch Menge enthält. Bei dieser Form von Belehrung fragt man sich dann schon, ob der Belehrende die Eingangsfragen verstanden hat.--Sigma^2 (Diskussion) 12:25, 29. Jul. 2023 (CEST)Beantworten
Hallo ihr zwei, ich melde mich nur mal kurz als Unbeteiligter um die Gemüter etwas zu besänftigen. Ich schätze die Beiträge von Sigma^2 extrem, da er/sie sehr fachkundig ist und die Artikel meiner Erfahrung nach extrem verbessert und dabei auch Details korrekt darstellen kann. Wenn er einen Punkt ankreidet, wird an der Sache auch etwas dran sein. Angewandte Wissenschaften, sind nicht für die strenge der Begriffe bekannt. Ungenauen Slang (selbst wenn er sich in der angewandten Literatur fände) würde ich nicht im Hauptartikel erwarten. Wenn das bedeutet mache Abschnitte lieber zu streichen, würde ich es unterstützen (und das ist einfach ohne Vorwurf gemeint, ich bin mir sicher, dass ich manche Details selbst nicht 100% beschreiben könnte) Liebe Grüße! :) biggerj1 (Diskussion) 12:48, 29. Jul. 2023 (CEST)Beantworten
Das will ich nicht bestreiten. Sigma^2 hat eine wirklich großartige Formulierung für die Einleitung beim Stochastischen Prozess gefunden, was ich auch sehr gelobt habe. Und die Fähigkeit, Dinge in einfachen Worten klar ausdrücken zu können ist meist mit einem tiefen sachlichen Verständnis verbunden. Aber hier besteht eher ein Interessenskonflikt zwischen angewandten Wissenschaften und reiner Mathematik. Der Konflikt ist leicht aufzulösen, indem das ohnehin stark von Anwendungen geprägten Thema Gaußprozess auch diesen Fokus behält, während der Artikel zum stochastischen Prozess, der als Allgemeinfall mehr von theoretischem Interesse ist, diese Sprache der Mathematik vertiefen kann. In diesem Artikel hier steckt wirklich geballtes Wissen, um sehr anspruchsvolle praktische Probleme zu lösen. Das wird man erst zu schätzen wissen, wenn man selbst mit einem Problem konfrontiert ist und hier Antworten findet. Wenn Mathematiker hier nicht fündig werden, ist der stochastische Prozess nur ein Klick weit entfernt. --Physikinger (Diskussion) 13:16, 29. Jul. 2023 (CEST)Beantworten
Ok, also vielleicht könnte man schreiben: "Ein Gaußprozess ist ein stochastischer Prozess, bei dem jede Menge von Werten einer multivariaten Normalverteilung folgt." --Physikinger (Diskussion) 13:33, 29. Jul. 2023 (CEST)Beantworten
Ich habe jetzt mal diesen Bezug auf seine Werte eingefügt: "Ein Gaußprozess [...] ist [...] ein stochastischer Prozess mit der Eigenschaft, dass jede endliche Teilmenge seiner Werte mehrdimensional normalverteilt (gaußverteilt) ist." --Physikinger (Diskussion) 13:45, 29. Jul. 2023 (CEST)Beantworten
Ich habe die Einleitung des Artikels zur Familie (Mathematik) etwas umgeschrieben. Jetzt sollte eigentlich jedem klar sein, was eine Familie ist und die Ausrede, dass das nur ein Begriff ist, welcher Mathematiker lernen (was nicht stimmt), zählt nicht mehr.--Tensorproduct 09:38, 18. Sep. 2023 (CEST)Beantworten

Vierter Satz

Bearbeiten

„Ein Gaußprozess wird speziell aus Funktionen der Erwartungswerte, Varianzen und Kovarianzen konstruiert [...].“

Das liegt irgendwo zwischen völlig unverständlich und falsch. Möglicherweise ist Ursache die Verwechselung von Prozess mit dessen Wahrscheinlichkeitsverteilung, die sich auch im weiteren Verlauf des Artikels manifestiert.--Sigma^2 (Diskussion) 12:52, 29. Jul. 2023 (CEST)Beantworten

„[...] beschreibt damit die Funktionswerte als ein Kontinuum aus korrelierten Zufallsvariablen in Form einer unendlichdimensionalen Normalverteilung.“

Warum Kontinuum? Die Indexmenge eines Gaußprozesses kann endlich sein, abzählbar unendlich (Folge), ein Teilintervall der reellen Zahlen (das könnte man dann als Kontinuum (Mathematik) bezeichnen) oder ein allgemeinere Menge.
Warum korrelierte Zufallsvariablen? Ein sehr häufig verwendeter Gaußprozess ist eine Folge stochastisch unabhängiger und identisch normalverteilter Zufallsvariablen, dabei sind alle Zufallsvariablen paarweise unkorreliert.--Sigma^2 (Diskussion) 12:52, 29. Jul. 2023 (CEST)Beantworten

Fünfter Satz

Bearbeiten

„Ein Gaußprozess ist somit eine Wahrscheinlichkeitsverteilung von Funktionen.“

Das ist elementar falsch: Ein stochastischer Prozess ist keine Wahrscheinlichkeitsverteilung. Eine Folge von Zufallsvariablen ist keine Wahrscheinlichkeitsverteilung. Ein Zufallsvektor ist keine Wahrscheinlichkeitsverteilung. Eine Zufallsvariable ist keine Wahrscheinlichkeitsverteilung.--Sigma^2 (Diskussion) 12:31, 29. Jul. 2023 (CEST)Beantworten

+1 das hat mich auch immer verwirrtbiggerj1 (Diskussion) 12:38, 29. Jul. 2023 (CEST)Beantworten

Aus der Diskussion zum Artikel Gauß-Prozess hierher kopiert. Die Diskussionspunkte sind teilweise inhaltlich nicht erledigt.--Sigma^2 (Diskussion) 13:39, 14. Sep. 2023 (CEST)Beantworten

Schreibweise

Bearbeiten

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger aus dem Artikel Gauß-Prozess in den Artikel Anwendung von Gaußprozessen migriert wurde.

Der Artikel heißt Gauß-Prozess. Im Artikel wird ausschließlich die Schreibweise Gaußprozess verwendet. Diese sollte überarbeitet werden, da Gauß-Prozess die Hauptverwendung in der Wikipedia ist.--Sigma^2 (Diskussion) 12:36, 28. Jul. 2023 (CEST)Beantworten

Vielleicht sollte man auch den Artikelnamen ändern, analog zu Wienerprozess.--Sigma^2 (Diskussion) 13:03, 28. Jul. 2023 (CEST)Beantworten
Habe ich auch schon drüber nachgedacht, den Artikel umzubenennen. --Physikinger (Diskussion) 21:01, 28. Jul. 2023 (CEST)Beantworten
Andererseits fände ich auch Wiener-Prozess besser als das derzeitige Wienerprozess. Es heißt auch Markow-Prozess und Markow-Kette. Ich finde kein System. Ist das mal irgendwo diskutiert worden?--Sigma^2 (Diskussion) 23:36, 28. Jul. 2023 (CEST)Beantworten

Aus der Diskussion zum Artikel Gauß-Prozess hierher kopiert. Der Diskussionspunkt ist inhaltlich nicht erledigt.--Sigma^2 (Diskussion) 14:38, 14. Sep. 2023 (CEST)--Sigma^2 (Diskussion) 13:39, 14. Sep. 2023 (CEST)Beantworten

Mathematische Beschreibung

Bearbeiten

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger aus dem Artikel Gauß-Prozess in den Artikel Anwendung von Gaußprozessen migriert wurde.

Definition

Bearbeiten

Dieser Satz „Treffender wäre die Bezeichnung Gaußkontinuum im Sinne eines beliebigen Kontinuums von – in der Regel korrelierten – Gaußverteilungen.“ ist eine persönliche Einschätzung des Autors und gehört daher als WP:TF nicht in den Artikel. Der Begriff stochastischer Prozess wird seit 50 Jahren in einem weiteren Sinn verwendet. Ich beabsichtige, den Satz zu löschen.--Sigma^2 (Diskussion) 13:57, 28. Jul. 2023 (CEST)Beantworten

Bin auch fürs Löschen. Hier scheint auch wieder Physikingers Meinung Einzug zu nehmen, dass ein Prozess dasselbe wie eine Verteilung ist. Auch das Wort Kontinuum ist doch eher Physik-Terminologie, weil in der Mathematik man damit eigentlich meistens nur die reellen Zahlen oder Teilintervalle dieser meint. Laut Kallenberg - Foundations of Modern Probability kann die Index-Menge   jedoch beliebig sein. Physikinger wirft mir vor nicht allgemeinverständlich zu schreiben, aber nützt dann selber Wörter wie "Kontinuum", welches m. E. nicht allgemeinverständlich und vorallem ambig ist.--Tensorproduct 18:36, 28. Jul. 2023 (CEST)Beantworten
Viele stolpern immer wieder über den Begriff Prozess der als historische Altlast hier sehr unpassend ist. Das ist nur eine Erläuterung des Begriffs. --Physikinger (Diskussion) 20:55, 28. Jul. 2023 (CEST)Beantworten
historische Altlast ist irrelevante persönliche Einschätzung und WP:TF, wie ich schon sagte. --Sigma^2 (Diskussion) 23:47, 28. Jul. 2023 (CEST)Beantworten
Sei doch mal etwas locker. Das historische Erbe, das in dem Begriff steckt, kommt von der damaligen Anwendung auf zeitliche Vorgänge. Ein Gaußprozess kann aber auch auf andere Dimensionen z.B. räumlich angewendet werden, wie im Artikel auch beschrieben ist. Da spielt selbst die Reihenfolge der Variablen keine Rolle, nur die Zuordnung zu diesem Dimensionen. --Physikinger (Diskussion) 10:04, 29. Jul. 2023 (CEST)Beantworten
Die Belehrung ist nicht nötig. Der Sachverhalt, woher der Name Prozess kommt, ist doch völlig unstrittig. Strittig ist, dass in einer Enzyklopädie ein Autor seine persönliche Meinung äußert, dass Gaußkontinuum ein besserer Begriff wäre. So etwas geht grundsätzlich nicht und reicht für eine Löschung, da WP:TF. Der als treffender bezeichnete Begriff wäre auch eindeutig ein schlechter Oberbegriff und keinesfalls treffender, weil das Wort Kontinuum eine sehr spezielle mathematische Struktur der Indexmenge (Teilintervall der reellen Zahlen) suggeriert. Tatsächlich kann die Indexmenge aber z. B. endlich,   oder   sein, so dass nicht der geringste Bezug zu einem Kontinuum besteht. Ich werde jetzt den Satz löschen. --Sigma^2 (Diskussion) 13:24, 29. Jul. 2023 (CEST)Beantworten
Der Satz wurde von Physikinger in der veränderten Form „Im verallgemeinerten Sinn kann Prozess auch als Kontinuum verstanden werden.“ erneut eingefügt. Wie soll denn beispielweise eine Folge von stochastisch unabhängigen und standardnormalverteilten Zufallsvariablen 'im verallgemeinerten Sinn als Kontinuuum aufgefasst werden'. So etwas ist nicht enzyklopädisch, sondern sprachlich verschwommene Theoriefindung. Ich beabsichtige, diesen Satz zu löschen. --Sigma^2 (Diskussion) 00:32, 15. Sep. 2023 (CEST)Beantworten
Ich verstehe euch und bin auch für Löschen des Satzes. @Physikinger Meinst du: für einen Gaußprozess   mit Index Menge aufbauend auf den reelen Zahlen, z.b.   (n=1,2...) nehmen die Realisierungen   für alle Werte   bestimmte Werte an - also ist ein "kontinuierliches" Auswerten für unterschiedliche i möglich (wobei die Änderungen in Y_i durchaus sprunghaft und nicht kontinuierlich sein können)? Das würde ich aber nicht als Kontinuum in irgendeinem Sinn beschreiben biggerj1 (Diskussion) 21:42, 19. Sep. 2023 (CEST)Beantworten

Notation

Bearbeiten

Die Tabelle im Unterabschnitt Notation ist obskur. Einerseits soll   den stochastischen Prozess, andererseits dessen Wahrscheinlichkeitsverteilung bezeichnen. So geht es nicht. Nützlich wäre auch ein Beleg (EN) für die Notation  , dann wüsste man auch, ob es WP:TP ist und was dieses Symbol bezeichnen soll.--Sigma^2 (Diskussion) 13:45, 28. Jul. 2023 (CEST)Beantworten

Diese Notation ist sicher nicht üblich. Kann sein dass das irgendwo so in einem Buch steht, aber es ist sicher nicht Kanon. Auch müsste er korrekterweise   schreiben.--Tensorproduct 18:48, 28. Jul. 2023 (CEST)Beantworten
Die Schreibweise, die ich ursprünglich verwendet habe, enthielt die Variablen t. Ein Mathematiker hat das hier mal beanstandet, dass es mathematisch nicht korrekt sei, obwohl selbst Rasmussen die Schreibweise mit (t) verwendet. Ich habe das dann beherzigt, aber fand es eigentlich didaktisch weniger gut. --Physikinger (Diskussion) 20:58, 28. Jul. 2023 (CEST)Beantworten
Wo ist denn die Festlegung in dem Buch von Rasmussen? --Sigma^2 (Diskussion) 23:42, 28. Jul. 2023 (CEST)Beantworten
Also auf der Folie 10 schreibt Rasmussen z.B. GP(m(x) , k(x, x′)), um die Variablen der Funktionen anzugeben. Ich finde das eigentlich relativ klar und sehe da auch nichts Missverständliches oder mathematisch Falsches. Sorry, ich habe hier falsch eingerückt. Das war die Antwort auf die Schreibweise mit Variable. Was die Sprechweise angeht, wird hier wegen der Symmetrie der Notation auch von Verteilung gesprochen, wie man auch auf Folie 10 sieht. Im Vortrag spricht er auch von "A Gaussian Process is a distribution over functions". Bezüglich der Handhabung und Verwendung soll das die Symmetrie zu Normalverteilungen betonen. Also alles, was man für Normalverteilung an Werkzeuge und Operationen hat, ist auch auf Gaußprozesse anwendbar, soll das heißen. --Physikinger (Diskussion) 10:22, 29. Jul. 2023 (CEST)Beantworten
Eine Vortragsfolie ist keine Quelle. Noch einmal die unbeantwortete Frage: Wo ist die Festlegung der Notation in dem Buch von Rasmussen?--Sigma^2 (Diskussion) 11:25, 29. Jul. 2023 (CEST)Beantworten
Es gibt auf Seite 17 eine Liste "Symbols und Notation". --Physikinger (Diskussion) 11:59, 29. Jul. 2023 (CEST)Beantworten

Was ist ein „Vektor mit kontinuierlichen Zeilen“?--Sigma^2 (Diskussion) 00:36, 15. Sep. 2023 (CEST)Beantworten

Definition spezieller Eigenschaften

Bearbeiten

Die Definition der Stationarität ist falsch. Die Stationarität der Kovarianzfunktion impliziert nicht Stationarität der Verteilung.--Sigma^2 (Diskussion) 14:46, 28. Jul. 2023 (CEST)Beantworten

Kannst du das bitte etwas erläutern? --Physikinger (Diskussion) 21:02, 28. Jul. 2023 (CEST)Beantworten
Aus der Stationarität der Kovarianzfunktion folgt nicht die Erwartungswertstationarität und damit auch nicht die Verteilungsstationarität. Für einen Gaußprozess ist Verteilungstationarität = Stationarität der Kovarianzfunktion + Stationarität der Erwartungswertfunktion, das nennt man üblicherweise schwache Stationarität und ist für Gaußprozesse identisch mit Verteilungsstationarität. --Sigma^2 (Diskussion) 23:03, 28. Jul. 2023 (CEST)Beantworten
Siehe auch Stationärer stochastischer Prozess. Zufallsvariablen sind, etwas ungewöhnlich, mit Kleinbuchstaben bezeichnet. Die Definitionen sind im wesentlichen richtig. Die Definition der starken Stationarität dort greift zu kurz, siehe dazu die Diskussion zum Artikel. --Sigma^2 (Diskussion) 01:22, 29. Jul. 2023 (CEST)Beantworten
Inzwischen ist im Artikel Stationärer stochastischer Prozess die Stationaritätsdefinition berichtigt.--Sigma^2 (Diskussion) 15:34, 15. Sep. 2023 (CEST)Beantworten

Hintergrund der falschen Definition von Stationarität war die ungewöhnliche Definition der Stationarität einer Kovarianzfunktion durch Rasmussen/Williams. Diese bezeichnen (und damit sind sie vielleicht alleine auf der Welt) eine Kovarianzfunktion, die translationsinvariant (manchmal auch als zeitinvariant bezeichnet) ist, als stationär. Typischerweise ist aber Stationarität eine Eigenschaft stochastischer Prozesse. Eine stationäre Kovarianzfunktion im Sinn von Rasmussen/Williams impliziert aber nicht, dass der Prozesse stationär ist (weder im engeren noch im weiteren Sinn). --Sigma^2 (Diskussion) 15:34, 15. Sep. 2023 (CEST)Beantworten

Aus der Diskussion zum Artikel Gauß-Prozess hierher kopiert. Der Diskussionspunkte sind teilweise inhaltlich nicht erledigt.--Sigma^2 (Diskussion) 13:58, 14. Sep. 2023 (CEST)Beantworten

Belege

Bearbeiten

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger aus dem Artikel Gauß-Prozess in den Artikel Anwendung von Gaußprozessen migriert wurde.

Was willst du hier genau im Einzelnen belegt haben? Und willst du nicht erst mal im Artikel Stochastischer Prozess lauter Belege einfordern? Da herrscht ein noch viel größerer Mangel. --Physikinger (Diskussion) 10:32, 29. Jul. 2023 (CEST)Beantworten

Mit Einzelnachweisen würde man hier meist nur auf das gleiche Buch referenzieren. Da die Literatur ohnehin von diesem Buch dominiert ist und es auch prominent unten aufgelistet und sogar kostenlos zugänglich ist, denke ich, dass sich der Leser hier im Zweifelsfall gut informieren kann. Dieser gesamte Artikel ist im Grund eine Einführung in das Lehrbuch von Rasmussen, das zwar einerseits eine Art Bibel auf dem Gebiet ist, jedoch zum Einstieg schwer lesbar ist. Daher ist der Artikel eigentlich im Vergleich sehr gut belegt, da ein Link zum kostenlosen Standard-Lehrbuch vorhanden ist. --Physikinger (Diskussion) 10:52, 29. Jul. 2023 (CEST)Beantworten
"Dieser gesamte Artikel ist im Grund eine Einführung in das Lehrbuch von Rasmussen." Und was hat das mit einem enzyklopädischen Artikel über Gaußsche Prozesse zu tun? --Sigma^2 (Diskussion) 11:21, 29. Jul. 2023 (CEST)Beantworten
Es ist ja nicht streng eine Einführung zu speziell diesem Buch, aber vom Stoff her würde jeder, der den Artikel durchliest sich in der Literatur zurechtfinden und verstehen, um was es geht. Und dazu ist die Wikipedia ja da. Das ist je gerade der Mehrwert der Wikipedia. --Physikinger (Diskussion) 12:04, 29. Jul. 2023 (CEST)Beantworten
"Bibel auf dem Gebiet": Aber sicher nicht auf dem Gebiet der Gauß-Prozesse, um die es in dem Artikel gehen soll. Vielleicht ist ein Art Bibel für Nichtmathematiker, Nichtstochastiker und Nichtstatistiker auf einem Teilgebiet des Maschinellen Lernens, das mag sein. --Sigma^2 (Diskussion) 11:45, 29. Jul. 2023 (CEST)Beantworten
Die Bibel für alle außer Nicht-Anwender. --Physikinger (Diskussion) 12:07, 29. Jul. 2023 (CEST)Beantworten
Whataboutism führt auf dieser Seite nicht weiter. Der Artikel enthält viele neue Begriffe, die nicht erklärt sind, in der Wikipedia nicht verlinkt sind und auch nicht zu finden sind und die nicht belegt sind. Dabei ist unklar, ob diese Begriffe von Rasmussen erfunden wurden oder ob es – verursacht durch Unkenntnis der deutschen Fachbegriffe – um falsche Übersetzungen in Deutsche handelt. --Sigma^2 (Diskussion) 11:35, 29. Jul. 2023 (CEST)Beantworten
Rasmussen ist ein führender und anerkannter Wissenschaftler auf dem Gebiet und er darf auch Begriffe erfinden und prägen. --Physikinger (Diskussion) 12:01, 29. Jul. 2023 (CEST)Beantworten
Das kann er wohl. Aber man kann nicht solche Begriffe unerklärt und unverlinkt in einem Enzyklopädie-Artikel voraussetzen und verwenden. So wird nirgendwo in der Wikipedia gearbeitet. --Sigma^2 (Diskussion) 18:36, 29. Jul. 2023 (CEST)Beantworten

Aus der Diskussion zum Artikel Gauß-Prozess hierher kopiert. Die Diskussionspunkte sind teilweise inhaltlich nicht erledigt.--Sigma^2 (Diskussion) 14:36, 14. Sep. 2023 (CEST)Beantworten

Zum Umzug - 1 -

Bearbeiten

Einen Teil des Artikels in einen neuen Artikel auszulagern ist möglich und in diesem Fall wahrscheinlich sinnvoll. Das Minimum ist aber, einen solchen Umzug angekündigt und mit Diskussion durchzuführen. Was auch nicht geht, ist jetzt eine alte Fassung ins Netz zu stellen, so dass Korrekturen und Überarbeitungen von Koautoren verloren sind. Es ist überhaupt nicht einzusehen, dass der Umzug nicht mit der letzten Version erfolgte. Ich will mal unterstellen, dass es ein Versehen durch zeitliche Überschneidungen war. Ich lege hier noch einmal meine letzte Überarbeitung des Abschnitts Notation ab, deren Übernahme ich Dir empfehle:


Notation

Bearbeiten

Analog zur ein- und mehrdimensionalen Gaußverteilung ist ein Gaußprozess über seine ersten beiden Momente vollständig und eindeutig bestimmt. Bei der mehrdimensionalen Gaußverteilung sind dies der Erwartungswertvektor   und die Kovarianzmatrix  . Beim Gaußprozess treten an deren Stelle eine Erwartungswertfunktion

 

und eine Kovarianzfunktion

 .

Diese Funktionen können im einfachsten eindimensionalen Fall als Vektor mit kontinuierlichen Zeilen bzw. als Matrix mit kontinuierlichen Zeilen und Spalten aufgefasst werden.

Folgende Tabelle vergleicht ein- und mehrdimensionale Gaußverteilungen mit der Wahrscheinlichkeitsverteilung eines Gaußprozesses mit der Erwartungswertfunktion   und der Kovarianzfunktion  , die im folgenden als   notiert wird. Das Tilde-Symbol   kann gelesen werden als „ist verteilt als“.

Zufälliges Objekt Art der Verteilung Notation Verteilungsparameter Wahrscheinlichkeitsdichtefunktion
reelle Zufallsvariable   Eindimensionale Gaußverteilung      
Zufallsvektor   Mehrdimensionale Gaußverteilung (regulärer Fall)    ,  ,
  positiv definit
 
Zufallsvektor   Mehrdimensionale Gaußverteilung (singulärer Fall)    

  positiv semidefinit und nicht invertierbar

(keine Dichtefunktion im  )
Gaußprozess  alle endlichdimensionalen Verteilungen sind Gaußverteilungen    ,
 ,   positiv semidefinit
(keine analytische Darstellung)

--Sigma^2 (Diskussion) 20:07, 29. Jul. 2023 (CEST)Beantworten

Zum Umzug - 2 -

Bearbeiten

Du hast durch die (versehentliche? Übernahme einer alten Version die mit WP:TF begründete Löschung faktisch umgangen, zu der es bereits eine Diskussion:Gauß-Prozess#Definition gab. Wenn so etwas absichtlich erfolgt, ist es ein Hintertreiben der kollaborativen Arbeitsweise der WP und hat schon zu dauerhaften Sperren geführt. Ich werde die Löschung erneut vornehmen. --Sigma^2 (Diskussion) 20:09, 29. Jul. 2023 (CEST)Beantworten

Die alte Version war tatsächlich Absicht, weil der Fork vor dem Auseinanderdriften der Interessen stattfinden sollte. Du hattest da schon etwas "gewütet" und Banner mit Löschandrohungen der ganzen Abschnitte platziert. Da wollte ich erst mal den Stand retten. Aus irgendeinem Grund konnte ich vorhin eine Zeit lang nicht mehr editieren. Ich bin hier aber noch am Überarbeiten. --Physikinger (Diskussion) 22:31, 29. Jul. 2023 (CEST)Beantworten
"Fork vor dem Auseinanderdriften der Interessen" ist eine seltsame Umschreibung für eine faktische Löschaktion der Arbeit anderer Autoren ohne Diskussion und Ankündigung. Ich habe nicht gewütet, sondern kleinere, offensichtliche Korrekturen und Verbesserungen durchgeführt. Ich hatte in einer Zwischenversion mit der Vorlage:Belege das Belegen von Aussagen erbeten. In der letzten Version vor deinem Auszug (Version vom 29. Juli 2023, 16:21, Spezial:Mobiler Unterschied/235930049) befanden sich diese Banner nicht mehr im Text des Artikels. --Sigma^2 (Diskussion) 10:20, 3. Aug. 2023 (CEST)Beantworten

Definitionen spezieller Eigenschaften

Bearbeiten

Stationarität

Bearbeiten

Die Definition der Stationarität im Artikel ist falsch.

Beispiel

Es sei   ein Gauß-Prozess mit

 

und insgesamt stochastisch unabhängigen Zufallsvariablen, dann gilt

 

Die Kovarianzfunktion des Prozesses ist translationsinvariant, aber der Prozess ist nicht stationär, da z. B.   und   gilt.

Radialer Prozess

Bearbeiten

In der Definition eines radialen Prozesses wird ein Gauß-Prozess mit isotropen Eigenschaften vorausgesetzt. Der verlinkte Artikel Isotropie ist viel zu allgemein, um zu klären, was gemeint ist. Wann besitzt ein Gauß-Prozess isotrope Eigenschaften? Das ist entweder im Artikel zu definieren oder sollte WP-intern so verlinkt sein, dass es nachvollziehbar ist.

Nehmen wir den einfachen Fall eines Gauß-Prozesses   und   bivariat normalverteilt. Wann besitzt dieser Prozess isotrope Eigenschaften, wann nicht? --Sigma^2 (Diskussion) 18:53, 30. Jul. 2023 (CEST)Beantworten

Referenz zu Stationarität ist eingefügt. Isotropie war nur als Anwendungshinweis gemeint. --Physikinger (Diskussion) 22:07, 31. Jul. 2023 (CEST)Beantworten
Der Zusatz und auch stationäre Funktion kann in der Definition der Radialität entfallen und sollte auch entfallen, da nicht klar, ist was eine stationäre Funktion   ist. Die Definition der Radialiät ist nur für   und die der Stationarität nur für   verständlich. Beides könnte angegeben werden.--Sigma^2 (Diskussion) 09:42, 2. Aug. 2023 (CEST)Beantworten

Zum Löschantrag

Bearbeiten

Physikinger hat am 2. August 2023 einen Löschantrag für diesen Artikel gestellt. Ich bin gegen die Löschung dieses Artikels.

Im Artikel wird beispielhaft gezeigt, wie im Bereich des maschinellen Lernens die Parameter der Wahrscheinlichkeitsverteilung eines Gauß-Prozesses ohne Rückgriff auf statistische Methoden so eingestellt (kalibriert, gefittet) werden können, dass der kalibrierte Prozess zu den Daten "passt". Im richtigen Kontext hat der Artikel seinen Wert. Der Artikel erhebt auch nicht den Anspruch, einen Beitrag zur statistischen Methodik oder Wahrscheinlichkeitstheorie zu sein, sondern dokumentiert ein pragmatisches, datenorientiertes und im wesentlichen theoriefreies Vorgehen.

Der Artikel enthält allerdings die beiden Abschnitte Mathematische Beschreibung und Rechenoperationen mit Gaußprozessen und diese beiden Abschnitte müssen formal korrekt sein. Leider ist die weit überwiegende Anzahl der Aussagen unbelegt.--Sigma^2 (Diskussion) 09:32, 3. Aug. 2023 (CEST)Beantworten

Zielsetzung des Artikels

Bearbeiten

Dieser Artikel soll Techniken mit Gaußprozessen in der Anwendung für Anwender beschreiben. Didaktisch sollte der Artikel eigenständig lesbar sein und möglichst nicht mit anderen abstrakten Begriffen aus der Stochastik erklärt werden. Wer selbst Stochastik studiert hat und sein Wissen über die theoretische Einordnung einbringen möchte, möge dies bitte im Haupt-Artikel Gauß-Prozess ergänzen. Hier in diesem Artikel soll die Hürde niedrig gehalten werden, um die Techniken auch für Anwender aus anderen Fachrichtungen zu ermöglichen. Daher soll auf die Theorie nicht mehr wie nötig eingegangen werden.

Da es kontroversen darüber gegeben hat, wie ein Gaußprozess überhaupt definiert ist, hier nochmal das Verständnis, wie er hier im Artikel verstanden und dargestellt wird: Von einer Normalverteilung kommt man zu einem Gaußprozess, indem man folgende Eigenschaften hinzufügt:

  • Zusätzlich kann die Verteilung auch unendliche viele oder überabzählbar viele Dimensionen besitzen.
  • Zusätzlich sind die Dimensionen in einem gemeinsamen Koordinatensystem jeweils einer Koordinate zugeordnet (bzw. damit indiziert).

Erstere Eigenschaft ist meiner Auffassung nach optional, letztere Eigenschaft ist zwingend.

Zur Notation:   bezeichnet den Gaußprozess, so wie   die Normalverteilung bezeichnet. --Physikinger (Diskussion) 22:06, 8. Aug. 2023 (CEST)Beantworten

Hallo Physikinger. Ich finde den Inhalt des Artikels super. Nur bitte lass uns genau zwei Wörter streng trennen. Dabei geht es um einen (erzeugenden) "Prozess" und um die "Verteilung des Prozesses". Lass mich dazu ein Beispiel machen: das Ziehen einer zufälligen Zahl   (sprich einer Zufallsvariablen) aus einer Normalverteilung (also  ) erzeugt "Realisierungen von X", also z.B.   (mit kleinem Buchstaben geschrieben, da es eine Realisierung ist), es hätte auch   sein können... X ist die Zufallsvariable und   ihre Verteilung. Beides will unterschieden werden.
In Analogie ist nun:   ein Gaußprozess, der eine gewisse Verteilung   hat (die Verteilung des Gauß-Prozesses). Der Gauß-Prozess und seine Verteilung sind aber zwei unterschiedliche Dinge. Richtiger Weise ist nur   der Gauß-Prozess,   ist eine Realisierung dieses Prozesses (welche fest ist, sobald sie gezogen wurde, ebenso wie bei der Zufallszahl   fest ist). Diese Realisierung ist eine (gewöhnliche) Funktion, welche zufällig als Realisierung von   gezogen wurde.   kann somit als "zufällige Funktion" (in Analogie zur Zufallsvariable  ) aufgefasst werden. Die Verteilung dieser zufälligen Funktion ist  . (Dies ist in Analogie zur Verteilung   der Zufallsvariablen  ). Daher kannst du sagen der Gaussprozess   hat die ihm zugeordnete Verteilung  , bzw. equivalent ausgedrückt  .
Kurz auf den Punkt gebracht: Bitte schreibe nicht "  bezeichnet den Gaußprozess", sondern bitte schreibe: "  bezeichnet den Gaußprozess und dieser folgt der Verteilung  ". Du würdest bei einer Zufallsvariable X auch nicht sagen "X ist die Normalverteilung", sondern X ist eine Zufallsvariable und diese folgt der Normalverteilung  . Macht das Sinn? Ich kann dir versprechen durch Unterscheidung   und seiner Verteilung   hast du deutlich weniger Beanstandungen von Seiten der Mathematiker. Ich werde das nicht selbst im Artikel ändern, da ich keinen Konflikt hervorrufen will. Gerne diskutiere ich deine Fragen aber ausführlich. Liebe Grüße und eine wunderschöne Nacht biggerj1 (Diskussion) 21:40, 10. Aug. 2023 (CEST)Beantworten
Ok, das wurde schon auf der Diskussionsseite von Gaußprozess gesagt, dass   nicht der Gaußprozess sei. Also   ist der Gaußprozess? Das wäre dann genau umgekehrt wie bei der Normaverteilung, die mit   bezeichnet wird, während   eine Variable ist, die nur die Werte aus der Verteilung symbolisiert. Stimmst du denn der folgenden Erklärung von Rasmussen zu?
"A Gaussian process is a generalization of a multivariate Gaussian distribution to infinitely many variables."
Dann bedeutet das ja nach deiner Auffassung,   sei eine Verallgemeinerung von  . Ich bin davon ausgegangen, dass   die Verallgemeinerung von   ist, weil das ja durch die Notation sehr offensichtlich ist, weil hier der Vektor und die Matrix durch Funktionen ersetzt werden, was die Verteilung verallgemeinert.
Und stimmst du denn dem Verständnis des Begriffs in meinem vorigen Kommentar zu (abgesehen von der letzten Zeile mit der Notation)? --Physikinger (Diskussion) 16:24, 11. Aug. 2023 (CEST)Beantworten
Hier ist auch nochmal eine Definition, die ich gefunden habe: "Gaussian processes are the extension of multivariate Gaussians to infinite-sized collections of realvalued variables. In particular, this extension will allow us to think of Gaussian processes as distributions not just over random vectors but in fact distributions over random functions." [1] (Von einem Machine Learning Lecturer aus Standford). Also denkst du das ist falsch, was er sagt? --Physikinger (Diskussion) 18:22, 11. Aug. 2023 (CEST)Beantworten
Falls du dich fragst, ob beim Gaußprozess die Sammlung der Zufallsvariablen und bei der Normalverteilung die Verteilung benannt wurde? Ja und wenn du 20 zufällige Bücher über Gaußprozesse aufschlägst, wirst du feststellen dass praktisch alle den Gaußprozess als Sammlung von Zufallsvariabl(mit bestimmten Eigenschaften) definieren. So wie das bei allen stochastischen Prozessen gemacht wird. Lass mich im Folgenden etwas praktischer, ungenauer und unformaler formulieren: der Stochastische Prozess liefert sozusagen die stochastische Simulationsforschrift um konkrete Realisierungen (Ergebnisse einer Simulation) zu erzeugen. Die konkreten Realisierungen haben natürlich eine Verteilung (die Verteilung des Prozesses), welche du mit   schreibst. Da beides (die Simulation und die Verteilung ihrer Ergebnisse) zusammenhängt kannst du schreiben  . Praktisch formuliert ist die stochastische Simulation (denke  , mit all ihren möglichen Verläufen) ja auch nicht gleich einem einzigen konkreten Ergebnis   (klein). Und die Verteilung der Ergebnisse

(denke  ) ist auch nicht gleich der Simulation. Das mit der Simulation ist natürlich nur eine Analogie, bitte nicht auf die Goldwaage legen und überinterpretieren biggerj1 (Diskussion) 20:13, 11. Aug. 2023 (CEST)Beantworten

Ich finde das dann völlig verwirrend definiert, wenn das so ist. Ich hoffe, du stimmst mir wenigstens zu, dass hier eine Menge Inkonsequenz in den Bezeichnungen steckt. Z.B. wird dann zwischen einer normalverteilen und einer anders förmig verteilen Zufallsvariable sprachlich nicht unterschieden, während beim Prozess die Gaußförmigkeit an den Namen der Zufallsvariable gekoppelt ist. Und warum gibt es bei der Normalverteilung keinen Begriff für das Modell, dessen Realisierung eine Verteilung hat? Aber gut egal, ich habe den Artikel etwas geändert, so dass der Begriff nicht direkt eine Verteilung bezeichnet. --Physikinger (Diskussion) 22:56, 11. Aug. 2023 (CEST)Beantworten
Ja, mache Bezeichnungen sind eben wie sie sind. Danke für deine Änderungen und die Zeit es zu verstehen, dieser Punkt ist schon wichtig biggerj1 (Diskussion) 14:43, 12. Aug. 2023 (CEST)Beantworten
@Physikinger Du solltest dir vielleicht mal vernünftige Quellen beschaffen, statt einfach irgendwelche Folien im Internet zu suchen, die vermutlich noch nicht mal peer-reviewed sind. Du sagst ja selber, du hättest angeblich einen Doktortitel (was ich dir nicht glaube), dann solltest du doch wissen, was vernünftige Quellen sind und wie man sie beschafft.
PS: Du schreibst in dem Thread wieder einmal "Wer selbst Stochastik studiert" hat und schiebst wieder das Argument der Allgemeinverständlichkeit vor. Deine Aussage "ein Prozess ist eine Verteilung" ist so elementar falsch, dafür muss man weder Stochastik noch Mathematik studieren um das zu sehen. Den Unterschied lernen auch Ökonomen oder Informatiker, die sich mit dem Thema auseinandersetzen. Jemand der Stochastik studiert hat, der beschäftigt sich mit ganz anderen Dingen.--Tensorproduct 10:36, 14. Aug. 2023 (CEST)Beantworten
Das Gegenteil, also dass ein Prozess keine Verteilung ist, ist genauso wenig durch einen Artikel mit Peer-Review belegt. Ich glaube euch das einfach Mal, weil viele Definitionen, die ich gefunden habe, hier irgendwie elegant um den Brei herumreden, statt einen Prozess bzw. Gaußprozess direkt zu definieren. Aber mir kommen so manche Definitionen der Mathematik etwas willkürlich und historisch gewachsen vor. Auf jeden Fall würde die Definition nichts am Ergebnis einer Rechnung ändern, ob man das nun Normalverteilung, verallgemeinerte Normalverteilung oder Gaußprozess nennt. --Physikinger (Diskussion) 12:08, 14. Aug. 2023 (CEST)Beantworten
Doch, das steht in jedem Einführungsbuch zur Stochastik, dass ein Prozess und eine Verteilung verschiedene Dinge sind. Die Definitionen sind nicht willkürlich, du hast einfach die Grundlagen zur Stochastik übersprungen und dich stattdessen direkt mit Rasmussens Buch über Gauß-Prozesse befasst.--Tensorproduct 09:43, 23. Aug. 2023 (CEST)Beantworten
Ich meinte, in der Wikipedia ist es nicht belegt. Ihr scheibt auch einen Haufen Zeug in die Wikipedia-Artikel ohne jede Quelle, weil ihr meint, das wäre offensichtlich. --Physikinger (Diskussion) 16:25, 16. Sep. 2023 (CEST)Beantworten

"Signale" und "Unkorreliertheit" im Abschnitt Rechenoperationen mit Gaußprozessen

Bearbeiten

Im Abschnitt Rechenoperationen mit Gaußprozessen geht es inhaltlich z. B. um die Addition von zwei stochastisch unabhängigen Gauß-Prozessen. Stattdessen wird dann aber von der Addition von Signalen gesprochen. Diese Verwendung des Signalbegriffs ist nicht konsistent mit dem Artikel Signalverarbeitung, in dem ein Signal eindeutig als eine Realisierung (ein Pfad) eines stochastischen Prozesses und nicht als stochastischer Prozess definiert ist.--Sigma^2 (Diskussion) 16:14, 15. Sep. 2023 (CEST)Beantworten

Unkorreliertheit ist hier irrevelant. Damit die gemeinsame Verteilung von zwei stochastischen Prozessen eindeutig gebildet werden kann, müssen die beiden stochastischen Prozesse stochastisch unabhängig und nicht nur unkorreliert sein.--Sigma^2 (Diskussion) 16:14, 15. Sep. 2023 (CEST)Beantworten

Meiner Meinung nach sollte man generell die Verwendung der Begriffe "Signal" und "Fusion" diskutieren. Für mich sieht das so aus, als ob die Begriffe eher aus dem Bereich Signalverarbeitung/Sensorik statt aus der "Statistik/Machine Learning" stammen. Vielleicht gibt es statistische Anwendungen, wo das Wort "Signal" verwendet wird, aber Google spuckt mir zur "Fusion" eigentlich nur Bücher über Signalverarbeitung aus, keine Bücher über Gauß-Prozesse/Statistik/Machine Learning.
Oder man benennt den Artikel in "Gauß-Prozesse in der Signalverarbeitung/Sensorik" um. Was meinst du? Sind das Begriffe, die du so in der Statistik schon gesehen hast?--Tensorproduct 09:17, 16. Sep. 2023 (CEST)Beantworten
Die Begriffe Signal und Fusion sind in der Statistik nicht gebräuchlich.--Sigma^2 (Diskussion) 15:44, 16. Sep. 2023 (CEST)Beantworten
Nein, das behauptet auch niemand. Es gibt aber viel mehr Begriffe, die in der technischen Literatur nicht gebräuchlich sind. --Physikinger (Diskussion) 16:27, 16. Sep. 2023 (CEST)Beantworten
Natürlich gibt es in der Statistik die Datenfusion. Dabei geht es allerdings um die Zusammenführung von geschätzten (!) Kovarianzmatrizen und von Schätzern, aber nicht um das Fusionieren theoretischer Modelle. --Sigma^2 (Diskussion) 16:26, 16. Sep. 2023 (CEST)Beantworten
Datenfusion ist ein deskriptiver Begriff, so wie "Zusammenführen", der auch nicht einheitlich verwendet wird. --Physikinger (Diskussion) 16:30, 16. Sep. 2023 (CEST)Beantworten

'Fusion' im Abschnitt "Rechenoperationen mit Gaußprozessen"

Bearbeiten

Was soll dieser Satz

Wenn dieselbe unbekannte Funktion durch zwei verschiedene und unabhängige Gaußprozesse mit zueinander unkorrelierten Fehlern beschrieben wird, dann kann eine [...] Fusion [...] der beiden Teilinformationen gebildet werden, um eine Reduktion des Fehlers zu erreichen: 

überhaupt bedeuten?

  • Was ist eine Funktion, die durch einen Gaußprozess beschrieben wird?
  • Was ist gemeint mit einem Gaußprozess mit Fehlern?
  • Welche Fehler haben zwei unabhängige Gaußprozesse, die unkorreliert sein können?
  • Eine Reduktion welches, wie definierten Fehlers, soll durch eine Fusion erreicht werden?

Hier fehlt noch sehr viel Kontext, damit etwas Verständliches entsteht. Die angegebene Literaturquelle Noak et al. ist irreführend. Dort wird der Begriff Fusion in einem anderen Zusammenhang verwendet. --Sigma^2 (Diskussion) 21:27, 15. Sep. 2023 (CEST)Beantworten

Vermutlich meint er damit den Fehler   aus dem Regressionsmodell
 
wobei  --Tensorproduct 13:02, 16. Sep. 2023 (CEST)Beantworten
So oder ähnliches mag gemeint sein, aber es muss es dann im Text erklärt werden. Mir ist dann immer noch nicht klar, wie ein solcher Fehler durch Fusion reduziert werden kann und was Fusion in diesem Zusammenhang heißen soll.--Sigma^2 (Diskussion) 15:25, 16. Sep. 2023 (CEST)Beantworten
Was ist daran bloß unklar? Dass die Varianz einen Fehler beschreibt, ist dir nicht geläufig? Und das diese Kombination die Varianz des GP reduziert ist doch schon an der Formel ersichtlich, speziell im skalaren Fall. --Physikinger (Diskussion) 15:56, 16. Sep. 2023 (CEST)Beantworten
Es wird als die „Varianz des GP reduziert“. Und was ist die „Varianz des GP“, die reduziert wird?  ,   oder die Varianz des Fehlers  ? --Sigma^2 (Diskussion) 16:21, 16. Sep. 2023 (CEST)Beantworten
Der Gaußprozess wird durch eine Mittelwerfunktion und Kovarianzfunktion beschrieben. Und im diese Varianz in der Kovarianzfunktion geht es. Ich habe ein anschauliches Beispiel ergänzt. --Physikinger (Diskussion) 17:51, 16. Sep. 2023 (CEST)Beantworten
Und wo ist der zweite Gaußprozess mit den unkorrelierten Fehlern? --Sigma^2 (Diskussion) 16:21, 16. Sep. 2023 (CEST)Beantworten
Die beiden Gaußprozesse 1 und 2 in der Formel sind zueinander unkorreliert. --Physikinger (Diskussion) 17:53, 16. Sep. 2023 (CEST)Beantworten
Rasmussen schreibt das Regressionsmodell, das er meint, unsauber auf. Er schreibt
 
wobei   ein Gauß-Prozess ist und   ein von diesem unabhängiger Fehler.
Er meint aber eigentlich folgendes Modell mit mehreren unabhängigen Fehlertermen:
  und   seien stochastisch unabhängige Gauß-Prozesse. Für den Fehlerprozess   sei die Erwartungswertfunktion konstant Null, d. h.
 
und die Kovarianzfunktion sei (geschrieben mit Kronecker-Delta)
 
Mit diesen Annahmen wird das Modell
 
betrachtet. Der Prozess   ist dann ebenfalls ein Gauß-Prozess, der diesselbe Erwartungswertfunktion wie der Prozess   hat. Wenn   die Kovarianzfunktion   hat, dann hat der Prozess   die Kovarianzfunktion
 
Das ist auch die von Rasmussen angegebene Kovarianzfunktion für den Prozess  .
Für das unsauber aufgeschriebene Modell mit nur einem Fehlerterm würde sich dagegen die Kovarianzfunktion
 
ergeben.
Der Artikel ist insofern nicht betroffen, dass der Abschnitt Gaußprozess-Regression zwar so heißt, aber überhaupt kein Modell zur Gaußprozess-Regression enthält. Dieser Abschnitt müsste eigentlich umbenannt werden, damit die Überschrift zum Inhalt passt.--Sigma^2 (Diskussion) 18:17, 16. Sep. 2023 (CEST)Beantworten
Der Abschnitt Gaußprozess-Regression beschreibt, wie man Regressions-Probleme behandeln kann, wenn sich die vorliegenden Daten durch Gaußprozesse beschreiben lassen. Daher verstehe ich nicht, inwiefern die Überschrift nicht genau das widerspiegelt, was hier beschrieben wird. --Physikinger (Diskussion) 23:06, 18. Sep. 2023 (CEST)Beantworten

Umbenennung in "Gaußprozesse in der Signalverarbeitung"

Bearbeiten

Da dieser Artikel Terminologie aus der Signalverarbeitung/Sensorik verwendet , schlage ich eine der beiden Optionen vor

  • den Artikel in "Gaußprozesse in der Signalverarbeitung" (resp. Sensorik) umzubennen, oder
  • Terminologie verwenden, die so auch bei Rasmussen vorkommt. Beispielsweise das Wort "Fusion" kommt in Rasmussens Buch nicht einmal vor. Rasmussen spricht (wie viele andere Machine-Learning-Bücher) einfach vom Produkt. Wenn das so ein geläufiger Begriff des ML wäre, warum kommt er dann nicht vor?

Hätte man stattdessen den Begriff "sensor fusion" verwendet (und diesen erklärt), so hätte ich mich daran nicht gestört. Aber einfach nur von "fusion" sprechen und zudem nicht mal erklären, wie die Formeln entstanden sind, ist didaktisch einfach schlecht. --Tensorproduct 15:13, 16. Sep. 2023 (CEST)Beantworten

Die Formeln funktionieren in der Signalverarbeitung, von der sie stammen, genauso wie beim Maschinenlernen. Ich verwende sie in beiden Fällen, zur Rauschreduktion wie auch zur Datafusion zweier unabhängiger Modelle. Daher wollte ich das hier nicht einschränken. In dem Abschnitt spreche ich oft von "Signalen", um das anschaulich zu machen. Aber es funktioniert auch bestens mit 2D-Feldern.
Signalverarbeitung oder Sensorik für den ganzen Artikel ist etwas zu speziell. Ich habe ja auch ein Beispiel aus der Marktforschung. Die Gemeinsamkeit ist die Anwendung, eventuell die technische Anwendung. --Physikinger (Diskussion) 16:13, 16. Sep. 2023 (CEST)Beantworten
Ich habe die Einleitung zu den Operationen nochmal neu geschrieben. Damit sollte man verstehen können, das Signale hier als anschauliches Beispiel dienen, weil dieser Abschnitt typische Probleme der Signalverarbeitung beschreibt. --Physikinger (Diskussion) 17:46, 16. Sep. 2023 (CEST)Beantworten

Rechenoperationen

Bearbeiten
Im Abschnitt 'Rechenoperationen mit Gaußprozessen' werden Gauß-Prozesse als Signale bezeichnet. Diese Verwendung des Signalbegriffs ist nicht konsistent mit dem Artikel Signalverarbeitung, in dem ein Signal eindeutig als eine Realisierung (ein Pfad) eines stochastischen Prozesses und nicht als stochastischer Prozess definiert ist. --Sigma^2 (Diskussion) 16:34, 16. Sep. 2023 (CEST)Beantworten
Ich sehe in dem Abschnitt Rechenoperationen ebenfalls eine ungenaue Notation: dort ist meistens groß Y gemeint und nicht klein y. Dies scheint eine Kleinigkeit zu sein, ist es aber nicht. Es ist der Unterschied wie bei einer (abstrakten) Augenzahl Y eines Würfels (eine mögliche Zahl zwischen 1..6) und der konkreten Realisierung y, z.B. 1. @Physikinger, darf ich korrigieren? biggerj1 (Diskussion) 22:41, 19. Sep. 2023 (CEST)Beantworten
Da bin ich jetzt wirklich überrascht, dass hier zwischen groß- und Kleinschreibung unterschieden wird, aber du darfst es gerne konsistent ändern. --Physikinger (Diskussion) 20:40, 21. Sep. 2023 (CEST)Beantworten
Der Grund für meine Wahl war übrigens der, dass man zwischen Vektor (klein) und Matrix (groß) unterscheiden kann. Rasmussen nutzt meist auch Kleinbuchstaben, außerdem in Fettschrift, um die Größe als Vektor zu kennzeichnen. Daher bin ich mir nicht sicher, ob als Y klarer wird. Außerdem wird durch die Tilde auch klar, was mit y gemeint ist. --Physikinger (Diskussion) 21:22, 21. Sep. 2023 (CEST)Beantworten
Ihr seid schon auch ziemliche Gewohnheitstiere. Das Wort Signal sollte ja gerade helfen, sich hier etwas konkretes drunter vorstellen zu können. Achso, also im Artikel Signalverarbeitung ist das so definiert? Echt? Ich wusste schon nach einer Sekunde lesen, dass die Definition von dir reingeschrieben wurde. In der von dir angegebenen Literatur heißt es explizit "A ... (stochastic) signal is" und nicht "A signal is", außerdem wird da nur mitgeteilt, wie der Begriff im Buch gemeint ist. Und wenn ich SIGNAL einfach groß schreibe? Nur Spaß.
Also "Signal" könnte man natürlich auch durch "Variable" ersetzten. --Physikinger (Diskussion) 21:29, 21. Sep. 2023 (CEST)Beantworten

Fehler bezüglich der Rechenoperationen + Korrelation/Unabhängigkeit

Bearbeiten

Folgendes muss noch im Artikel korrigiert werden:

  1. Wenn   korrelierte normalverteilte Vektoren sind, dann ist   und   nicht automatisch normalverteilt.
  2. Der Satz "Die Verteilung eines Gaußprozesses kann man sich als eine Wahrscheinlichkeitsverteilung von Funktionen vorstellen" ist immer noch falsch. Es sollte "...Wahrscheinlichkeitsverteilung FÜR Funktionen" heißen. Eine Verteilung ist kein Prozess. Nicht die Funktionen sind verteilt, die Wahrscheinlichkeit ist verteilt.
  3. Im Ausdruck "unabhängig unkorreliert" sollte nur "unabhängig" stehen.
  4. Im Ausdruck Ornstein-Uhlenbeck / Gauß-Markov: sollte nur "Ornstein-Uhlenbeck" stehen. Es gibt noch andere Gauß-Markov-Prozesse.--Tensorproduct 18:46, 21. Sep. 2023 (CEST)Beantworten
1. Wo genau soll das noch korrigiert werden? Bei Allgemeinen Transformation ist es doch schon korrigiert
2. Aber man sagt doch auch: "Eine Verteilung von Vektoren".
3. Ok
4. Da kann ich auch darauf hinweisen. --Physikinger (Diskussion) 23:28, 21. Sep. 2023 (CEST)Beantworten
1. Oder meinst du die Überschrift z.B. "Addition: korrelierte Variablen"? Hier wird ausschließlich von vollständiger Korrelation gesprochen, was heißt, sie sind gleich bis auf einen skalaren Faktor. --Physikinger (Diskussion) 00:00, 22. Sep. 2023 (CEST)Beantworten
1) Ich weiß nicht, was du unter "vollständiger Korrelation" verstehst. Falls du   meinst, daraus folgt nicht  .
2) Das wäre dann ein Vektorfeld und was anderes. Das Wort Verteilung ist eine Abkürzung für Wahrscheinlichkeitsverteilung.--Tensorproduct 20:03, 22. Sep. 2023 (CEST)Beantworten
1) Ich sagte ja X=c*Y. Also stört dich dieser Satz? "Bei zwei vollständig korrelierten Variablen lässt sich die Summe durch eine skalare Multiplikation ausdrücken." --Physikinger (Diskussion) 22:12, 22. Sep. 2023 (CEST)Beantworten
Aus   folgt auch nicht  . Der Satz ist so nicht richtig. Man kann zwei normalverteilte Zufallsvariablen konstruieren mit  , so dass die Sume   nicht mehr normalverteilt ist.Tensorproduct 19:17, 23. Sep. 2023 (CEST)Beantworten
Hallo Tensorproduct, en:Sum of normally distributed random variables beschreibt den von dir angesprochenen Aspekt noch nicht, magst du ihn ergänzen? biggerj1 (Diskussion) 07:40, 24. Sep. 2023 (CEST)Beantworten
Doch dort steht, dass   JOINTLY normal sein müssen (und ich habs irgendwo schon mal erwähnt). Sind sie nur zwei beliebige normalverteilte Variablen, dann gibt es Fälle, wo die Summe   nicht mehr normalverteilt ist.--Tensorproduct 11:10, 24. Sep. 2023 (CEST)Beantworten
Entschuldige die unkonkrete Ausdrucksweise: magst du einen Abschnitt mit Beispiel einfügen, wo die Summe von X und Y (jeweils normalverteilt) nicht normalverteilt ist? Ich fände das als Gegenüberstellung lehrreich. biggerj1 (Diskussion) 14:03, 24. Sep. 2023 (CEST)Beantworten
Ok das sehe ich ein. Danke für den Hinweis. Ich habe die Einschränkung auch nochmal in der Einleitung zu den Operationen beschrieben. --Physikinger (Diskussion) 13:03, 24. Sep. 2023 (CEST)Beantworten
Ich sehe das nirgends auf die schnelle. Nochmals: die Bedingung ist, dass   ein gaußscher Vektor in   ist, dann gilt, dass   für jedes   auch normalverteilt ist. Das   ein gaußscher Vektor ist, ist eine stärkere Bedingung, als nur zu sagen, das   und   einer Normalverteilung folgen.--Tensorproduct 14:38, 24. Sep. 2023 (CEST)Beantworten
Edit: falls mit "gemeinsamer Normalverteilung" gemeint ist, dass   ein gaußscher Vektor ist, so ist das ambig formuliert. "Gemeinsam" kann man m. E. auch so interpretieren, dass  . Das sollte besser beschrieben werden.--Tensorproduct 15:21, 25. Sep. 2023 (CEST)Beantworten
ok, ich habe es nochmal anders und hoffentlich klarer formuliert. --Physikinger (Diskussion) 01:36, 27. Sep. 2023 (CEST)Beantworten
Ok super, dann habe ich nichts mehr für den QS. Die Belege sollten bei Zeit aber trotzdem noch eingefügt werden.--Tensorproduct 17:02, 27. Sep. 2023 (CEST)Beantworten
Sorry, aber mehr Belege habe ich auch nicht. Die entscheidenden Gleichungen können in den angegebenen Referenzen nachgelesen werden oder in ein paar Fällen ist auch ein Hinweis zur Herleitung in der Fußnote angegeben. --Physikinger (Diskussion) 23:35, 27. Sep. 2023 (CEST)Beantworten
Man könnte zum Beispiel auch häufiger auf eine entsprechende Seite in Rasmussens-Buch verweisen. Aber ansonsten kann auch jemand anderes Quellen einfügen.--Tensorproduct 20:42, 6. Okt. 2023 (CEST)Beantworten
Ich denke, es wird genügend klar, dass Rasmussen hier die Hauptreferenz zum Nachlesen ist, da er bereits 10 mal referenziert wird. --Physikinger (Diskussion) 00:05, 11. Okt. 2023 (CEST)Beantworten
1) Es sind aber immer noch viele Abschnitte ohne Einzelnachweise (insbesondere in den Abschnitten Rechenoperationen, Regression und Sonderfälle). Informationen auf Wikipedia sollten für den Leser nachprüfbar sein, ohne dass man zuerst ein ganzes Kapitel lesen muss, um die entsprechende Stelle zu finden. Siehe Wikipedia:Belege: Alle nicht-trivialen Aussagen eines Artikels müssen belegt und auf diese Weise nachprüfbar sein.
2) Ein enzyklopädischer Artikel sollte sich natürlich nicht nur hauptsächlich auf ein einziges Buch stützen. Es ist ja keine Zusammenfassung eines Buches, sondern ein enzyklopädischer Artikel.
Manchmal ist es zwar nicht immer möglich, den letzten Punkt zu erfüllen, zum Beispiel wenn es einfach wenig Literatur gibt und/oder das Thema sehr fortgeschritten ist, aber das ist hier bei Gauß-Prozessen ja nicht der Fall. Es gibt Literatur wie Sand am Meer und auch noch aus verschiedenen Fachrichtungen.--Tensorproduct 14:50, 11. Okt. 2023 (CEST)Beantworten
Da Rasmussen hier das Hauptwerk zum Thema in der Literatur ist, macht es keinen Sinn, andere Quellen zu verwenden. Es ist die primärste Quelle, da Rasmussen das Anwendunggebiet auch wesentlich etabliert und geprägt hat.
Bezüglich der Rechenoperationen ist bei Fusion die Primärquelle zum Allgemeinfall angegeben. Die Zerlegung hat dieselbe Gleichung wie die Fusion mit einer etwas anderen Anwendung, ist also mehr ein Anwendungsbeispiel. Und bei der linearen Transformation ist die Herleitung angegeben und relativ trivial. Findet man vermutlich so kompakt nicht in der Literatur, höchstens einzeln in Teilen und Spezialfällen. Aber das fasst einfach alle wichtigen Operationen kompakt zusammen, die überall verwendet werden, insbesondere beim Kalmanfilter, der alle drei Operationen implizit enthält, wenn auch nicht ganz so offensichtlich.--Physikinger (Diskussion) 22:49, 11. Okt. 2023 (CEST)Beantworten