Diskussion:Emotionserkennung
Quellenangaben
BearbeitenIch habe gerade den Baustein mit Hinweis auf Quellenangaben eingefügt. Im ganzen Artikel findet sich keine einzige Angabe. Besonders ist mir das bei diesem Satz aufgestoßen:
„Abzuraten für Experimente außerhalb der EEG-Emotionsforschung ist von Induktionsverfahren wie dem IAPS oder Induktionsverfahren, die angeblich emotionsinduzierende Filmsequenzen oder Musikstücke anwenden. All diese Verfahren bleiben einen Nachweis der spezifischen Wirksamkeit schuldig.“
Viele (angesehene) Wissenschaftler benutzen solche Methoden. Welche Alternativen gibt es?
Auch die "Wissenschaftliche Definition Emotion" steht da ohne Quellenangabe und es handelt sich dabei sicher nicht um die einzige publizierte Definition. --Enricopedia ⇄ 15:39, 30. Sep. 2008 (CEST)
Zum Absatz in der Einleitung:
BearbeitenDie Behauptung, dass DIE Robotik den Satz "Ich bin fröhlich." als einen emotionalen Zustand der Freude im Sender interpretiert ist etwas aus der Luft gegriffen und sollte mit wissenschaftlicher Literatur belegt werden, wenn das weiterhin so im Artikel stehen soll. Insbesondere der Bezug auf die Psychologie sollte belegt werden.
Die Erkennung von Emotionen in Text oder Audio (ggf. auch auch visuell durch Gesichtsausdrücke) wird im Natural Language Processing (NLP) breit diskutiert, wobei gerne Begriffe und Operationalisierungen (z.B. von Emotionslabels wie Freude, Trauer, Angst, Wut, etc.) aus der Psychologie übernommen werden. Siehe Ekman (1992) und Plutchik (1991).
Das Problem hier ist eines der "Annotationsperspektive", also die Unterscheidung ob eine Emotion hypothetischerweise vom Sender intendiert war (Writer Perspective), im Text ausgedrückt ist (Text Perspective), oder im Empfänger ausgelöst wird (Reader Perspective). Die jeweilige Perspektive hat einen großen Einfluss auf die Wahl der sinnvollerweise verwendeten Emotionslabels und hängt auch stark vom (situativen, pragmatischen) Kontext ab. Die Basisemotionen von Ekman und Plutchik zielen tendenziell auf Alltagssituationen ab und sind darauf ausgerichtet das Überleben der Beteiligten zu sichern, während Kunstwahrnehmung ein breiteres Spektrum und subtilere Emotionen zulässt. Vielleicht war die Emotion "Ekel" vom (Alltags-)Autor intendiert. "Ekel" zu spüren verlangt aber einiges vom Leser (Empfänger) ab, nämlich im 'Bestfall' eine physiologische Reaktion der Übelkeit, die ggf. nicht erreicht werden kann. Außerdem ist zu unterscheiden: Spürt das der Autor beim Schreiben, oder will er den Zustand im Empfänger erzeugen?
Die verschiedenen Perspektiven machen es auch unterschiedlich schwer die jeweilige Emotion zu erkennen und zu attribuieren (es ist wesentlich schwerer die ggf. nicht overt ausgedrückte, intendierte Emotion des Senders zu erkennen, aber offensichtliche Ausdrücke wie "ich bin traurig." im Text zu interpretieren ist nicht allzu dramatisch, während ein 'lol', ein #sad, oder ein #blessed nicht zwangsweise das Ausmaß der Emotion im Sender widerspiegelt). Nichtzuletzt ist es wichtig zu unterscheiden ob der Agent, der die Emotion erkennen soll, ein Mensch oder eine Maschine ist. Für Menschen ist es nämlich vergleichsweise einfach die eigenen Emotion zu erkennen (abgesehen von Leuten die Hunger nicht von Trauer unterscheiden können), während Maschinen da nicht unbedingt einen Unterschied zwischen den Perspektiven machen, und nur entsprechend dem Task trainiert werden müssen.
Meine Frage ist dann was genau der state-of-the-art in der Robotik dazu ist, ob die Robotik selbst überhaupt etwas zum Diskurs beiträgt, oder ob nicht statt dessen von Machine Learning und NLP gesprochen werden sollte.
Quellen zur Annotationsperspektive aus der NLP:
https://www.aclweb.org/anthology/E17-2092/
https://www.aclweb.org/anthology/W17-0801/
https://www.aclweb.org/anthology/2020.lrec-1.205.pdf
Grüße, Tom Tom-bot-386 (Diskussion) 10:23, 21. Aug. 2020 (CEST)