Bearbeiten

--80.110.46.228 19:04, 28. Jan. 2014 (CET)Beantworten

Es fehlt...

Bearbeiten

...Sentiment Detection im Zusammenhang mit Entity/Information extraction, Stephan Hense (Diskussion) 18:31, 27. Mär. 2014 (CET)Beantworten

Ergänzungsvorschläge (Beispiele, verbesserte Methodik, schwierige Fälle, Anwendungen)

Bearbeiten
  • zur vorgestellten Methode von Begriffslisten (Sentimentlexika?). Im Abschnitt 'Vorgehen' finden sich folgende zwei Sätze:
    "Zur statistischen Analyse geht man von einer Grundmenge von Begriffen (oder N-Grammen) aus, mit denen man positive oder negative Tendenzen verbindet. Die Häufigkeiten positiver und negativer Begriffe im analysierten Text werden einander gegenübergestellt und bestimmen die vermutete Haltung."
    Allein zwei Listen (eine für positive, eine für negative Wörter/N-Gramme) zu haben und Vorkommen von Wörtern darin zu zählen ist eine relativ einfache, aber nicht die einzige Methode. Diese genannte Methode könnte verbessert werden, indem die Begriffe auch noch eine Zahl erhalten, wie positiv oder negativ sie sind. Auch wenn streitbar sein mag, wie sinnvoll das Zuweisen einer Zahl ist, so ließen sich doch damit Abstufungen modellieren (perfekt vs gut - ich geb zu mir fehlt ein einfaches Beispiel).
    Eine weitere Erweiterung wäre das Einbeziehen von Sentimentausdrücken modifizierenden Wörtern, wie beispielsweise Negationen (nicht, nie ...) und intensivierenden/abschwächenden Wörtern (eher, sehr, weniger). Zur Illustration, dass solche Erweiterungen sinnvoll sein könnten, folgende Beispiele:
    • Das Eis schmeckt (ganz/sehr/super) gut.
    • Das Eis schmeckt nicht schlecht.
    • Das Eis schmeckt nicht gut.
    • Das Eis schmeckt nicht so gut.
    • Das Eis schmeckt eher gut (als schlecht).
    • Seine/Ihre Leistungen sind in Ordnung / gut / sehr gut / ohne einen Makel / unübertroffen.

Vielleicht sind die Erweiterungen auch in den relativ allgemeinen letzten beiden Paragraphen des Abschnitts 'Vorgehen' angedacht.
PS: Die oben beschriebenen Erweiterungen sind nicht von mir erfunden - ich finde nur grade keine entsprechende Quelle.
PPS: Wäre eine Verlinkungen von Listen mit Sentimentwörtern sinnvoll?

  • Vielleicht wäre es hilfreich zu erwähnen, in welchen Fällen Sentiment Detection noch nicht optimal funktioniert?
    Ich denke da zum Beispiel an Sarkasmus und Ironie ('Aufgestanden und gleich im Bad ausgerutscht - Tag fängt heute echt super an').
  • Im Text könnte die Beantwortung der Frage 'warum beschäftigten sich Leute mit Sentiment Detection?' meines Erachtens nach deutlicher ausfallen - oder ist die Frage nicht relevant? Ich finde es schadet nicht zu erwähnen, dass Sentimentanalysesysteme beispielsweise genutzt werden können, um auf Twitter Stimmungsbilder vor Wahlen zu erstellen oder eine große Anzahl von Rezensionen zu sortieren. Bei beiden genannten Anwendungen (es gibt sicherlich mehr und vielleicht auch besser als Beispiel geeignete) ließe sich auch eine Verbindung zu anderen Text-Mining- oder computerlinguistischen Aufgabenstellungen aufzeigen: So müssten Tweets danach klassifiziert werden, ob sie die Wahl zum Thema haben, und bei Rezensionen könnte genauer unterschieden werden, was genau als gut oder schlecht bewertet wird (das ganze Produkt? ein Aspekt davon? welcher?). Bei Tweets könnten neben Wörtern auch Emoticons und Emojis zur Auswertung des Sentiments hinzugezogen werden.

PlusMinuscule (Diskussion) 19:35, 11. Okt. 2018 (CEST)Beantworten