Textual Entailment
Unter Textual Entailment (Textuelles Schließen, kurz TE) versteht man in der Computerlinguistik (Natural language processing) die Modellierung von Folgerungsbeziehungen auf dem Gebiet der natürlichen Sprache. Diese Folgerungsbeziehungen werden in Form binärer Relationen zwischen zwei textuellen Einheiten (z. B. Sätzen), ausgedrückt, die man als Text bzw. Hypothese bezeichnet.[1]
Textual Entailment definiert den Folgerungsbegriff bewusst auf Ebene der natürlichen Sprache und durch menschliches Urteil. Das Textuelle Schließen umfasst auch Folgerungsbeziehungen, die nicht zwingend sind, aber die ein Mensch ziehen würde, weil sie sehr plausibel sind. Eine Hypothese folgt aus einem Text, wenn ein Leser des Textes mit hoher Wahrscheinlichkeit annehmen würde, dass die Hypothese wahr ist.[2]
Beispiel | |
Text (T) | Durch den Klimawandel schmilzt immer mehr Eis in der Arktis. |
Hypothese (H) | Die Arktis wird immer wärmer. |
Hier besteht eine textuelle Folgerungsbeziehung zwischen Text und Hypothese. Unter der Annahme, dass der Text (T) wahr ist, ist die Hypothese (H) außerordentlich plausibel. Dass es Umstände geben könnte, unter denen T wahr und H falsch ist (wenn z. B. das Eis durch Sonneneinstrahlung schmilzt, das Wasser aber im Durchschnitt kälter wird), spielt keine Rolle.
Vorteile in der formalen Semantik
BearbeitenDie klassische Forschung im Bereich der formalen Semantik ist im Allgemeinen repräsentationszentriert. Es werden geeignete formale Sprachen zur Bedeutungsrepräsentation entwickelt, und Beziehungen zwischen textuellen Einheiten werden über Beziehungen ihrer formalen Repräsentationen definiert.[3]
Textual Entailment ist jedoch nicht auf bestimmte Strategien festgelegt. Jeglicher Algorithmus, der als Eingabe zwei textuelle Einheiten T und H nimmt und entscheidet, ob H aus T folgt, kann als Textal Entailment-Verfahren verwendet werden. Die Bandbreite reicht dabei von sehr flachen, wissensarmen Verfahren bis hin zu voller logikbasierter Semantikkonstruktion. Damit stellt Textual Entailment auch ein interessantes Szenario für die Evaluation semantischer Verarbeitungsverfahren dar.
Die große Attraktivität von Textual Entailment für die maschinelle Sprachverarbeitung liegt darin, dass die semantische Verarbeitung vieler Anwendungen zumindest zum Großteil auf die Entscheidung textueller Folgerungsbeziehungen zurückgeführt werden kann. Ein Beispiel ist die Evaluierung der Ausgabe maschineller Übersetzungssysteme gegen eine Referenzübersetzung. Die Ausgabe ist dann vollständig und korrekt, wenn aus ihr die Referenz folgt und umgekehrt.
Variabilität der natürlichen Sprache
BearbeitenEine Eigenschaft der natürlichen Sprache besteht darin, dass viele verschiedene Möglichkeiten zur Verfügung stehen, etwas zu sagen, was man sagen will. Mehrere Bedeutungen können in einem einzigen Text enthalten sein, und gleiche Bedeutungen können durch verschiedene Texte zum Ausdruck gebracht werden. Diese Variabilität des semantischen Ausdrucks kann als duales Problem der Mehrdeutigkeitssprache gesehen werden.[4]
Die Interpretation eines Textes würde in der Theorie, eine gründliche semantische Interpretation auf einer logikbasierten Darstellung seine Bedeutungen erfordern. Als praktische Lösungen für die Verarbeitung natürlicher Sprachen, wird im Textual Entailment versucht, nicht in die Tiefe zu gehen und diese auf eine eher „einfache“ Art und Weise zu interpretieren.[5]
- Regierungschefin hält Rede zur Entwicklung der Wirtschaft.
- Bundeskanzlerin thematisiert konjunkturelle Situation.
- Merkel spricht über wirtschaftliche Aussichten.
Beispiele
BearbeitenTextual Entailment kann in drei verschiedenen Beziehungen dargestellt werden:[6]
Arten | Text | Hypothese |
---|---|---|
Positives TE (Text besteht Hypothese): | Hilf den Bedürftigen, Gott wird es dir vergelten. | Das Weitergeben des Geldes an arme Personen hat positive Folgen. |
Negatives TE (Text wider Hypothese): | Hilf den Bedürftigen, Gott wird es dir vergelten. | Das Weitergeben des Geldes an arme Personen hat keine Folgen. |
Kein TE (Text nicht verbunden noch wider): | Hilf den Bedürftigen, Gott wird es dir vergelten. | Das Weitergeben des Geldes an arme Personen hat zur Folge, dass man ein besserer Mensch wird. |
Praktische Anwendungen
BearbeitenSoftware-Systeme, die Sprachverstehen einsetzen, decken oft auch Arten des Textual Entailments ab. So setzen kognitive Suchmaschinen (oder bedeutungsorientierte Suchmaschinen) Textual Entailments ein; damit wird auch ein Suchtreffer gefunden, bei dem nur einer seiner Textual Entailments mit der Suchanfrage zusammenpasst.
Literatur
Bearbeiten- Roger Chaffin: The concept of a semantic Relation. In: Adrienne Lehrer u. a. (Hrsg.): Frames, Fields and contrasts. New essays in semantic and lexical organisation. Erlbaum, Hillsdale, N.J. 1992, ISBN 0-8058-1089-7, S. 253–288.
- Hermann Helbig: Die semantische Struktur natürlicher Sprache. Wissensrepräsentation mit MultiNet. Springer, Heidelberg 2001, ISBN 3-540-67784-4.
- Ido Dagan, Dan Roth, Mark Sammons: Recognizing Textual Entailment: Models and Applications (= Synthesis Lectures on Human Language Technologies). Morgan & Claypool Publishers, 2013, ISBN 978-1-59829-834-5.
Weblinks
Bearbeiten- Peter Kolb - HS Textual Entailment - Universität Potsdam – ling.uni-potsdam.de, abgerufen am 1. Februar 2015
- VL Einführung in die Computerlinguistik, Repräsentationen und Prozesse in der Sprachverarbeitung – coli.uni-saarland.de, abgerufen am 1. Februar 2015
Einzelnachweise
Bearbeiten- ↑ Department of Computer Science and Engineering, University of North Texas, USA: Textual Entailment as a Directional Relation ( des vom 11. August 2011) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. (PDF; 226 KB), 2007.
- ↑ Ion Androutsopoulos, Prodromos Malakasiotis: Department of Informatics Athens University of Economics and Business – A Survey of Paraphrasing and Textual Entailment Methods ( des vom 10. August 2017 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. (PDF; 648 KB), 2010.
- ↑ Aljoscha Burchardt: Universität Saarbrücken - Modeling Textual Entailment with Role-Semantic Information (PDF; 4,98 MB), 2008.
- ↑ Günter Neumann: Textual Entailment - Methoden und Anwendungen (PDF; 572 KB), 2010.
- ↑ Peter Kolb: Universität Potsdam – HS Textual Entailment – Überblick ( des vom 2. Februar 2016 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. (PDF; 134 KB), 2008.
- ↑ Ido Dagan, Oren Glickman, Bernardo Magnini: The PASCAL Recognising Textual Entailment Challenge ( des vom 3. März 2012 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. (PDF; 295 KB), 2005.