Die Type-Token-Relation (auch: Type-token-ratio, TTR, Diversifikationsquotient) ist in der quantitativen Linguistik ebenso wie in der quantitativen Stilistik ein Maß zur Feststellung des Grades an Komplexität im Wortschatz eines Texts.
Verfahren
BearbeitenGrundlage dazu ist die Unterscheidung der Wörter eines Textes in „token“ (jede einzelne vorkommende Wortform) und „type“ (Menge der vorkommenden Wortformen, die zu einem bestimmten Wort/Lexem gehören). Aus diesen beiden Konzepten (Token und Type) lässt sich nach Auszählung eines Textes die „Type-Token-Relation“ bilden – also die Relation zwischen der Zahl der Wörter im Text insgesamt und der Zahl der verschiedenen Wörter – und zur Beurteilung des Wortschatzreichtums nutzbar machen. Es lässt sich außerdem nachweisen, dass die Type-Token-Relation in Texten eine gesetzmäßige Dynamik entfaltet. Auch der Zusammenhang zwischen der Textlänge und dem Wortschatzumfang unterliegt einem Sprachgesetz.[1] Ferner weist der nähesprachliche Diskurs in Kontrast zur Distanzsprache eine geringe Type-Token-Relation auf, die durch häufige Wort-Iteration belegt wird.
Der Gedanke, eine Relation zwischen jedem einzelnen Vorkommen (token) einer Einheit und der Zahl der verschiedenen Einheiten (types) zu bilden, lässt sich auch auf andere Sprachebenen übertragen, wie Köhler in mehreren Arbeiten zur Syntax nachweist.[2]
MTLD
BearbeitenMTLD (measure of textual lexical diversity) ist ein sprachunabhängiges Verfahren,[3] welches einen wesentlich valideren Wert für die lexikalische Varianz eines Textes liefert, als dies mit den gängigen standardisierten und nicht standardisierten Type-Token-Verhältnismaßen möglich ist, da mittels einer speziellen Form der Textfaktorisierung die Abhängigkeit der Ergebnisse von der absoluten Textlänge eliminiert wird. Je höher der Wert, desto größer ist die Wortschatzvarianz.
Bezüge
BearbeitenDer Begriff „Diversifikationsquotient“ taucht unter anderem auch in dem Text „Der Sprachtest“ von Felix Mitterer auf.
Literatur
Bearbeiten- Karl-Heinz Best: Zum Wortschatzwachstum und -umfang in Texten. In: Naukovyj Visnyk Černivec’koho Universytetu: Hermans’ka filolohija. Vypusk 206–207, 2004, S. 31–43.
- Reinhard Köhler: Zur Wachstumsdynamik (Type-Token-Ratio) syntaktischer Funktionen in Texten. In: Sebastian Kempgen, Ulrich Schweier, Tilman Berger (Hrsg.): Rusistika - Slavistica - Lingvistika. Festschrift für Werner Lehfeldt zum 60. Geburtstag. Sagner, München 2003. S. 498–504.
- McCarthy, P. M. (2005): An assessment of the range and usefulness of lexical diversity measures and the potential of the measure of textual, lexical diversity (MTLD) [Microfiche]. University of Memphis: Doctoral dissertation
- Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme. In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin / New York 2005. S. 325–348; Quantitative Silistik: S. 339–340 ISBN 3-11-015578-8
- Gejza Wimmer: The type-token-relation. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin / New York 2005. S. 325–348; Quantitative Stilistik: S. 361–368 ISBN 3-11-015578-8
- Gejza Wimmer, Gabriel Altmann: Review Article: On Vocabulary Richness. In: Journal od Quantitative Linguistics 6, 1999, 1–9.
- Relja Vulanović, Reinhard Köhler: Syntactic units and structures. In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin / New York 2005. S. 325–348; Quantitative Stilistik: S. 274–291. Bes. S. 284–286. ISBN 3-11-015578-8
Weblinks
Bearbeiten- Rainer Perkuhn, Holger Keibel, Marc Kupietz: „Lexikalische Vielfalt“ (PDF; 126 kB) – Vor- und Nachteile von TTR, STTR und MTLD
- Tulpe L2 - Computergestützte Sprachstandsanalyse im Zweitspracherwerb - Umsetzung der Profilanalyse nach Grießhaber und Clahsen inkl. weiterer Indikatoren wie TTR, STTR, MTLD etc.