Grapheme (auch: Grafeme, von griechisch γραφή graphē ‚Schrift‘ und Suffix -em) sind die kleinsten bedeutungsunterscheidenden graphischen Einheiten des Schriftsystems einer bestimmten Sprache. Sie sind der sprachwissenschaftliche Untersuchungsgegenstand der Graphem(at)ik.

Begriffsgeschichte

Bearbeiten

Der Begriff folgt als emische Grundeinheit dem Bildungsmuster von Phonem und Morphem auf der graphischen Ebene und ensprechend kann ihm das etische Graph zur Seite gestellt werden. Diese Begriffe tauchen erstmals Anfang des 20. Jahrhunderts bei Baudouin de Courtenay auf, der Graphembegriff wurde aber um 1932 von Penttilä vermutlich unabhängig davon nochmals neu geprägt[1] und setzte sich erst anschließend international durch. Allerdings herrscht bis heute nicht in jedem Fall vollständige Einigkeit darüber, was ein Graphem ist und was nicht.

Schreibweise (Notation)

Bearbeiten

Grapheme aus dem Skript der Metasprache, d.h. lateinische sowie bei manchen Autoren auch griechische und kyrillische Buchstaben, werden in der Linguistik üblicherweise in spitze Klammern gefasst: ⟨a⟩, behelfsweise auch ‹a› oder <a>. Dies gilt auch für Graphemketten, also Buchstabenfolgen, die normalerweise orthographische Wörter bilden: ⟨abc⟩.

Grapheme aus Objektsprachen mit anderem phonographischen Skript werden meistens nicht gesondert gekennzeichnet, stattdessen wird ihre Transliteration eingeklammert und ggf. ihr Name angegeben: ψ ⟨ps⟩ Psi, ⟨ka⟩.

Die Bedeutung funktioneller und (teil-)logographischer Grapheme wird üblicherweise in Kapitälchen angegeben und folgt ansonsten den Konventionen für Lexeme: ΓMajuskel, ⟨&und Ampersand, ⟨shān / san / yama / …⟩ Berg, ⟨mù⟩ Wasser ‚sich die Haare waschen‘.

Im allgemeinen Sprachgebrauch werden Grapheme häufig nicht oder nicht deutlich von den sprachunabhängigen Schriftzeichen und den nur in segmentalen Schriftsystemen vorkommenden Buchstaben unterschieden. Selbst unter Schriftlinguisten ist die Terminologie uneinheitlich und bisweilen eurozentrisch. Die Abgrenzung zu den graphetischen Einheiten Graph und Glyphe ist teilweise schwierig und umstritten.

Lautsprache: Analogbildung zu Phonem

Bearbeiten

Das Graphem wurde analog zum Phonem geschaffen, also der kleinsten bedeutungsunterscheidenden lautlichen (phonischen) Einheit und damit Untersuchungsgegenstand der Phonologie.

Vielfach wird mit Bezug auf Aristoteles[2], Saussure[3] oder Bloomfield[4] die Schriftsprache nicht nur als phylogenetisch und ontogenetisch sekundär aufgefasst, sondern als einseitig abhängiges graphisches System. Vertreter dieser Dependenztheorie sehen das Graphem entsprechend als Abbild des Phonems.[5] Für Anhänger der konkurrierenden Autonomiehypothese – wie die Prager Schule – oder der vermittelnden Interdependenz- bzw. Korrespondenztheorie[6] sind die Begriffe hingegen parallel angelegt und gleichberechtigt.

Dies drückt sich bspw. auch in der Terminologie der Glossematik nach Hjelmslev aus, worin die kleinsten ausdrucksseitigen Einheiten Keneme genannt werden und sowohl Phoneme als auch Grapheme sein können; zusammen mit den inhaltsseitigen Pleremen bilden sie die kleinsten sprachlichen Zeichen, genannt Glosseme. Um es beiden Lagern recht zu machen, schlug McLaughlin[7] für phonemabhängige graphische Einheiten den Terminus Graphonem (neben Graphem) vor, während später Heller[8] stattdessen die Grapheme aufteilt in phonematisch bestimmte Phonographeme und graphematisch bestimmte Graphographeme, welche verallgemeinerte Klassen von konkreten Schriftzeichen seien.

Als semantisch distinktive Einheiten sollten sowohl Phoneme als auch Grapheme per Minimalpaaranalyse gefunden werden. Da das Lautmedium kontinuierlich, das Schriftmedium hingegen (annähernd) diskret ist, werden Phoneme durch den paarweisen Vergleich phonematischer Wörter als Teile der größeren Einheit Silbe gefunden, Grapheme hingegen als Kompositionen der kleineren Einheit Schriftzeichen (character), weil graphematische Wörter in vielen Schriftsystemen einerseits bereits klare Außengrenzen aufweisen und andererseits auch intern schon segmental strukturiert sind. In beiden Realisationen von Sprache tritt dabei als Sonderfall die Identität auf, indem ein Phonem einer (vokalischen) Silbe bzw. indem ein Graphem einem Buchstaben entspricht.

Suprasegmentalität: Abgrenzung von Buchstaben

Bearbeiten

Das Graphem sollte (gemeinsam mit dem Phonem) den vor der Linguistischen Wende verwendeten Begriff des Buchstaben (in anderen Sprachen letter, littera u.ä.) ersetzen, da dieser sowohl für schriftliche als auch für lautliche Sprachzeichen verwendet wurde. Seitdem seine phonische Bedeutung weitgehend verschwunden ist, verwenden einige Linguisten Buchstabe synonym zu oder anstelle von Graphem.[9]

Neef[10] argumentiert, dass die Graphematik einer Alphabetschrift allein mit der Einheit Buchstabe auskommen können müsse, da die Einheit Graphem sowohl durch Einzelbuchstaben, ⟨s⟩, als auch durch Buchstabengruppen, ⟨sch⟩, realisiert werden kann, und sich bspw. die Anfangsgroßsschreibung auf Buchstaben, ⟨Schnee⟩, statt auf Grapheme, *⟨SCHnee⟩, bezieht.

Sprachabhängigkeit: Anwendung von Schriftzeichen

Bearbeiten

Grapheme sind sprachabhängig, d.h. sie müssen für jede Schriftsprache bzw. für jedes Schriftsystem eigens bestimmt werden.

Im Sinne der Semantik sind im Unterschied zu den geläufigen Bezeichnungen eigentlich erst Grapheme sprachliche Zeichen, nicht aber Schriftzeichen. Beide werden jedoch als Glyphen realisiert.

Ein Alphabet unterscheidet sich von einem beliebigen geschlossenen Zeichensatz dadurch aus, dass es die Sortierreihenfolge der Buchstaben festlegt. Einige Alphabete dienen daher auch als Zahlzeichen.


Unterteilung: Graph und Glyphe

Bearbeiten

Grapheme sind kleinste sprachliche Einheiten, trotzdem lassen sie sich mitunter weiter unterteilen. Diese weitergehende Analyse ist per Definition nicht mehr Teil der (Schrift-)Linguistik, sondern Aufgabe einer ihrer Hilfswissenschaften, der Graphetik. Deren Betrachtungsgegenstand ist jede „konkrete, klassifizierbare graphische Erscheinung“[11] und heißt Graph. Grapheme sind dann Klassen von äquivalenten Graphen, die Allographe genannt werden.

So kann bspw. festgestellt werden, dass der heutige Graph ‹ö› historisch – paläographisch – nacheinander bevorzugt als ‹oe›, ‹› und ‹› dargestellt wurde, er je nach Schreib- bzw. Druckmedium – chiro- oder kalli- bzw. typographisch – auch wie ‹ō›, ‹õ› oder ‹ő› aussehen kann und ihm in anderen Sprachen – glottographisch – u.a. ‹œ› und ‹ø› weitgehend entsprechen. Wenn allerdings in der Rechtschreibung – orthographisch – regelmäßig ‹Ö› als syntagmatisch markierte Schreibung, ‹oe› als Ersatzschreibung und ‹eu› als Variantenschreibung zulässig sind, dann handelt es sich genauso um eine graphematische Analyse der Allographen des Graphems ⟨ö⟩ wie bei der eher technischen oder philosophischen Diskussion, ob es sich bei ⟨ö⟩ um einen Simplex oder um einen Komplex aus ⟨o⟩ und ⟨¨⟩ handelt.

Einige Graphetiker[12] haben die lateinischen und teilweise auch die griechischen Minuskeln dahingehend analysiert, wie ihre abstrakten Formbetandteile mit phonologischen Eigenschaften korrelieren; so haben bspw. die normalen Vokalbuchstaben ⟨a, e, i, o, u⟩ keine Ober- und Unterlängen. Da damit begründbar wäre, dass Grapheme kleinere Einheiten als Buchstaben sein können, wird die Definition mitunter um die Forderung ergänzt, dass Grapheme aus (in einem Frame) abgeschlossenen, ungebundenen, aber möglicherweise komplex zusammengesetzten Einheiten bestehen. Grapheme können also rekursiv sein, was sowohl bei Buchstabenverbindungen wie ⟨sch⟩ der Fall ist als auch bei den meisten Sinogrammen, da ihre Konstituenten – oder einige davon – jeweils selbst Grapheme sein können.

Viele Bezeichnungen graphischer Einheiten enden mit dem Morphem [-graph] oder [-gramm]. Mit dem ersten ist eher eine graphetische, mit dem zweiten eine graphematische Bedeutung assoziiert, aber die Unterscheidung bspw. zwischen Ideogramm und Ideograph wird nicht einheitlich und systematisch getroffen.

Wenn es um das (prototypische) Aussehen eines Graphs in einer bestimmten Hand- oder Druckschrift geht, spricht man stattdessen von Glyphen.

So haben etwa positionale Allographen, also solche, die sich am Wortanfang (initial), evtl. abhängig von den Nachbarn im Wort (medial), am Wortende (final) und alleinstehend (isoliert) optisch voneinander bis zu einem gewissen Grad unterscheiden, oder direktionale Allographen, die von der Schreibrichtung (horizontal oder vertikal, dextrograd oder sinistrograd) abhängen, mehrere Glyphen. Auch Ligaturen haben eigene Glyphen, obwohl sie aus mehreren Graphen bestehen, während einzelne Graphen aus Basis und Diakritikum aus zwei Glyphen zusammengesetzt werden können.

Spezifika / Typen

Bearbeiten

Grundsätzlich gibt es zwei Gruppen von Graphemtypen:

  1. Offene Zeichensätze mit mehreren Tausend Logo- oder Morphogrammen, die dialekt- und sprachübergreifend einheitlich gebraucht und zumindest prinzipiell über Konstitutionsregeln ständig um neue Zeichen erweitert werden können.
  2. Geschlossene Klassen einiger Dutzend bis Hundert Phonogramme, deren graphische Gestalt weitgehend arbiträr ist und die im Wortkontext – abhängig von zum Teil komplexen, konventionalisierten orthographischen Distributions- und Korrespondenzregeln – eine eindeutige, sprachabhängige Lesung mit lediglich dialektaler Varianz besitzen.

Daneben existiert eine Gruppe von Hilfsgraphemen für die Interpunktion, die üblicherweise erst auf syntaktischer Ebene von Bedeutung sind und zwar Einfluss auf die Aussprache der Phrase (Prosodie) haben können, selbst aber nicht verlautet werden. Dazu gehört als „Nullgraphem“ auch das Leerzeichen (Spatium) in verschiedenen Formen.

Offener Zeichensatz

Bearbeiten

Obwohl sie häufig Logogramme genannt werden, stehen Zeichen dieses Typs in der Regel nicht für vollständige Wortformen, sondern für das meist freie lexikalische Wortparadigma und die üblicherweise gebundenen grammatischen Affixe, also für L- und G-Morpheme. Deswegen wird alternativ von Morphogrammen gesprochen.

Der Grundstock dieser graphischen Zeichen ist häufig ursprünglich anhand konkret abbildender, piktographischer oder abstrakt symbolisierender, ideographischer Methoden gebildet worden. Beachtet man einige graphische Konventionen, die aus dem bevorzugt verwendeten Schreibmedien resultieren, besteht diese Möglichkeit der Zeichengenese prinzipiell weiterhin, doch normalerweise existiert ein beschränktes (Sub-)Inventar von Konstituenten, aus denen nach bestimmten Kombinationsregeln neue Zeichen zusammengesetzt werden können.

Üblicherweise wird der Begriff des Graphems hierbei jedoch abweichend von seiner eigentlichen Definition auf das Produkt und nicht auf die bedeutungsdifferenzierenden Konstituenten angewendet, die stattdessen als Subgrapheme o.ä. bezeichnet werden. Dies gilt umso mehr, wenn dieses, wie bei den ostasiatischen Sinogrammen üblich, unabhängig von seiner inhärenten und kombinatorischen Komplexität, d.h. der Anzahl der Striche und Teilzeichen, in einen unsichtbaren Rahmen (Frame) fester, üblicherweise quadratischer Größe eingeschrieben wird. Aufgrund dieser Formationsregel werden sie auch als Tetragramme bezeichnet, welche im normalen Schreib- und Leseprozess trotz ihres systematischen Aufbaus als atomar wahrgenommen werden. Da dies lediglich ein graphetischer und kein graphemischer Begriff ist, deckt er auch die Zeichen der geschlossenen, phonographischen Systeme der japanischen Kana und des koreanischen Hangul ab.

Die Subgrapheme können je nach Skript auch eigenständig verwendbar bleiben, sind dann also rekursive Einheiten auf verschiedenen Ebenen des Schriftsystems. Sie können verschiedene positionell motivierte Allographen aufweisen, d.h. sie sehen je nach Position und Kombination etwas anders aus.

Die Konstituenten leisten entweder als pleremisches Determinativ (Δ), auch Signifikum, einen Beitrag zur Bedeutung oder geben als kenemisches Phonetikum (Φ) einen Hinweis auf die Aussprache des Summengegenstandes, d.h. des Morphogramms. Beide sind in der Regel ungenau und nur in der konventionalisierten Kombination eindeutig. Wenn es nur wenige mögliche Determinative gibt, die somit nur eine grobe Kategorisierung zulässt, spricht man auch von Taxogrammen, wenn es für eine genauere semantische Einordnung taugt, auch von Semagrammen. In manchen Skripten können einige oder alle Subgrapheme beide Rollen einnehmen, in anderen sind sie auf eine beschränkt, z.B. bei den ägyptischen Hieroglyphen. Die Positionen im Gesamtzeichen können bevorzugt oder ausschließlich von dem einen oder dem anderen Typ belegt sein. Es treten je nach System nur einige oder alle denkbaren Kombinationen der beiden Typen auf: ΔΦ, ΦΔ, ΔΔ, ΦΦ sowie komplexere Konstrukte. Im einfachsten Fall steht ein einzelnes Phonetikum für ein Homophon und wenn mehrere, aber ausschließlich Phonetika verwendet werden, greift das Rebus-Prinzip, wobei unter mehren möglichen Zeichenalternativen oft die semantisch naheliegendste gewählt wird.

Bei einer engen Auslegung des Graphembegriffs, wenn also die Konstituenten als Grapheme und die Produkte als (zweidimensionale) Graphemketten oder als graphematische Wörter bezeichnet werden, verschwindet der Unterschied zu den Silbensystemen weitgehend. Das Phonographeminventar der Phonetika ist lediglich sehr groß, enthält Duplikate und überschneidet sich unter Umständen mit dem Graphographeminventar der Determinativa, welches es in klassischen Syllabaren nicht oder nur sehr eingeschränkt gibt.

Geschlossener Zeichensatz

Bearbeiten

Klassischerweise werden Phonogramme danach unterteilt, ob sie üblicherweise für die Repräsentation von Silben oder von Silbensegmenten (Buchstaben) verwendet werden.

Syllabische Grapheme

Bearbeiten
 
Segmentierung der Sprechsilbe (σ) in Reim (ρ), fakultatives konsonantisches (C*) Onset (ω), obligatorischen vokalischen (V+) Nukleus (ν), fakultative konsonantische Koda (κ) und ggf. tonalen (T?) Ton (τ)

In Silbenschriften werden das Zeicheninventar Syllabar und die Zeichen Syllabogramme genannt. Es gibt jedoch eine Vielzahl von Typen, da nie alle möglichen phonologischen Silben einer Sprache mit je einem exklusiven Syllabogramm verschriftet werden. Stattdessen gibt es orthographische Regeln, um mit einem beschränkten, ggf. sprachübergreifendem Repertoire auszukommen. Wegen derartiger Zeichenkombinationen wird der Graphembegriff manchmal auf „Syllabogrammketten“ wie die japanischen Yōon ausgedehnt.

In einer echten Silbenschrift können die silbischen Schreib- und Leseeinheiten als Grapheme angenommen werden, doch viele Systeme sind nicht völlig arbiträr:

Einerseits gibt es manchmal als Abugida bezeichnete synthetische Schriften wie die des indischen Brahmi-Schriftkreises, in denen Vokale entweder inhärent sind Ca ⟨Ca⟩ oder diakritisch an die silbischen Basen gebunden werden Cae ⟨Ce⟩ und dabei z.T. komplexe Ligaturen bilden. Da Konsonanten und Vokale auf unterschiedlichen Ebenen des Schriftsystems notiert werden, sehen manche Linguisten die gebildeten Silbenligaturen als Grapheme an, für andere unterscheidet sich dieses hierarchisch segmentale Prinzip nicht wesentlich von den gleichberechtigt segmentalen Schriften und entsprechend gelten vorbehaltlich einzelsprachlicher Untersuchungen beide phonographischen Zeichentypen als Grapheme. Eine besondere Art von Graphem in diesen Schriften ist das Virama, das wie ein Vokalzeichen verwendet wird, aber den Wegfall des inhärenten Vokals kennzeichnet.

Andererseits sind vor allem in der Neuzeit entwickelte Schriften wie die der Cree häufig systematisch, indem sowohl die Konsonanten als auch die Vokale der CV-Syllabogramme reihen- bzw. spaltenweise einheitlich geometrisch variieren. Hier stellt sich die Frage, ob die Zeichenorientierung graphemisch ist, also ob die Analyse Dreieck V, Spitze (rechts) unten Ce …, also ᐁ Ve, ᐃ Vi, ᐅ Vo, ᐊ Va, oder aber ᐁ e, ᐃ i, ᐅ o, ᐊ a lauten sollte.

In den meisten sogenannten Silbenschriften gibt es auch nicht-silbische Zeichen, z.B. solche wie das japanische ん n, die nur für die Koda verwendet werden können. Diese haben in der Regel ebenfalls Graphemstatus.

Segmentale Grapheme

Bearbeiten

Oft werden für Alphabetschriften pauschal die jeweiligen Buchstaben als Grapheme angesetzt (alphabetisches Graphem). Dies gilt auch für manchmal Abdschad genannte andere segmentale Skripte, in denen (manche) Vokale nicht auf derselben Schriftebene wie Konsonanten oder optional oder überhaupt nicht geschrieben werden.

Viele Linguisten verstehen die Groß- und Kleinbuchstaben als allographische Varianten desselben Graphems oder als „funktional verbundenes Paar von Graphemen“[13] , doch vor allem im Deutschen kann die Unterscheidung semantisch relevant sein, vgl. Adjektivarm⟩ vs. SubstantivArm⟩ vs. AkronymARM⟩. Zu beachten ist außerdem, dass die Anfangsgroßschreibung in vielen Sprachen auf Buchstaben, in manchen aber auf Grapheme wirkt, z.B. niederländisch ⟨IJssel⟩ statt *⟨Ijssel⟩. Daher postulieren einige Wissenschaftler abstrakte Funktionsgrapheme, die ihr Vorhandensein nur durch Interaktion mit anderen Zeichenkörpern anzeigen, z.B. „Supragrapheme“ bei Gallmann[14]. Diese Funktionen können syntagmatisch (aus dem Satz heraus) oder paradigmatisch (aus dem Wort heraus) und sogar rein graphostilistisch aktiviert werden. Damit können ⟨ARM⟩, ⟨Arm⟩ und ⟨arm⟩ jeweils als unmarkierte oder markierte Schreibungen von arm, Arm und ARM legitimiert und gleichzeitig ⟨aRM⟩, ⟨arM⟩, ⟨ArM⟩ und ⟨ARm⟩ ausgeschlossen werden.

Da das Graphem die kleinste bedeutungsunterscheidende Einheit ist, müssen bedeutungsgleiche Graphemketten, d.h. graphematische Wörter, aus denselben Graphemen aufgebaut sein. Viele Orthographien lassen aber bestimmte Varianten zu, z.B. ⟨Frisör⟩ und ⟨Friseur⟩, sodass schon allein deswegen nicht pauschal davon ausgegangen werden kann, dass ein Graphem einem Buchstaben entspricht (orthographisches Graphem). In der dependenztheoretischen Begriffswelt, wozu häufig die Schreibdidaktik gehört, kann zwischen dem im Normalfall verwendeten Basisgraphem, bspw. /t/ → ⟨t⟩, und seinen orthographisch begründeten Varianten, den Orthographemen, unterschieden werden, bspw. /t/ → ⟨d⟩ wegen Morphemkonstanz.

Da in vielen Schriftsystemen manche (feste) Buchstabenverbindungen in der Minimalpaaranalyse Positionen einnehmen, die sonst nur von Einzelbuchstaben eingenommen werden können, werden solche Digraphe, Trigraphe oder Plurigraphe oft ebenfalls als Grapheme dieser Sprache angesehen. In der lateinischen Schrift wird besonders häufig das ⟨h⟩ als hintere Komponente dieser Kombinationen verwendet. Der Buchstabe ⟨c⟩ in den (nicht nur) deutschen Verbindungen ⟨ck⟩ und ⟨ch⟩ kann als allographische Variante des Folgebuchstabens interpretiert werden, sodass sich die regelmäßiger gebildeten (theoretischen) Grapheme ⟨kk⟩ und ⟨hh⟩ ergeben; ähnliches gilt für das Verhältnis von ⟨tz⟩ zu ⟨zz⟩. Die diakritischen Zeichen, welche es übrigens auch in Silbenschriften gibt, können nach Gallmann[15] (hier am Beispiel der deutschen Umlaute) auf drei verschiedene Arten graphematisch analysiert werden:

  1. ä⟩, ⟨ö⟩, ⟨ü⟩ sind wie ⟨i⟩ eigenständige Grapheme. In österreichischen Telefonbüchern zeigt sich eine solche Interpretation darin, dass die Akzentbuchstaben hinter den Grundbuchstaben einsortiert werden, während sie in den skandinavischen Sprachen am Ende des Alphabetes angefügt werden.
  2. ä⟩, ⟨ö⟩, ⟨ü⟩ sind allographische Realisierungen der Graphemgruppen ⟨ae⟩, ⟨oe⟩, ⟨ue⟩ oder die Umlautpunkte Γ sind allograph zum ⟨e⟩. Diese Interpretation liegt Kreuzworträtseln und der Bibliotheksortierung zugrunde, bei der gleich klingende, aber anders geschriebene Namen beieinander stehen sollen.
  3. ä⟩, ⟨ö⟩, ⟨ü⟩ sind ⟨a⟩, ⟨o⟩, ⟨u⟩ plus diakritisches Zeichen «Umlautpunkte», d.h. sie bilden lediglich eine markierte Variante der Basisbuchstaben. Die Wörterbuchsortierung nutzt dieses Prinzip, da so aus Ableitungen (Derivation) gebildete Lexeme häufig bei ihren Stammwörtern stehen.

Der zweite und dritte Ansatz entspricht der umgangssprachlichen Ansicht, dass das deutsche Alphabet 26 Buchstaben habe.

Beispiel
Bearbeiten

So schreibt man nach traditioneller deutscher Rechtschreibung und ohne eingedeutschter Schreibung französischer Lehnwörter ⟨Nuß-Nougat-Crème⟩, wobei der Akzent häufig weggelassen wird, ⟨…-Creme⟩, und das End-‹e› stumm bleiben kann. Mit der Rechtschreibreform muss ⟨Nuß⟩ durch ⟨Nuss⟩ ersetzt werden, während der GallizismusNougat⟩ wahlweise als ⟨Nugat⟩ geschrieben und dann auch ⟨Creme⟩ je nach intendierter Aussprache zu ⟨Krem⟩ oder ⟨Kreme⟩ geändert werden kann. Damit teilt sich dieses Wort ohne Bedeutungsänderung in die orthographischen Grapheme ⟨N⟩⟨u⟩⟨ß|ss⟩⟨-⟩⟨N⟩⟨ou|u⟩⟨g⟩⟨a⟩⟨t⟩⟨-⟩⟨C|K⟩⟨r⟩⟨è|e⟩⟨m⟩⟨e|∅⟩, die allerdings bezüglich ihrer Kombination miteinander nicht völlig frei sind.

Der Bindestrich (und auf etwas andere Weise der Apostroph) nimmt in den europäischen Buchstabenschriften eine Sonderrolle ein, da er kein Phonogramm ist, also nicht direkt gesprochen wird, sondern lediglich den Status anderer Graphemketten verändern kann, indem er sie zu Komposita konkateniert. Neben diesem expliziten Bindestrich gibt es auch einen impliziten Trennstrich an allen möglichen Trennstellen> ⟨·⟩, an denen er ausschließlich am Zeilenende sichtbar wird. Obwohl hierbei häufig pauschal von Silbentrennung gesprochen wird, gibt es in den verschiedenen Schriftsystemen der Welt Trennverfahren an Silben-, Morphem- und Graphem-, selten auch an Glyphen-Grenzen. Die Zusammensetzung mehrerer Einzelwörter zu einem neuen kann je nach orthographischen Konventionen allerdings nicht nur durch einen Bindestrich ⟨x-y⟩, sondern auch durch direktes Aneinanderhängen ⟨xy⟩ oder – häufig außerhalb von Phrasen, aber nicht regelkonform – mit Leerzeichen (d.h. horizontaler Weißraum ⟨xy⟩ oder Zeilenumbruch ⟨x|y⟩) erfolgen, wobei die Anfangsgroßschreibung des hinteren Gliedes nicht erhalten bleiben muss, da nicht unbedingt eine Wortgrenze ⟨#⟩ enthalten ist.

Für das erste Graphem nach einer (initialen) Wortgrenze kann syntaktisch (wenn es mit initialer Satzgrenze zusammenfällt), grammatisch (beim nichtpronominalen Kopf einer Nominalphrase) oder lexemisch (bei Namen und Substantiven) motiviert eine Allographiebeschränkung greifen, der zufolge für den ersten Buchstaben des Graphems nur eine Majuskel zulässig ist. Ähnlich galten früher, vor allem im Fraktursatz, für das letzte Graphem vor einer medialen oder finalen Wortgrenze Sonderbedingungen wenn es mit dem Buchstaben ⟨s⟩ endet, welcher dann nicht mit dem Graph ‹ſ›, sondern als ‹s› und bei Verdopplung statt ‹ſſ› oder ‹ſsorthographisch ligiert als ‹ß› dargestellt wurde.

Das Graphem ⟨-⟩ kann also die Ausprägungen ‹-#›, ‹∅#›, ‹› (leer), ‹␣#› (Spatium) und ‹› (Zeilenwechsel) haben. Dabei ist zu beachten, dass diese Graphemvarianten die Teilwörter unterschiedlich stark aneinander binden und damit zur Bedeutungsdifferenzierung genutzt werden können, wodurch sie ggf. zu unterschiedlichen Graphemen werden: ⟨Nussnugatkrem⟩, ⟨Nuss-Nugat-Krem⟩, ⟨NussNugatKrem⟩ und eventuell auch ⟨Nuss Nugat Krem⟩ sind dasselbe Wort, wohingegen in ⟨Nuss-Nugatkrem⟩ und ⟨Nussnugat-Krem⟩ verschiedene semantisch relevante Akzente gesetzt werden, nämlich im ersten Fall bspw. in Abgrenzung zu ⟨Mandel-Nugatkrem⟩ oder ⟨Nuss-Kuchen⟩ und im zweiten Fall bspw. zu ⟨Nussnugat-Riegel⟩ oder ⟨Erdnuss-Krem⟩.

Damit lässt sich dieses Beispielwort mit seinen diachronen Varianten, die z.T. noch nicht oder nicht mehr orthographisch valide sind, graphemisch folgendermaßen beschreiben:

Nuss-Nougat-Creme
→ ⟨Nuss-Nougat-Crème
N⟩ → ⟨#n
C⟩ → ⟨#c
^c⟩ → ‹C
^k⟩ → ‹K
^n⟩ → ‹N
ss⟩ → ‹ss|ß
c⟩ → ⟨c|k
ou⟩ → ⟨ou|u
è⟩ → ⟨è|e
me⟩ → ⟨·me|m∅
·⟩ → ‹› ∨ ‹-↩› ∨ ‹
-⟩ → ⟨#·|#-#|∅|#␣#⟩ = ⟨#⟨·|⟨-|␣⟩#⟩|∅
##⟩ → ⟨#
#nu⟨ss⟩⟨-⟩n⟨ou⟩·gat⟨-⟩⟨c⟩r⟨è⟩⟨me⟩#
#nu(ß|ss)⟨-⟩n(ou|u)·gat⟨-⟩(c|k)r(è|e)(·|∅)m(e|∅)#

Diese Variantenanalyse trifft allerdings noch keine Entscheidung über tatsächlich im deutschen Schriftsystem vorhandene Grapheme, sondern identifiziert lediglich erste Kandidaten.

Langes, rundes und scharfes Es
s⟩ → ⟨ſ
ſſ⟩ → ⟨ſs|sſ|ss
ſs⟩ → ⟨ss#⟩ → ⟨ß⟩ → ‹ß› ∨ ‹ss
sſ⟩ → ⟨s#s⟩ → ‹sſ› ∨ ‹ss
ss⟩ → ‹ſſ› ∨ ‹ss
ſ#⟩ → ⟨s#⟩ → ‹s
ſ⟩ → ‹ſ› ∨ ‹s
^ſ⟩ → ⟨^s⟩ → ‹S
⟩ → ‹SS› ∨ ‹SZ› ∨ ‹
Umlaute
ä⟩ → ‹ä› ∨ ‹ae
ö⟩ → ‹ö› ∨ ‹oe
ü⟩ → ‹ü› ∨ ‹ue
Doppelvokale
aa⟩ → ‹aa› ∨ ‹ah
ee⟩ → ‹ee› ∨ ‹eh
ii⟩ → ‹ie› ∨ ‹ih› ∨ ‹ieh
oo⟩ → ‹oo› ∨ ‹oh
uu⟩ → ‹uh
Doppelkonsonanten
kk⟩ → ‹ck
zz⟩ → ‹tz
hh⟩ → ⟨ch
Plurigraphen
ch⟩ → ‹ch
sh⟩ → ⟨shh⟩ → ⟨sch⟩ → ‹sch
χ⟩ → ⟨kh⟩ → ⟨ch⟩ ∨ ⟨k
φ⟩ → ⟨ph⟩ → ‹ph› ∨ ‹f
θ⟩ → ⟨th⟩ → ‹th› ∨ ‹t
ρ⟩ → ⟨rh⟩ → ‹rh› ∨ ‹r
q⟩ → ‹qu


Technisches Graphem

Bearbeiten

Zur angewandten Linguistik gehört an der Schnittstelle zur Computertechnik die elektronische Kodierung von Schrift und ihrer Zeichen. Dabei gibt es glyphenbasierte Ansätze wie in 7bit-SMS-Nachrichten, graphem- / konstituentenbasierte Ansätze oder framebasierte Ansätze. In Unicode werden die Schriftzeichen zwar prinzipiell als Kombinationen von Grundeinheiten, welche kodiert werden, modelliert, aber teilweise aus Kompatibilitätsgründen und teilweise aus Pragmatik gibt es viele vorgefertigte Zeichen, was es erforderlich macht, kanonische Äquivalenzen und bevorzugte Codes festzulegen (bspw. NFC). So kann ein ⟨ä⟩ als Kombination aus ⟨aU+0061 und ⟨¨Trema U+0308 oder direkt als ⟨äU+00E4 gespeichert werden. Die koreanischen Hangul liegen sowohl als Einzelkomponenten (knapp 70 Jamo) als auch als Silbenblöcke (über 11000) vor, während Sinogramme nur als Gesamteinheit kodiert werden.

Die Zeichenkodierung braucht nicht auf einfache Weise mit der Eingabe über die Tastatur o.ä. korrelieren, bspw. werden Akzente über Tottasten vor dem Basisbuchstaben eingetippt, aber andersrum oder als eine Code-Einheit gespeichert.

Der Unicode-Standard verwendet den Begriff Graphem in vereinfachter und sprachunabhängiger Bedeutung:

Graphem (Grapheme)
  1. Eine minimale distinktive Einheit der Schrift im Kontext eines Schriftsystems, also ein graphisches Zeichen, mit dem zwei Wörter voneinander unterschieden werden können (Minimalpaaranalyse).
  2. Was Benutzer für ein Schriftzeichen (Character) halten.
Graphembasis (Grapheme Base)
Ein Schriftzeichen mit der entsprechenden, zugewiesenen Eigenschaft oder jeder Hangul-Silbenblock.
Graphemhaufen (Grapheme Cluster)
Text zwischen Graphemhaufengrenzen nach Anhang 29 „Textsegmentation“. Ein Graphemhaufen repräsentiert eine horizontal segmentierbare Texteinheit, bestehend aus irgendeiner Graphembasis kombiniert mit beliebig vielen nullbreiten Markern.
Graphemerweiterung (Grapheme Extender)
Ein Schriftzeichen mit der entsprechenden, zugewiesenen Eigenschaft. Graphemerweiterungszeichen sind alle nullbreiten Marker, nullbreiter Verbinder, nullbreiter Trenner und einige nichtnullbreite Marker.
Graphisches Schriftzeichen (Graphic Character)
Ein Schriftzeichen mit der Kategorie Buchstabe (Letter), Kombininierender Marker, Ziffer, Interpunktion, Symbol, oder Spatium.

Siehe auch

Bearbeiten

Literatur

Bearbeiten
  • Manfred Kohrt (1985): Problemgeschichte des Graphembegriffs und des frühen Phonembegriffs.
  • Peter Gallmann (1985): Graphische Elemente der geschriebenen Sprache, Kapitel 2.2 „Zum Begriff des Graphems“.
Graphemklassen nach Gallmann[16]
formal definierte Graphemklassen (graphische Mittel) funktional definierte Graphemklassen
Grapheme Supragrapheme
linear flächig
selbständig unselbständig konkret abstrakt konkret abstrakt
  • Buchstaben
  • Hilfszeichen
  • Leerzeichen
  • Ziffern
  • Sonderzeichen
  • diakritische Zeichen
  • Unterstreichen
  • Anfangsgroßschreibung
  • allgemeine Großschreibung
  • Kapitälchen
  • Schriftart
  • Schriftauszeichnung
  • Schriftgröße
  • Sperren
  • Ligaturen
  • Hoch-/Tiefstellung
  • Umrandung
  • Ton-, Rasterfläche
  • Zeile, Textblock
  • Ausschluss
  • Einzug
  • Zeilenanfang, -ende
  • Grundgrapheme
    => üblicherweise einfach „Graphem“
  • Ideogramme
  • Klassifikatoren
  • Grenzsignale
  • Satzintentionssignale
  • Auslassungssignale

Einzelnachweise

Bearbeiten
  1. Manfred Kohrt (1985): Problemgeschichte des Graphembegriffs und des frühen Phonembegriffs, 167.
  2. „Nun sind die (sprachlichen) Äußerungen unserer Stimme Symbole für das, was (beim Sprechen) unserer Seele widerfährt, und unsere schriftlichen Äußerungen sind wiederum Symbole für die (sprachlichen) Äußerungen unserer Stimme.“ Aristoteles: Peri Hermeneias. 16a3–6
  3. „Sprache und Schrift sind zwei verschiedene Systeme von Zeichen; das letztere besteht nur zu dem Zweck, um das erstere darzustellen. Nicht die Verknüpfung von geschriebenem und gesprochenem Wort ist Gegenstand der Sprachwissenschaft, sondern nur das letztere, das gesprochene Wort allein ist ihr Objekt.“ (Ferdinand de Saussure (1916): Cours de linguistique générale, 28.)
  4. „Writing is not language, but merely a way of recording language by means of visible marks.“ Leonard Bloomfield (1933): Language, 21.
  5. Kohrt (1985): Kapitel 5 „Das ‚Graphem‘ als Phonemzeichen“.
  6. Kohrt (1985): Kapitel 6 „Das ‚Graphem‘ als autonome Einheit der geschriebenen Sprache“.
  7. John C. McLaughlin (1963): A Graphemic-Phonemic Study of a Middle English Manuscript, 29–32. The Hague: Mouton. Zitiert in Kohrt (1985), 319.
  8. Klaus Heller (1980): „Zum Graphembegriff“, 92–96. In: Dieter Nerius / Jürgen Scharnhorst (Hgg.): Theoretische Probleme der deutschen Orthographie, 74–108. Berlin: Akademie Verlag. Zitiert in Kohrt (1985), 319.
  9. character
    … 2. conventional term for a unit of the Chinese writing system in East Asian scripts
    diacritic
    a mark added to a character to indicate a modified pronunciation (or sometimes to distinguish homophonous words)
    grapheme
    term intended to designate a unit of a writing system, parallel to phoneme and morpheme, but in practice used as a synonym for letter, diacritic, character (2), or sign (2)
    letter
    a self-contained unit of an abjad, alphabet, or abugida
    sign
    … 2. conventional term for a self-contained unit of cuneiform script
    Daniels / Bright (1995): The World’s Writing Systems, Glossary.
  10. Martin Neef (2005): Die Graphematik des Deutschen, Kapitel 2.2 „Die Grundeinheiten der graphematischen Komponente“.
  11. Peter Gallmann (1985): Graphische Elemente der geschriebenen Sprache, §47.
  12. u.a. Primus, Brekle
  13. Peter Gallmann (1985): Graphische Elemente der geschriebenen Sprache, §30.
  14. Peter Gallmann (1985): Graphische Elemente der geschriebenen Sprache, §31.
  15. Peter Gallmann (1985): Graphische Elemente der geschriebenen Sprache, §39.
  16. Peter Gallmann (1985): Graphische Elemente der geschriebenen Sprache, §28.