Unicodeblock Tags
Der Unicodeblock Tags (U+E0000 bis U+E007F) enthält sogenannte Tags (deutsch Markierer). Diese wurden in Unicode 3.1 eingeführt und dienten ursprünglich dazu, die Textsprache, Schrift und Orthografie nach RFC 4646[1] in Nur-Text-Dateien anzugeben, z. B. um in einer Textdatei Kurz- und Langzeichen nebeneinander verwenden zu können. Sprachangaben werden mit dem einleitenden Sprachtag gestartet und dann mithilfe der Sprachtagzeichen der entsprechende Code angegeben. Die damit festgelegte Sprache wirkt sich auf sämtlichen nachfolgenden Text aus. Der schließende Sprachtag beendet die Sprachangabe.
Seit Unicode-Version 5.1 (aus dem Jahr 2008) wird von dieser Verwendung abgeraten, sie gilt als veraltet (englisch deprecated).[2]
Mit Unicode Version 8.0 wurden die Zeichen U+E0020 bis U+E007E wieder zugelassen, allerdings für neue allgemeinere Zwecke als nur zum Markieren der Sprache eines Textes.
Ab Version 9.0 wird von dieser Möglichkeit Gebrauch gemacht, und die Tag-Zeichen U+E0020 bis U+E007E bilden nun eine Sequenz von Modifier-Zeichen, welche bestimmten Emoji-Zeichen eine spezielle Bedeutung geben. Diese Sequenz wird mit dem Tag-Zeichen U+E007F abgeschlossen.
Bisher (bis Unicode 10.0) wurde nur ein einziger Typ von Sequenzen definiert: Das Zeichen U+1F3F4 (🏴 WAVING BLACK FLAG) kann durch eine Tag-Sequenz zu einer Landes- oder Regionen-Flagge modifiziert werden. Die Tag-Sequenz kodiert das Land bzw. die Region anhand der CLDR-Datenbank.
Beispiel: Der CLDR-Code für England ist GBENG (GB für Großbritannien, gefolgt von ENG für England). Die Flagge Englands kann nun als Emoji-Sequenz kodiert werden: <U+1F3F4> <U+E0067> <U+E0062> <U+E0065> <U+E006E> <U+E0067> <U+E007F> ergibt (wenn das Programm derartige Sequenzen bereits unterstützt): 🏴. Die anderen beiden subnationalen Flaggen mit breiter Unterstützung durch Software sind 🏴 Schottland und 🏴 Wales. Der vierte Landesteil des Vereinigten Königreichs, 🏴 Nordirland, besitzt hingegen keine Flagge und wird deshalb in der Regel mit der zuvor erwähnten schwarzen Flagge dargestellt statt der bei Sportveranstaltungen verwendeten Red Hand Flag of Ulster.[3]
Anmerkung: Bereits seit Unicode 6.0 gibt es die Möglichkeit, Landesflaggen jeweils über Paare von Zeichen aus dem Bereich U+1F1E6 bis U+1F1FF darzustellen, siehe Unicodeblock Zusätzliche umschlossene alphanumerische Zeichen
Tabelle
BearbeitenAlle Zeichen haben die allgemeine Kategorie „Formatierzeichen“ und die bidirektionale Klasse „Neutrale Begrenzung“.
Unicodenummer | Zeichen (400 %) |
Offizielle Bezeichnung | Beschreibung |
---|---|---|---|
U+E0001 (917505) | <format> | LANGUAGE TAG | Einleitendes Sprachtag |
U+E0020 (917536) | <format> | TAG SPACE | Tag Leerzeichen |
U+E0021 (917537) | <format> | TAG EXCLAMATION MARK | Tag Ausrufezeichen |
U+E0022 (917538) | <format> | TAG QUOTATION MARK | Tag Anführungszeichen |
U+E0023 (917539) | <format> | TAG NUMBER SIGN | Tag Rautezeichen |
U+E0024 (917540) | <format> | TAG DOLLAR SIGN | Tag Dollarzeichen |
U+E0025 (917541) | <format> | TAG PERCENT SIGN | Tag Prozentzeichen |
U+E0026 (917542) | <format> | TAG AMPERSAND | Tag Et-Zeichen |
U+E0027 (917543) | <format> | TAG APOSTROPHE | Tag Apostroph |
U+E0028 (917544) | <format> | TAG LEFT PARENTHESIS | Tag linke Klammer |
U+E0029 (917545) | <format> | TAG RIGHT PARENTHESIS | Tag rechte Klammer |
U+E002A (917546) | <format> | TAG ASTERISK | Tag Sternchen |
U+E002B (917547) | <format> | TAG PLUS SIGN | Tag Pluszeichen |
U+E002C (917548) | <format> | TAG COMMA | Tag Komma |
U+E002D (917549) | <format> | TAG HYPHEN-MINUS | Tag Bindestrich |
U+E002E (917550) | <format> | TAG FULL STOP | Tag Punkt |
U+E002F (917551) | <format> | TAG SOLIDUS | Tag Schrägstrich |
U+E0030 (917552) | <format> | TAG DIGIT ZERO | Tag Ziffer Null |
U+E0031 (917553) | <format> | TAG DIGIT ONE | Tag Ziffer Eins |
U+E0032 (917554) | <format> | TAG DIGIT TWO | Tag Ziffer Zwei |
U+E0033 (917555) | <format> | TAG DIGIT THREE | Tag Ziffer Drei |
U+E0034 (917556) | <format> | TAG DIGIT FOUR | Tag Ziffer Vier |
U+E0035 (917557) | <format> | TAG DIGIT FIVE | Tag Ziffer Fünf |
U+E0036 (917558) | <format> | TAG DIGIT SIX | Tag Ziffer Sechs |
U+E0037 (917559) | <format> | TAG DIGIT SEVEN | Tag Ziffer Sieben |
U+E0038 (917560) | <format> | TAG DIGIT EIGHT | Tag Ziffer Acht |
U+E0039 (917561) | <format> | TAG DIGIT NINE | Tag Ziffer Neun |
U+E003A (917562) | <format> | TAG COLON | Tag Doppelpunkt |
U+E003B (917563) | <format> | TAG SEMICOLON | Tag Semikolon |
U+E003C (917564) | <format> | TAG LESS-THAN SIGN | Tag Kleiner-als-Zeichen |
U+E003D (917565) | <format> | TAG EQUALS SIGN | Tag Gleichheitszeichen |
U+E003E (917566) | <format> | TAG GREATER-THAN SIGN | Tag Größer-als-Zeichen |
U+E003F (917567) | <format> | TAG QUESTION MARK | Tag Fragezeichen |
U+E0040 (917568) | <format> | TAG COMMERCIAL AT | Tag Klammeraffe |
U+E0041 (917569) | <format> | TAG LATIN CAPITAL LETTER A | Tag Lateinischer Großbuchstabe A |
U+E0042 (917570) | <format> | TAG LATIN CAPITAL LETTER B | Tag Lateinischer Großbuchstabe B |
U+E0043 (917571) | <format> | TAG LATIN CAPITAL LETTER C | Tag Lateinischer Großbuchstabe C |
U+E0044 (917572) | <format> | TAG LATIN CAPITAL LETTER D | Tag Lateinischer Großbuchstabe D |
U+E0045 (917573) | <format> | TAG LATIN CAPITAL LETTER E | Tag Lateinischer Großbuchstabe E |
U+E0046 (917574) | <format> | TAG LATIN CAPITAL LETTER F | Tag Lateinischer Großbuchstabe F |
U+E0047 (917575) | <format> | TAG LATIN CAPITAL LETTER G | Tag Lateinischer Großbuchstabe G |
U+E0048 (917576) | <format> | TAG LATIN CAPITAL LETTER H | Tag Lateinischer Großbuchstabe H |
U+E0049 (917577) | <format> | TAG LATIN CAPITAL LETTER I | Tag Lateinischer Großbuchstabe I |
U+E004A (917578) | <format> | TAG LATIN CAPITAL LETTER J | Tag Lateinischer Großbuchstabe J |
U+E004B (917579) | <format> | TAG LATIN CAPITAL LETTER K | Tag Lateinischer Großbuchstabe K |
U+E004C (917580) | <format> | TAG LATIN CAPITAL LETTER L | Tag Lateinischer Großbuchstabe L |
U+E004D (917581) | <format> | TAG LATIN CAPITAL LETTER M | Tag Lateinischer Großbuchstabe M |
U+E004E (917582) | <format> | TAG LATIN CAPITAL LETTER N | Tag Lateinischer Großbuchstabe N |
U+E004F (917583) | <format> | TAG LATIN CAPITAL LETTER O | Tag Lateinischer Großbuchstabe O |
U+E0050 (917584) | <format> | TAG LATIN CAPITAL LETTER P | Tag Lateinischer Großbuchstabe P |
U+E0051 (917585) | <format> | TAG LATIN CAPITAL LETTER Q | Tag Lateinischer Großbuchstabe Q |
U+E0052 (917586) | <format> | TAG LATIN CAPITAL LETTER R | Tag Lateinischer Großbuchstabe R |
U+E0053 (917587) | <format> | TAG LATIN CAPITAL LETTER S | Tag Lateinischer Großbuchstabe S |
U+E0054 (917588) | <format> | TAG LATIN CAPITAL LETTER T | Tag Lateinischer Großbuchstabe T |
U+E0055 (917589) | <format> | TAG LATIN CAPITAL LETTER U | Tag Lateinischer Großbuchstabe U |
U+E0056 (917590) | <format> | TAG LATIN CAPITAL LETTER V | Tag Lateinischer Großbuchstabe V |
U+E0057 (917591) | <format> | TAG LATIN CAPITAL LETTER W | Tag Lateinischer Großbuchstabe W |
U+E0058 (917592) | <format> | TAG LATIN CAPITAL LETTER X | Tag Lateinischer Großbuchstabe X |
U+E0059 (917593) | <format> | TAG LATIN CAPITAL LETTER Y | Tag Lateinischer Großbuchstabe Y |
U+E005A (917594) | <format> | TAG LATIN CAPITAL LETTER Z | Tag Lateinischer Großbuchstabe Z |
U+E005B (917595) | <format> | TAG LEFT SQUARE BRACKET | Tag eckige Klammer links |
U+E005C (917596) | <format> | TAG REVERSE SOLIDUS | Tag umgekehrter Schrägstrich |
U+E005D (917597) | <format> | TAG RIGHT SQUARE BRACKET | Tag eckige Klammer rechts |
U+E005E (917598) | <format> | TAG CIRCUMFLEX ACCENT | Tag Zirkumflex |
U+E005F (917599) | <format> | TAG LOW LINE | Tag Unterstrich |
U+E0060 (917600) | <format> | TAG GRAVE ACCENT | Tag Gravis |
U+E0061 (917601) | <format> | TAG LATIN SMALL LETTER A | Tag Lateinischer Kleinbuchstabe A |
U+E0062 (917602) | <format> | TAG LATIN SMALL LETTER B | Tag Lateinischer Kleinbuchstabe B |
U+E0063 (917603) | <format> | TAG LATIN SMALL LETTER C | Tag Lateinischer Kleinbuchstabe C |
U+E0064 (917604) | <format> | TAG LATIN SMALL LETTER D | Tag Lateinischer Kleinbuchstabe D |
U+E0065 (917605) | <format> | TAG LATIN SMALL LETTER E | Tag Lateinischer Kleinbuchstabe E |
U+E0066 (917606) | <format> | TAG LATIN SMALL LETTER F | Tag Lateinischer Kleinbuchstabe F |
U+E0067 (917607) | <format> | TAG LATIN SMALL LETTER G | Tag Lateinischer Kleinbuchstabe G |
U+E0068 (917608) | <format> | TAG LATIN SMALL LETTER H | Tag Lateinischer Kleinbuchstabe H |
U+E0069 (917609) | <format> | TAG LATIN SMALL LETTER I | Tag Lateinischer Kleinbuchstabe I |
U+E006A (917610) | <format> | TAG LATIN SMALL LETTER J | Tag Lateinischer Kleinbuchstabe J |
U+E006B (917611) | <format> | TAG LATIN SMALL LETTER K | Tag Lateinischer Kleinbuchstabe K |
U+E006C (917612) | <format> | TAG LATIN SMALL LETTER L | Tag Lateinischer Kleinbuchstabe L |
U+E006D (917613) | <format> | TAG LATIN SMALL LETTER M | Tag Lateinischer Kleinbuchstabe M |
U+E006E (917614) | <format> | TAG LATIN SMALL LETTER N | Tag Lateinischer Kleinbuchstabe N |
U+E006F (917615) | <format> | TAG LATIN SMALL LETTER O | Tag Lateinischer Kleinbuchstabe O |
U+E0070 (917616) | <format> | TAG LATIN SMALL LETTER P | Tag Lateinischer Kleinbuchstabe P |
U+E0071 (917617) | <format> | TAG LATIN SMALL LETTER Q | Tag Lateinischer Kleinbuchstabe Q |
U+E0072 (917618) | <format> | TAG LATIN SMALL LETTER R | Tag Lateinischer Kleinbuchstabe R |
U+E0073 (917619) | <format> | TAG LATIN SMALL LETTER S | Tag Lateinischer Kleinbuchstabe S |
U+E0074 (917620) | <format> | TAG LATIN SMALL LETTER T | Tag Lateinischer Kleinbuchstabe T |
U+E0075 (917621) | <format> | TAG LATIN SMALL LETTER U | Tag Lateinischer Kleinbuchstabe U |
U+E0076 (917622) | <format> | TAG LATIN SMALL LETTER V | Tag Lateinischer Kleinbuchstabe V |
U+E0077 (917623) | <format> | TAG LATIN SMALL LETTER W | Tag Lateinischer Kleinbuchstabe W |
U+E0078 (917624) | <format> | TAG LATIN SMALL LETTER X | Tag Lateinischer Kleinbuchstabe X |
U+E0079 (917625) | <format> | TAG LATIN SMALL LETTER Y | Tag Lateinischer Kleinbuchstabe Y |
U+E007A (917626) | <format> | TAG LATIN SMALL LETTER Z | Tag Lateinischer Kleinbuchstabe Z |
U+E007B (917627) | <format> | TAG LEFT CURLY BRACKET | Tag geschweifte Klammer links |
U+E007C (917628) | <format> | TAG VERTICAL LINE | Tag senkrechter Strich |
U+E007D (917629) | <format> | TAG RIGHT CURLY BRACKET | Tag geschweifte Klammer rechts |
U+E007E (917630) | <format> | TAG TILDE | Tag Tilde |
U+E007F (917631) | <format> | CANCEL TAG | Schließendes Tag |
Weblinks
Bearbeiten- Zeichentabelle. (PDF; 77 kB) Unicode-Konsortium (englisch).
Einzelnachweise
Bearbeiten- ↑ RFC: – Tags for Identifying Languages. September 2006 (englisch).
- ↑ Unicode 5.1.0 Eigenschaften
- ↑ Flag for Northern Ireland (GB-NIR) in Emojipedia (Vergleich der Darstellungen in verschiedenen Emoji-Sätzen, hier jedoch leer)