Portal:Unicode/Übereinkünfte

Aufgaben

Aufgaben des Portals sind der Inhalt der Kategorie:Unicode, einzelne Buchstabenartikel im Kategoriebaum der Kategorie:Schriftzeichen und in geringerem Maße auch Alphabetartikel. Ein langfristiges Ziel ist die systematische Erarbeitung von Vorschlägen für deutsche Namen für alle Unicode-Symbole.

Mitarbeiter

Bitte hier mit # ~~~ eintragen, wer interessiert ist, in diesem WikiProjekt mitzuarbeiten.

Prince Kassad (als Ersteller)
Reiner Stoppok (als Pionier)
Daniel Bunčić
Gismatis
jpp
Cäsium137 (D.)
Simplicius
Morty 17:32, 18. Apr. 2008 (CEST)[Beantworten]
Rainer Seitel 02:49, 21. Jun. 2008 (CEST)[Beantworten]

Ziele

~~Erstellung von Buchstabenartikeln aller Buchstaben im Repertoire des ISO 8859-1-Zeichensatzes~~ erledigtErledigt
Verbesserung der bestehenden Buchstabenartikel, mit Augenmerk auf die Sorgenkinder in der Kategorie:Kyrillischer Buchstabe
Erweiterung der Liste der Unicode-Zeichen
Beschreibungen zu den Unicode-Blöcken
Sichtung des vorhandenen deutschsprachigen Materials zur Benennung der Symbole sowie Erarbeitung von Vorschlägen für deutsche Bezeichnungen für alle Unicode-Symbole (in Anlehnung an das engl. Original).
Lemmatauglichkeit der deutschen Übersetzungen.
Deutsche Bezeichnungen für Unicode-Symbole und zwar ausschließlich mit lateinischen Buchstaben ohne Sonderzeichen geschrieben

Fehlende Artikel

edit

Livisches Alphabet - Doppelgravis (en) - ㄱ (ko) - Stabziffern (en) - ǲ (en) - ก (th)

Hinweise

Hinweise zur Artikelerstellung

Die in diesem WikiProjekt vewendete Unicode-Tabelle (auf englisch) befindet sich unter unicode.org.

Für noch nicht existierende Artikel zu Unicode-Blöcken (sowie zur Ergänzung von Zeichen zu bereits existierenden Artikeln) lassen sich die Tabellen und die Standard-Texte sehr einfach mit einem Online-Generator erzeugen (ausführlicherer Kommentar).

Buchstabenartikel

Als Lemma für Buchstabenartikel das Zeichen selbst nehmen.
Bei Buchstabenartikeln zu lateinischen Zeichen ist als Basis der Artikel Û in dieser Revision zu verwenden.
Bei Buchstaben, die in Unicode 4.1, 5.0 oder in 5.1 hinzugefügt wurden, sollte auf den Vorschlag (engl. proposal) verlinkt werden (Google-Suche nach der Bezeichnung, mit Seitenbegrenzung auf std.dkuug.dk).
Mehrere Buchstaben für dieselbe Sprache sollten, falls sie in keiner weiteren Sprache benutzt werden, in einen Sammelartikel zum Alphabet zusammengefasst werden.
Der Präfix für Unicode-Codepunkte ist U+, für alle anderen Zeichensätze lautet er 0x.
Man kann lateinische Buchstabenartikel von der chinesischen Wikipedia übersetzen, da dort recht viele bereits vorhanden sind. Die englische Wikipedia kann auch als Übersetzungsbasis dienen, die Informationen dort sind aber mit Vorsicht zu genießen.

Übersetzungsvereinbarungen

Folgende Wörterliste enthält Wörter der englischen Originalbezeichnungen der Zeichen, für die sich nebenstehende Übersetzung als Konsens herausgebildet hat. Um eine gewisse Einheitlichkeit zu gewährleisten, sollte stets der angegebene deutsche Ausdruck verwendet werden.

bar Je nach Lage: Querstrich, Schrägstrich, senkrechter Strich (wie stroke)
above übergesetzt (z. B. "mit übergesetzter Tilde")
below untergesetzt (z. B. "mit untergesetztem Komma")
caron Hatschek
diaeresis Trema
turned gedreht
stroke Je nach Lage: Querstrich, Schrägstrich, senkrechter Strich (wie bar)

Weitere Hinweise

Die Zeichentabelle von Microsoft zum Beispiel von Arial Unicode MS sollte möglichst nicht oder nur sehr kritisch als Basis für Buchstabenbezeichnungen verwendet werden, da die dortigen Bezeichnungen unüblich oder teilweise falsch sind. Weiterhin ist die Zeichentabelle nicht immer auf dem neuesten Stand, weswegen eine alternative Zeichentabelle aus dem Internet empfohlen ist.

Bitte welche alternative Zeichentabelle? Die unten notierten charsets müssen/können wohl bei SimSun (ein wohl erheblich vollständiger"er" Font als MS Arial Unicode für CJK) nicht übereinstimmen. Dumme(?) Frage: wie bekommt die charsets eines Fonts heraus? Für Arial Unicode von Microsoft habe ich diese Tabelle (gefunden wohl in der MS-rtf-Dokumentation):

   // 0 - ANSI
   // 1 - Default
   // 2 - Symbol
   // 3 - Invalid
   // 77 - Mac
   // 128 - Shift Jis
   // 129 - Hangul
   // 130 - Johab
   // 134 - GB2312        steht das fuer GB18030?
   // 136 - Big5
   // 161 - Greek
   // 162 - Turkish
   // 163 - Vietnamese
   // 177 - Hebrew
   // 178 - Arabic
   // 179 - Arabic Traditional
   // 180 - Arabic user
   // 181 - Hebrew user
   // 186 - Baltic
   // 204 - Russian
   // 222 - Thai
   // 238 - Eastern European (gemeint ist Mitteleuropa)
   // 254 - PC 437
   // 255 - OEM

[derzeit noch ohne wikipedia-benutzernamen,sorry.] Gruß Klaus

Weblinks

Offizielle Website des Unicode Consortium (englisch)
Suche nach englischen Bezeichnungen (mit Angabe von älteren englischen Bezeichnungen und Alternativbezeichnungen)
Unicode und ISO 10646 (französisch)
decodeunicode.org Unicode-Wiki mit Abbildungen aller 98.884 Unicode-Zeichen in drei Größen (deutsch/englisch, Volltextsuche)
Unicode 5.1 Zeichen und Symbole (deutsch)