Portal Diskussion:Unicode/Archiv/2013

Letzter Kommentar: vor 10 Jahren von Antonsusi in Abschnitt Bezeichnung "Nullbreiter Verbinder"

Beschreibung vertauscht der Zeichen U+2404 und U+2405 auf Unicodeblock Symbole für Steuerzeichen?

Hoppla, auf Unicodeblock Symbole für Steuerzeichen bin ich über folgendes gestolpert:

Unicodenummer Zeichen
(400 %)
Beschreibung Offizielle Bezeichnung
U+2404 (9220) Symbol für Übertragungsende („EOT“) SYMBOL FOR END OF TRANSMISSION
U+2405 (9221) Symbol für Abfrage („ENQ“) SYMBOL FOR ENQUIRY

Ist hier die Beschreibung der Zeichen vertauscht - oder hat die eingesetzte Schriftart was verwechselt? --J.K (Diskussion) 13:14, 26. Jan. 2013 (CET)

Also hier unterwegs sieht alles OK aus, also wird es wohl an der Schriftart liegen. -- Liliana 13:18, 26. Jan. 2013 (CET)

Ich sehe die Tabelle auch richtig. Welchen font benutzt du ? ÅñŧóñŜûŝî (Ð) 23:18, 26. Jan. 2013 (CET)

Mathematisches Symbol „Inkrement“ ( U+2206)

Das Unicode-Zeichen mit der Nummer 8710 (hexadezimal 0x2206), enthalten im Unicodeblock Mathematische Operatoren, wird als „Inkrement“ bezeichnet. Seine Glyphe ist nahe am großen Delta, siehe Microsoft typography: This character is the same design as the uppercase Greek Delta U+0394. Sichtbar wird dies in der Tabelle bei Windows Glyph List 4.

In manchen Beschreibung findet sich bei (U+2206) ein Verwendungshinweis auf "Laplace-Operator". Direkt danach steht in der Codetabelle (U+2207), das Nabla-Symbol. Beide Symbole stehen auch bei Mathematische Symbole#Differentialgeometrie im selben Abschnitt.

In unseren Artikel zum Laplace-Operator wird das TeX-Symbol \Delta verwendet und im Artikel Delta wird dessen Verwendung für den Laplace-Operator angeführt. Bislang findet sich die Anwendung von (U+2206) für die Darstellung des Laplace-Operator nicht in unseren Artikeln. Und vom o.g. Unicodeblock-Artikel wird bei (U+2206) „Inkrement“ verlinkt zu Inkrement und Dekrement, was keinen Hinweis auf die Verwendung für den Laplace-Operator enthält.

Wie lässt sich die Verwendung in unsere WP-Artikel einbauen? Könnte eine Begriffsklärungsseite "Inkrement" der Weg sein? --KaPe (Diskussion) 23:21, 27. Jan. 2013 (CET)

Ich habe den Link umgebogen auf Differenzenrechnung (in dem Sinne bzw. so wie   in Enthalpie ist Inkrement nämlich gemeint), und habe auch einen Hinweis auf die Verwendung als Laplace-Operator eingefügt. --Schnark 09:17, 29. Jan. 2013 (CET)

Bedeutung eines Wingding-Symbols

Wie heißt das Wingdings-Symbol mit der Unicode-Nr. 61562? Habe das nicht rausfinden können. Danke.46.223.87.97 23:26, 8. Feb. 2013 (CET)


61562 (Dez.) = U+F0FA befindet sich im Private-Use-Block. Da gibt es keine Festlegungen. ÅñŧóñŜûŝî (Ð) 21:01, 11. Feb. 2013 (CET)

Okay, danke. Ich dachte einfach, dieses Zeichen hätte irgendeinen Namen und eine Bedeutung, wie z.B. beim Aldus-Blatt. 37.49.23.45 00:09, 14. Feb. 2013 (CET)
In diesem Block kann jeder Hersteller einer Schriftartdatei beliebige Zeichen platzieren. Wird oft für Darstellungen von Spielkarten-Versionen, exotischeren Schachsymbolen u.Ä genutzt. ÅñŧóñŜûŝî (Ð) 00:53, 15. Feb. 2013 (CET)
Danke noch mal. Es ging mir einfach nur um den Namen des Zeichens, man müsste doch meinen, dass es einen hat; es kam mir eben "interessant" vor. 46.223.87.251 01:53, 15. Feb. 2013 (CET)
Hinter der von Dir angegebenen Nummer steckt kein eindeutiges Zeichen. Du müsstest also mehr Informationen zur Verfügung haben, um weiter recherchieren zu können. In welchem Kontext (Schriftart, Unternehmen) hast Du es denn gesehen? Über den Ersteller könntest Du vermutlich auch den Namen erfahren. Ansonsten scan das Zeichen ein und verlink den Scan hier. Eventuell kennt es ja jemand aus einem anderen Zusammenhang. --RonaldH (Diskussion) 08:47, 15. Feb. 2013 (CET)
Hast du es im Computer oder auf Papier vorliegen ?
  1. Wenn du es auf Papier hast, dann einfach mal Scannen und hochladen.
  2. Steht es in einer Datei, dann stelle das Zeichen auf dem Monitor möglichst groß dar, mach einen Screenshot, entferne überflüssige Bereiche des Bilds und lade es dann hoch. ÅñŧóñŜûŝî (Ð) 16:28, 15. Feb. 2013 (CET)
Nein, bei einem Unternehmen habe ich es nicht gesehen, ein WP-Benutzer hatte es auf seiner Benutzer-Seite, ich weiß aber nicht mehr, wer. Bin über die WP-Auskunft dorthin gelangt. Das Zeichen ist ein Teil der TrueType-Schriftart Wingdings, es ist das 7.Zeichen in der 4. Zeile. Ich kann noch mal nach dem Benutzer schauen, es war der Tag dieser Anfrage hier. Extra anmelden möchte ich mich ungern. Danke an alle beide. 37.49.20.116 19:37, 15. Feb. 2013 (CET)
PS: Im WP Artikel Wingdings ist es das 7.Zeichen von links in der 8.Zeile. 37.49.20.116 20:20, 15. Feb. 2013 (CET)

61562 (Dez.) = U+F07A ist in Unicode enthalten als U+2318 place of interest sign, siehe hier. Zur Gleichsetzung dieser Zeichen siehe auch dies ISO-Dokument, Seite 22 unten. -- Karl432 (Diskussion) 21:09, 15. Feb. 2013 (CET)

@ Karl432: Super, genau solche Informationen wie im verlinkten WP-Artikel hatte ich hauptsächlich gesucht. Vielen Dank!

Doch noch eine Frage an @ Karl432: Wie hast du das gesuchte Zeichen hier eingegeben? Einfach von der Schriftart rüberkopieren hatte ich versucht, ging aber nicht. Sonst hätte ich es damit in den WP-Artikeln gesucht, es gab jedoch einfach keine Eingabemöglichkeit, das Zeichen zu erzeugen. Danke. 134.3.72.211 17:50, 16. Feb. 2013 (CET)

Ich benutze (unter Windows) die Freeware BabelMap für Zeichen, die nicht auf meiner T2-Tastatur zu finden sind. -- Karl432 (Diskussion) 22:07, 16. Feb. 2013 (CET)

Ach so, kenne ich nicht, wußte nicht, dass es Programme dafür gibt. Habe mich auch noch nie mit den Unicodes intensiver beschäftigt und Sonderzeichen nur innerhalb des Schreibprogramms eingefügt. Auf dieses Sonderzeichen war ich ja auch nur zufällig gestoßen. Danke noch mal. 109.193.160.246 00:06, 17. Feb. 2013 (CET)

Reservierter Unicode

Was hat es sich mit den reservierten Junicodes bei Unicodeblock Verschiedene Symbole und Pfeile auf sich? Sollen diese erst in einer späteren Version eingebaut werden?—80.226.24.8 20:15, 25. Feb. 2013 (CET)

Ich wiederhole einfach nochmal meinen Bearbeitungskommentar: „Reserviert“ heißt nichts anderes als „noch nicht belegt“, das ist eine Nicht-Information, die wir in anderen Blöcken auch nicht angeben. Falls mal drei weitere mathematische Pfeile kodiert werden sollen, könnten sie in der Lücke dort landen. Am Ende des Blocks ist ohnehin noch viel mehr Platz, als die Liste angegeben hat. Reservierte Codepunkte können und werden in den meisten Fällen in späteren Versionen belegt (außer bei dauerhaft reservierten Codepunkten), wobei es auch einige reservierte Codepunkte gibt, die zwar theoretisch belegt werden dürften, aber aus Gründen der Systematik immer unbelegt bleiben werden, etwa die Lücken im Unicodeblock Mathematische alphanumerische Symbole. --Schnark 09:17, 26. Feb. 2013 (CET)

Device Control String

(Von Diskussion:Unicodeblock_Lateinisch-1,_Ergänzung kommend:) Wann und von wem wurde der Device Control String (Unicode x90) eingeführt? Dass dieses Steuerzeichen bei Druckern verwendet wird muss man wohl auch selber vermuten, oder gibt es weitere Anwendungen? --Itu (Diskussion) 15:28, 15. Jun. 2013 (CEST)

Auf en.wiki findet man dazu etwas: en:C0 and C1 control codes -- Liliana 15:47, 15. Jun. 2013 (CEST)

ULS

Seit Kurzem ist die ULS-Erweiterung hier aktiv, die unter anderem freie Schriftarten einbinden kann. Soweit ich es sehe, reagiert sie aber nur auf Sprachen (sprich, ein lang-Attribut). Sollen wir die Vorlagen für Unicodetabellen so umstellen, dass auch ein Sprachcode angegeben werden kann, und die Erweiterung damit fehlende Zeichen liefert? Zur Verdeutlichung: Das da ᨀ sehe ich nur als ein Kästchen, ebenso wie den Rest von Unicodeblock Buginesisch. Mit Sprachauszeichnung bekomme ich jetzt aber eine hübsche Anzeige: . --Schnark 11:42, 9. Jul. 2013 (CEST)

Da wo es sinnvoll ist, kann man es machen. Die Erweiterung überschreibt aber alle anderen Schriftartangaben, was man sich bewusst sein sollte. -- Liliana 14:40, 9. Jul. 2013 (CEST)
Wie funktioniert diese Erweiterung denn genau? Überschreibt sie Einstellungen auf der Benutzer-CSS-Seite? Wenn das der Fall ist, dann muss man die Erweiterung wohl hinterfragen. Buginese enthält nur Zeichen aus der Unicodeversion 4.1. Die kannst du alle mit Code2000, einer älteren und seit längerem nicht mehr aktualisierten Schrift darstellen lassen. ÅñŧóñŜûŝî (Ð) 16:02, 9. Jul. 2013 (CEST)
In meinem Beispiel oben hat ULS dem span ein zusätzliches style-Attribut verpasst: font-family: Saweri,sans-serif; --Schnark 09:21, 10. Jul. 2013 (CEST)
Ich würde es als Zumutung empfinden, wenn man mir bei der Darstellung eine bestimmte Schriftart aufzwingen würde und ich diese dann installieren muss, wenn mein Browser mit "sans-serif" eine ungünstige Schrift auswählt. Deshalb würde es mich interessieren, ob dieses Tag auch auftaucht, wenn man eigene CSS-Klassen definiert hat, also innerhalb von Tabellenzellen oder eines bereits vorhandenen Span-Tags mit einer CSS-Klasse. Gib hier doch bitte mal ein paar Quelltextbeispiele. ÅñŧóñŜûŝî (Ð) 17:47, 10. Jul. 2013 (CEST)
So, wie es im Augenblick gemacht wird, würde eine Sprache, für die ULS eine Schriftart kennt, deine Schriftart überschreiben. Installieren musst du sie nicht, sie wird (wie Bilder etc.) mit übertragen (siehe Webfont). Du könntest mit CSS wie
.aegeannumber, .aegeannumber * {font-family:'Aegean' !important;}
auch weiterhin deine Schriftart aussuchen. Nur extrem wenige Benutzer suchen sich auf diese Weise passende Schriftarten aus, in vielen Fällen (wie etwa bei mir) kann der Leser auch gar keine alternativen Schriftarten installieren, weil er nicht die nötigen Rechte hat (oder nicht weiß, wie es geht), und ist damit darauf angewiesen, dass geeigente Schriftarten in die Seite eingebunden werden. --Schnark 09:44, 11. Jul. 2013 (CEST)
Da stellt sich die Frage, ob die vom Server gelieferten Fonts auch immer ein anständiges Bild ergeben. Bei exotischen Zeichen mag das relativ egal sein, da diese Zeichen fast nur in den IWs und den Unicodelisten auftauchen. Bei gängigen Zeichen, insbesondere lateinische Schrift und IPA ist es meine Sache, ob ich Serifen haben will oder nicht. ÅñŧóñŜûŝî (Ð) 12:02, 11. Jul. 2013 (CEST)
Siehe [1] (etwas schwer lesbar, da ohne Zeilenumbruch, wenn als erste Schrift system angegeben ist, wird deine Schriftart verwendet) oder [2] (wenn in der ini-Datei ein Sternchen hinter dem Sprachcode ist, wird die Schriftart standardmäßig verwendet). Für IPA gibt es gar keinen Font (ist ja auch keine Sprache), für alles mit lateinischer Schrift, sowie Hebräisch, wird der Standardfont bevorzugt, Kyrillisch und Griechisch gibt es gar nicht. Bei einzelnen indischen Schriften schlagen sich in irgendeinem Bugzilla-Ticket die Inder und die ULS-Entwickler gerade die Köpfe ein darüber, ob der Standardfont bevorzugt werden soll. Je nachdem, was für dich als exotisch gilt, sind deine Forderungen also bereits erfüllt. --Schnark 09:24, 12. Jul. 2013 (CEST)
Danke für die Info. Du kennst dich offenbar recht gut aus damit. Ich finde, diese Fakten sollten ausführlich in der Hilfe dargestellt werden. Es fehlt sowieso eine vernünftige Hilfe zum Thema "Text und Schrift". Hättest du Lust, da etwas zusammenzustellen? ÅñŧóñŜûŝî (Ð) 14:04, 12. Jul. 2013 (CEST)
Ich kann JavaScript-Quellcode lesen, das ist eigentlich alles. Ich habe gerade genug andere Baustellen, sodass nicht allzubald mit einer Hilfeseite von meiner Seite zu rechnen ist. --Schnark 09:49, 15. Jul. 2013 (CEST)
Ich habe mal bugzilla:51662 erstellt, da Sprachattribute für Schriftsysteme semantisch nicht wirklich korrekt sind. Das würde auch ein Überschreiben mit eigenen Schriftarten erleichtern. --Schnark 10:24, 19. Jul. 2013 (CEST)

„Punctuation“ heißt auf Deutsch „Interpunktion“

… oder „Satzzeichen“ und nicht „Punktierung“ wie in Unicodeblock Vereinheitlichte Silbenzeichen kanadischer Ureinwohner. -- Olaf Studt (Diskussion) 15:44, 2. Sep. 2013 (CEST)

Stimmt. Geändert. ÅñŧóñŜûŝî (Ð) 16:50, 2. Sep. 2013 (CEST)

Unicode 6.3

Die fünf neuen Zeichen sind jetzt in unseren Tabellen enthalten, ich weiß aber keine gute deutsche Bezeichnung für das FSI. Wer eine Idee hat, möge diese in Unicodeblock Allgemeine Interpunktion, Bidirektionales Steuerzeichen und Vorlage:Unicodetabelle/Bidi (dort zwei Mal) umsetzen und bei der Gelegenheit einen Blick auf die anderen neuen deutschen Bezeichnungen dort und in Unicodeblock Arabisch werfen, die sich aber sehr eng an den etablierten Bezeichnung für die anderen Bidi-Steuerzeichen halten. --Schnark 09:38, 2. Okt. 2013 (CEST)

Wenn man das "first strong" ignoriert, könnte man das Zeichen einfach "Bidirektionale Isolierung" nennen. --Schnark 10:43, 3. Okt. 2013 (CEST)

Könnte von der Bedeutung her sogar passen, wenn ich [3] richtig verstehe. -- Liliana 11:38, 3. Okt. 2013 (CEST)
Ich würde "Strong" im Sinne des gleichnamigen historischen HTML-Begriffs interpretieren, also eher im Sinne von "Betonung" oder "besonders wichtig". Was sagen den die Quellen darüber aus? Auf der Webseite des Consortiums braucht man einen Kompass, um bei den vielen ähnlichen Inhalten "durchzusehen". Wer hat's gefunden? ÅñŧóñŜûŝî (Ð) 14:30, 3. Okt. 2013 (CEST)
Nee, einfach mal den Link anschauen, da steht drin, wie es gemeint ist. -- Liliana 14:41, 3. Okt. 2013 (CEST)
Ich hoffe mal, dass ich diesen Text korrekt geparst habe: Implicit Directional Formatting Characters geben die (Grund-)Richtung für ein ganzes Dokument an, die Explicit Directional Embedding and Override Formatting Characters definieren innerhalb eines Absatzes eine eingebettete Richtungsumkehr und können auch verschachtelt werden, und die neuen Explicit Directional Isolate Formatting Characters tun dies "isoliert" ebenfalls, mit dem Unterschied, dass die eingebettete Einbindung die umhüllende beeinflussen kann und umgekehrt (wie auch immer man sich das vorstellen muss), die isolierte aber nicht. In der Einleitung steht wohl, dass Schriftzeichen mit "left-to-right" und "right-to-left" als strong gelten, alle Ziffern als weak characters und der Rest als neutral characters gelten. Für das Verständnis des geparsten Inhalts wären Beispiele sehr nützlich... ÅñŧóñŜûŝî (Ð) 16:49, 3. Okt. 2013 (CEST)
Bevor das hier in Vergessenheit gerät, habe ich jetzt mal an allen Stellen "Bidirektionale Isolierung" eingefügt, "betont" ist sicherlich inhaltlich falsch, während "Bidirektionale Isolierung" zumindest vom Sinn her passt, auch wenn es keine wörtliche Übersetzung ist. Aber "erste starke Isolierung", wobei sich "erste starke" auf das ungenannte "Zeichen" und eben nicht auf die "Isolierung" bezieht, hört sich einfach dämlich an. --Schnark 10:45, 31. Okt. 2013 (CET)

Ein Zeichen ist "stark", wenn ihm per Definition eine explizite Richtung (z.b. l-r für lateinische und r-l für arabische Buchstaben) zugewiesen ist. Das lässt sich nicht unterbringen. ÅñŧóñŜûŝî (Ð) 11:24, 31. Okt. 2013 (CET)

Unicodeblock Smileys 😀

Hallo, warum gibt es zu diesem Unicodeblock keine HTML-Codes? – 2.202.184.1 22:28, 16. Sep. 2013 (CEST)

Was genau meinst du mit "HTML-Codes"? ÅñŧóñŜûŝî (Ð) 00:17, 18. Sep. 2013 (CEST)
Falls die Frage noch aktuell sein sollte und ich richtig geraten habe, was wohl gemeint sein könnte: Um Unicode-Zeichen in HTML (ab 4.0) darzustellen, genügt es, das was in der Spalte „Unicodenummer“ steht (den sogenannten Codepunkt), anzugeben: also etwa 😠 für 😠 (U+1F620). Wichtig: Das x deutet an, dass der hexadezimale Wert anzugeben ist. Soll statt dessen der dezimale Wert (der in der Tabelle in Klammern hinter dem Codepunkt steht) verwendet werden, lässt man das x weg. Weil normalerweise Unicode-Codepunkte hexadezimal angegeben werden, ist die dezimale Schreibweise aber eher unüblich. Benannte Zeichenentitäten wie ß für ß sind inzwischen aus der Mode gekommen und werden offenbar nicht mehr neu vergeben. Daher ist eine gesonderte Spalte für HTML-Codes überflüssig. Ansonsten siehe auch Hilfe:Sonderzeichen -- Bravo-Alpha-Tango (Diskussion) 22:37, 5. Dez. 2013 (CET)

Vorschlag: Unicodeblock-Artikel um neue Spalte „in Unicode seit Version“ ergänzen

Es kommt ja immer mal wieder vor, dass eine neue Unicode-Version neue Zeichen in bestehende Blöcke einfügt (das hab ich beim Ausbau des Emoji-Artikels besonders bei den Zeichen aus dem Unicodeblock Verschiedene Symbole und Unicodeblock Dingbats bemerkt). Wäre es da nicht sinnvoll, wenn die Artikel zu den einzelnen Unicodeblöcken (d.h. alles aus Kategorie:Unicodeblock) eine zusätzliche Spalte bekommen „in Unicode seit Version“, so dass man für jedes Zeichen erkennen kann, ab welcher Unicode-Version es unterstützt wird? Dann könnte man die Zeichen der einzelnen Blöcke auch relativ einfach nach Alter bzw. Version sortieren.

Durch Auswertung der Age-Property der XML-Fassung der UCD sollte das ein Bot ja hoffentlich relativ einfach bewerkstelligen können. Falls nicht wäre das natürlich eine Menge Handarbeit...

Bei manchen Blöcken wäre die Versions-Spalte vermutlich ziemlich einseitig, wenn sie einmal angelegt und danach nie wieder verändert wurden; aber zumindest in Liste der Unicodeblöcke sollte angegeben sein, ab wann ein Block überhaupt existiert. Derzeit lassen sich Fragen wie „seit wann (welcher Version) ist eigentlich Zeichen xy in Unicode?“ anhand der bestehenden Unicode-Artikel nicht so ohne weiteres beantworten. Ist sonst noch wer der Ansicht, dass diese Infos unbedingt in die Wikipedia gehören? -- Bravo-Alpha-Tango (Diskussion) 23:29, 5. Dez. 2013 (CET)

Der Gedanke kam mir auch schon, insofern stimme ich dir zu, dass die Version angegeben sein sollte. Bei Blöcken in denen (fast) alle Zeichen mit der gleichen Version eingefügt wurden, sollte (wie bei der allgemeinen Kategorie, wenn sie immer die gleiche ist) diese nicht als eigene Spalte, sondern nur einmal oberhalb der Tabelle angegeben werden. --Schnark 09:41, 6. Dez. 2013 (CET)
Wie sind denn die Tabellen bisher befüllt worden? Hat jemand schon einen Bot fertig, der die XML-UCD automatisch von unicode.org downloaden und auswerten und eventuelle Änderungen im Hintergrund einpflegen kann? Gibt's da irgendeine Datenquelle auf WikiData, die man anzapfen kann? Solange ich nicht zumindest passive Sichterrechte habe, traue ich mich noch nicht daran, die Vorlage Vorlage:Ubz und die Untervorlagen von Vorlage:Unicodetabelle entsprechend anzupassen oder gar einen eigenen Bot in freier Wildbahn einzusetzen. Ich will die Artikel ja verbessern und nicht kaputtmachen... -- Bravo-Alpha-Tango (Diskussion) 17:01, 6. Dez. 2013 (CET)
Das habe ich bisher mitttels Tabellenkalkulation gemacht: Rohdaten in die ersten Spalten des Blatts kopieren und dann die Wikitabelle aus anderen Spalten herauskopieren... Funktioniert mit Stringverarbeitung. Ich halte die Angabe für jedes Zeichen generell für überflüssig. Das ist ein Detail, dass man aus der Datenbank entnehmen kann und das wir nicht für Leser aufbereiten müssen. Die Version mit der Einführung des Blocks kann man aber erwähnen. ÅñŧóñŜûŝî (Ð) 01:32, 7. Dez. 2013 (CET)
Naja, es wäre schon schön, wenn man die Tabelle der Zeichen nicht nur nach Name, Codepoint, Bidi-Klasse und Kategorie, sondern auch nach Alter bzw. Version sortieren kann (denn eine zusätzliche Spalte ist ja immer auch eine zusätzliche Sortiermöglichkeit). Gegenwärtig haben wir zur History nur die Tabelle Unicode#Versionen, und die ist etwas dürftig, was den Informationsgehalt angeht, zumal da noch nicht mal auf die Unicodeblock-Artikel selbst verlinkt wird, sondern nur auf die Artikel zu den Schriften im allgemeinen. Unicodeblock Dingbats wurde beispielsweise von 5 verschiedenen Versionen verändert. Im Artikel wird von „zuvor nicht belegten Codewerte[n]“ geredet, ohne dass die zeitliche Entwicklung der Befüllung irgendwie ersichtlich wäre. Noch krasser ist's beim Unicodeblock Verschiedene Symbole mit 9 unterschiedlichen Versionsständen. Du und ich können natürlich direkt in der XML-UCD nachschauen oder uns durch die Delta-Codecharts wühlen. Aber WP:OMA entspricht das IMHO irgendwie nicht so wirklich. Denn viele Dinge rund um Unicode (wie z.B. die strengen Stabilitätsgarantien) versteht man erst, wenn man auch einen Überblick über die zeitliche Entwicklung des Standards hat. Das geben die Artikel bisher nicht her. Wenn wir uns schon solche Übersichtsartikel leisten, sollten sie auch übersichtlich und vollständig sein und die Leser auf der Suche nach Informationen nicht kreuz und quer hin und her jagen. Sonst bräuchte es die ganzen Unicodeblock-Artikel nicht, da man die Leute dann auch direkt auf die UCD scheuchen kann. Und mal ehrlich -- in Zeiten von 4k-Displays dürfte eine zusätzliche Spalte platzmäßig doch machbar sein, zumal da nur 3 Zeichen rein müssen (nämlich die Versionsnummer „X.Y“). Aber natürlich ist das nichts, was man per Excel manuell machen möchte: Etwas XSLT auf die ucd.all.flat.xml angewendet wirkt da wahre Wunder... Ich bräuchte nur das OK, an den Vorlagen rumbasteln zu dürfen; ohne Erlaubnis hingegen lass ich die Finger davon. Aber selbst wenn die Angabe der Versionsnummer bei jedem einzelnen Zeichen nicht mehrheitsfähig sein sollte, müsste mindestens eine Übersicht der Unicode Version History (wie z.B. in der Infobox rechts in en:Dingbats_(Unicode_block)) in die Artikel, wieviele Zeichen mit welcher Version jeweils dazugekommen sind. Denn mit der Versionsnummer der Einführung des Blocks ist's ja nicht getan, wenn sich wie beim Unicodeblock Verschiedene Symbole seitdem die Anzahl der Zeichen mehr als verdoppelt hat. -- Bravo-Alpha-Tango (Diskussion) 03:22, 7. Dez. 2013 (CET)
Man kann immer sagen: "Mehr Info könnte nützlich sein." Bedenke aber, dass man dafür mehr als 200 (!) Tabellen ändern muss. Willst du das machen? Eine nochmalige Änderung erfordert eine größere Automatisierung als ich sie bisher habe. ÅñŧóñŜûŝî (Ð) 19:07, 10. Dez. 2013 (CET)
Die Arbeit ist ziemlich automatisierbar: Alle Infos stecken schon in der UCD; die per Skript für jeden Codepunkt zu extrahieren, ist einfach. Solange einheitliche Vorlagen verwendet werden, spielt es praktisch keine Rolle, ob man das für 1 Block oder für 200 macht. Das Skript muss einmal erstellt werden, das ist immer gleichviel Arbeit; ob man das dann auf einen oder auf alle Unicodeblock-Artikel anwendet, ändert am Aufwand relativ wenig. Neue Unicode-Versionen könnte man durch erneutes Ausführen des Skripts quasi automatisch berücksichtigen; Änderungen manuell nachtragen zu müssen, fiel dann quasi komplett weg. Ich würde mir die Mühe, ein solches Skript zu basteln, aber nur dann machen, wenn wirklich sicher ist, dass diese Änderung mehrheitlich gewollt ist und die entsprechenden Artikeländerungen dauerhaften Bestand haben; an Edit-Wars habe ich kein Interesse. Schwieriger wird es, die deutschen Bezeichnungen der Blöcke und Zeichen in die Tabellen einzubauen, da die offenbar nirgendwo standardisiert sind. Eine deutschsprachige Fassung der ISO 10646 existiert ja offenbar nicht. Gibt's eine vollständige Liste oder Tabelle der üblichen Übersetzungen, wie sie hier in WP verwendet werden, am liebsten im CSV- oder XML-Format? Oder müsste das jeweils aus den einzelnen Artikeln extrahiert werden? -- Bravo-Alpha-Tango (Diskussion) 16:24, 14. Dez. 2013 (CET)
⇐⇐⇐Die Tabellen - CJK-Tafeln ausgenommen - haben alle Zeilen, welche aus einer Einbindung von Vorlage:Unicodetabelle/EasyZeile oder Vorlage:Unicodetabelle/Zeile bestehen. Man könnte wohl den CactusBot darauf ansetzen und die Einbindungen auslesen. Für den gibt es ein Skript, welches alle Einbindungen in einer Tabelle auflistet. Damit erhält man die Zuordnung von Hex-Code zum dt. Tabelleneintrag. Zusammen mit den UCD-Daten wäre das dann eine ausreichende Datenbank:
  • Tabelle:Blockliste
    • Eine ID (Primärschlüssel)
    • Lemma der Seite
    • Blockname (engl.)
    • Blockname (dt.)
    • Zeilenvorlage (/EasyZeile oder /Zeile)
    • Erster Codepoint
    • letzter Codepoint
    • letzter belegter Codepoint
  • Tabelle:Zeichenliste
    • Codepoint (hex) (Parameter "Hex", Primärschlüssel)
    • Codepoint (dez) (Parameter "Dez")
    • engl. Bezeichner (Parameter "Name")
    • Kategorie (Parameter "Kat")
    • Bidi-Klasse (Parameter "Bidi")
    • Dt. Text (Parameter "Text")
    • CSS-Klasse (Parameter "Klasse")
    • Parameter "String"
    • Parameter "Charpos" (wird für Kombizeichen benötigt)
    • Unicodeversion
Aus der Verknüpfung ergibt sich die Zuordnung zum Block. ÅñŧóñŜûŝî (Ð) 13:23, 15. Dez. 2013 (CET)
Mit der Handhabung von Bots kenne ich mich zu wenig aus. Ich werde mir einen XML-Dump via Spezial:Exportieren von allen Seiten mit der Kategorie „Unicode-Block“ herunterladen und dann lokal den Inhalt jedes <text bytes>-Elements nach Zeilen filtern: Alles was mit {{Unicodetabelle/Zeile| oder {{Unicodetabelle/EasyZeile| anfängt, ist ein Unicode-Zeichen, nur diese Zeilen müssen weiter beachtet werden; splittet man dann jeweils den String bei jedem Auftauchen von |, so erhält man die einzelnen Parameter; der Parameter Text= ergibt dann den deutschen Text, Klasse= die CSS-Klasse, Charpos= die Darstellung der Platzhalter und Hex= die Verknüpfung zur UCD-XML. Jetzt müsste ich nur noch wissen, wie man einen solchen Datenbestand dann vernünftig in Wikidata einbindet, so dass der dann in allen Sprachversionen gleichermaßen genutzt werden kann. Gibt es irgendwo eine einfache und übersichtliche Einsteiger-Anleitung dazu? -- Bravo-Alpha-Tango (Diskussion) 15:17, 18. Dez. 2013 (CET)
Keine Ahnung, wie man das nach Wikidata bringt, ohne tausende Einträge einzeln vornehmen zu müssen. Der Bot fertigt eine Tabelle an und damit kann jeder arbeiten, nach Absprache auch offline. Ich frage das mal an. ÅñŧóñŜûŝî (Ð) 19:32, 18. Dez. 2013 (CET)

Hallöchen

Kann jemand bitte mal was zur Liste der RISM-Bibliothekssigel sagen. Die Lösch-'Argumente' hören sich ähnlich an, wie hier damals. ;) --Reiner Stoppok (Diskussion) 16:32, 19. Jun. 2013 (CEST)

Die Löschung der Seite „Liste der RISM-Bibliothekssigel“ wurde ab dem 17. Juni 2013 diskutiert und abgelehnt. --RonaldH (Diskussion) 12:05, 28. Jun. 2014 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: ÅñŧóñŜûŝî (Ð) 21:40, 28. Jun. 2014 (CEST)

Bezeichnung "Nullbreiter Verbinder"

Hinweis: Auf Diskussion:Nullbreiter Verbinder wird gerade die Bezeichnung dieses Steuerzeichens diskutiert (bitte Diskussion ggf. dort fortsetzen). -- Karl432 (Diskussion) 11:41, 8. Dez. 2013 (CET)

Hat sich erledigt, siehe Diskussion:Breitenloser Verbinder. --RonaldH (Diskussion) 12:05, 28. Jun. 2014 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: ÅñŧóñŜûŝî (Ð) 21:40, 28. Jun. 2014 (CEST)