Diskussion:Sonderzeichen
Fragwürdiger Artikel
BearbeitenDer ganze Artikel ist so, wie er jetzt ist, recht fragwürdig. Ich wäre dafür, dass wir uns hier erstmal einigen, was genau wir in dem Artikel drinhaben wollen und uns dann mal daran machen, ihn entsprechend zu überarbeiten.
Der Artikel sollte Antworten auf folgende Fragen geben:
- Was sind Sonderzeichen überhaupt?
- Wo treten sie auf?
- Wieso gibt es Sonderzeichen? (Vorteile?)
- Welche Nachteile entstehen dadurch?
- Wie kann man die Nachteile umgehen/lösen/mildern?
- Beispiele für Sonderzeichen in verschiedenen Programmier- u. Textauszeichnungssprachen (vulgo: Markup-Sprachen)
Was haltet ihr davon?
--RokerHRO 19:13, 27. Jun 2005 (CEST)
- Du hast recht. Wir sollten erstmal genau klären, welche Themen es gibt, und welches Lemma das beste ist. Hier mal ein kurzes Brainstorming:
--Suricata 08:46, 13. Jul 2005 (CEST)
- Nach der jetzigen Definition im Artikel sind sogar die Ziffern 0 bis 9 ,,Sonderzeichen" ...
- Eine weitere Frage ist auch unter welchen Umständen welche Zeichen ,,besonders" sind, ganz besonders wo man kaum noch auf den Zeichenvorrat von Schreibmaschinen oder auch ASCII festgelegt ist, und der Austausch schriftlicher Information schon recht international ist.
- Die Idee der ,,Besonderheit" ist verschiedenen , wechselnden Faktoren abhängig: Eingabemöglichkeiten, Fähigkeiten der Software beim Verfasser und den Empfängern. Solche Faktoren beschränken die ,,Besonderheit" von Zeichen meist auf einen sachlich und auch zeitlich recht engen Kontext. Meiner Erfahrung nach verstehen die meisten Leute so etwas wie ,,Alle Zeichen ausser 0-9A-Za-z" als Sonderzeichen, mit wechselnden Ausnahmen von Punkt, Komma, Unter-, Bindestrich etc. -- abhängig welche Faktoren diejenigen betreffen. Auch denke ich nicht, dass Inder, Chinesen oder Thailänder glauben, sie würden hauptsächlich mit ,,Sonderzeichen" schreiben.
- Entweder man findet eine exakte (Computer sind recht pingelig, daher wohl nötig) Definition -- wenigstens für eine Sprache oder Kulturkreis--, oder man versucht diesen derzeit unbrauchbaren Begriff wieder aus der Sprache zu entfernen: ein Schritt dazu wäre im Artikel auf Definitionsversuche zu verzichten und die Problematik zu beschreiben.
Tabellen
BearbeitenEs stimmt, dass der praktische Informationsgehalt recht gering ist. Leider habe ich selbst absolut keine Ahnung von den Kodierungen und kann daher leider nicht zur Verbesserung dieses Abschnitts beitragen. Ich habe deshalb lediglich versucht, den Begriff etwas klarer zu definieren und dem ersten Abschnitt etwas mehr Struktur zu geben. Wäre schön, wenn jemand sich der Kodierungslisten annehmen könnte. Gruß Elli06.
Geschichte der typographischen Behinderungen in den Geistes- und sonstigen Wissenschaften
BearbeitenAlso ich würde ja bei der Darstelung bei meiner alten Schreibmaschinentastatur anfangen, dann ASCII, dann Unicode usw. Auf jeden Fall müßte man auch mal eine Typographische Klagemauer einrichten. Gruss --Reiner Stoppok 03:45, 6. Mai 2007 (CEST)
Um rege Teilnahme an der Diskussion Deutsche Bezeichnungen für Unicode-Symbole wird gebeten. --Reiner Stoppok 20:18, 6. Jun. 2007 (CEST)
Definition
BearbeitenIn dem Artikel konkurrieren zwei verschiedene Begriffsdefinitionen:
- Schriftzeichen, das weder ein Buchstabe noch eine Ziffer ist.
- Alles außer a-z, 0-9 und Leerzeichen.
Die erste Definition steht explizit im Artikel, die zweite wird implizit in der Einleitung eingeführt: Auch Diakritika sind Sonderzeichen, z. B. Akut oder Breve (é, ă). Das steht im Widerspruch, da é und ă Buchstaben sind. Die zweite Definition wird im weiteren Verlauf des Artikels verwendet, z. B. Eingabe von Umlauten in LaTeX (Umlaute sind Buchstaben) und Punycode (wird in internationalisierten Domainnamen für Buchstaben und Silbenschriften verwendet, nicht für Satzzeichen und Symbole). --Matthäus Wander 17:21, 2. Nov. 2012 (CET)
- é ist kein Akut, sondern ein Vokal (e + ´), also gibt es keinen Widerspruch. Die richtige Definition müsste eigentlich lauten: Schriftzeichen, das weder ein Buchstabe noch eine Ziffer noch ein Leerzeichen ist.--Sinuhe20 (Diskussion) 20:54, 2. Nov. 2012 (CET)
- Sind nach deiner Definition é und ä Sonderzeichen? --Matthäus Wander 21:55, 2. Nov. 2012 (CET)
Ich habe folgende Definitionen im Web gefunden:
- duden.de: weder Buchstabe noch Ziffer
- itwissen.info: Zeichen, die sich nicht über die Tastatur eingeben lassen
- sonderzeichen.de: druckbare Zeichen, die nicht Teil von ASCII sind
Keine davon passt wirklich. Daher schließe ich mich einem älteren Diskussionsbeitrag von Empro2 an: wenn es keine exakte Definition gibt, sollte man nicht versuchen, eine solche vorzugeben. Stattdessen sollte aus dem Artikel hervorgehen, dass der Begriff unscharf ist. --Matthäus Wander
- Zu einer Begriffsdefinition gehört immer auch der thematische Kontext. Hier gibt es zwei:
- Typografie
- Was dort steht, ist exakt die in der Typografie gebräuchliche Definition.
- Diese hatte wohl auch der Duden im Sinn.
- Hier gibt es neben den Satzzeichen noch die „Symbole“ (also # † *) und die buchstabenähnlichen Zeichen. Verräterisch ist, dass die Definition im Artikel das Leerzeichen ausschließt; das gibt es in der klassischen Typografie auch nicht, nur Weißraum.
- IT
- Das soll die Übersetzung von special character sein. Für druckbare Zeichen sagt man character, für unsichtbare Steuerzeichen eher nur code.
- Die Definition dafür wechselt mit den Jahren; früher gab es mal ASCII, heute heißt das Unicode.
- Die Beschreibung bei itwissen.info ist erkennbarer Unsinn. Damit könnte man vielleicht Steuerzeichen gemeint haben. Hierzu gehören aber auch Enter/Return und Tab; das geht über die Tastatur. Im Übrigen ist die Definition völlig beliebig und damit unbrauchbar: An der Umsetzung der elektrischen Signale der gedrückten Tasten in Code ist der Tastaturtreiber (Gerätetreiber) beteiligt, und da kann man jede Zuordnung hineinschreiben.
- Eine Definition, die nur mit ASCII hantiert, ist ersichtlich veraltet.
- Im Englischen hängt die präzise Definition vom Umfeld ab; von der Programmiersprache, vom Zeichensatz, von einer formalen Syntax wie bei URL. en:Special characters (als RK-fraglich gekennzeichnet) nennt sprechbare Namen für Sonderzeichen des ASCII.
- Eine saubere und aktuelle sachkundige Aufteilung gibt ein Unicode-PDF, 4.5 General Category, S. 130
- L Letter
- M Mark
- N Number, numerical (Digit)
- P Punctuation
- S Symbol
- Z Separator
- C Control
- Demnach wäre für Unicode ein Sonderzeichen = M+P+S+Z als undefinierte Kurzsprechweise. Wenn man weiß, was man meint.
- Typografie
- Liebe Grüße --Gräfin Typo 08:52, 3. Dez. 2012 (CET)
- Weiter oben Vorgetragenes lässt sich noch wie folgt steigern: Gemäß duden.de sind auch griechische und kyrillische Buchstaben keine Sonderzeichen.
- Unter Punycode: „Umlaute und andere Sonderzeichen“ – dazu wird unter Deutsches Alphabet#Umstrittene Zahl der Buchstaben angegeben, bei den Umlauten zeige sich eine Unschärfe des Begriffs Buchstabe. Auch auf diakritische Zeichen und Ligaturen wird dort eingegangen.
- In meinem physischem Duden, 21. Auflage von 1996, kommt „Sonderzeichen“ überhaupt nicht vor, obwohl 1996 längst viele im beruflichen Alltag mit Sonderzeichen zu kämpfen hatten. Die Angabe in duden.de scheint insofern nicht den Hintergrund einer zuverlässigen Redaktion zu haben, der Eintrag ist vielleicht eher vom Webmaster? Vgl. Sonderzeichen. In: Digitales Wörterbuch der deutschen Sprache.
- Was @Gräfin Typo schreibt, verstehe ich hinsichtlich „Typografie“ nicht. Was wo steht? – Für mich hat „Sonderzeichen“ nichts mit Typografie zu tun. „IT“ finde ich viel besser, aber nicht nur im Hinblick auf Computer. Zum einen ist ein Sonderzeichen alles, was in der Standard-Tastenbelegung nicht einer einzelnen Taste entspricht. Das gilt auch für Schreibmaschinen und Satzmaschinen, und wenn es mit einer Tastenkombination geht, ist es trotzdem ein Sonderzeichen. Sobald man das eingeübte 10-Finger-Schreiben unterbrechen muss, um nachzudenken, wie man dieses Zeichen jetzt in den Text bekommt, ist es ein Sonderzeichen (insofern klar gegen itwissen.info). Das bedeutet natürlich, dass der Begriff „relativ“ ist, für uns hier sind kyrillische Buchstaben Sonderzeichen, für einen Russen, der eine Tastatur mit kyrillischen Buchstaben hat, sind lateinische Buchstaben Sonderzeichen. – Außerdem könnte ein Sonderzeichen etwas sein, was in der Standard-Schriftart nicht vorkommt, stattdessen muss man aus irgendeinem Menü auf eine seltsame Schriftart wechseln, oder den Schreibmaschinen-Kugelkopf wechseln – oder eine neue Schriftart installieren bzw. einen neuen Kugelkopf besorgen. (In mathematischen Typoskripten hat man nach meiner Erinnerung erst mal den Text ohne griechische Symbole getippt und Platz für sie gelassen, dann hat man den Kugelkopf für die griechischen Buchstaben genommen und sie einzeln nachgetragen.) Vgl. @Empro2 weiter oben.
- Weiterer Gedanke, unabhängig von Tastatur, auf die ich vorher Bezug genommen habe: In den Auszeichnungssprachen HTML und LaTeX haben bestimmte ASCII-Symbole eine besondere Funktion und werden nicht so gedruckt, wie man sie im Texteditor sieht, in beiden genannten Auszeichnungssprachen gilt das für
&
. Solche Zeichen sind auch irgendwie „Sonderzeichen“, verlangen jedenfalls eine „besondere Behandlung.“ - Es ist sogar (gedruckte!) Literatur zum Thema angegeben – was steht denn darin zur Definition?
- --Lückenloswecken! 10:29, 1. Feb. 2016 (CET) – Nachträge 16:14, 1. Feb. 2016 (CET)
- Es gibt zwei Deutungen des Begriffs „Sonderzeichen“:
- Typografisch, also die „Druckersprache“ der alten Schriftsetzer und ihrer Bleilettern.
- IT.
- Beide sind nicht mit Gesetzeskraft auf den allerletzten Einzelfall herunterdekliniert.
- Der erste definierende Absatz des umseitigen Einleitungsabschnitts fasst die Druckersprache zusammen, darauf folgt die Abweichung in der IT.
- Konkret sind das folgende Gliederungen:
- Typografisch:
- Buchstaben und Ziffern, einschließlich diakritischer Modifikationen und Ligaturen, in allen Schriften (=Sprachen).
- Satzzeichen; das sind Punkt und Komma usw., alle Klammern, die diversen horizontalen Striche.
- Sonderzeichen; das sind vor allem die Symbole wie Plus und Minus, * und § und $ wie £.
- IT
- Buchstaben und Ziffern, vielleicht nur ASCII, vielleicht alle Varianten wie typografisch.
- Leerzeichen (Weißraum); in der Typografie kein eigenes Zeichen.
- Sonderzeichen; das sind dann alle anderen.
- Öfters auch noch unsichtbare Steuerzeichen extra, die es in der Typografie nicht gibt.
- Typografisch:
- Fraglich ist oft die Einsortierung einzelner Zeichen; so ist das ² am Quadratmeter eine hochgestellte Ziffer, aber auch irgendwie ein Sonderzeichen oder Symbol; das & könnte in der Typografie als Buchstabe/Ligatur durchgehen, und ® wie ™ sind buchstabengleiche Zeichen; auch der Unterstreichungsstrich ist Sonderzeichen, aber in der Typografie kein Symbol (wie auch der vertikale und Überstreichungsstrich). < ist spitze Klammer und damit Satzzeichen genauso wie mathematisches Symbol und damit Sonderzeichen. CJK-Ideogramme kommen in dem an Buchstabenschriften ausgerichteten Weltbild der klassischen deutschsprachigen Typografie nicht vor.
- Punycode:
- Hier würde man besser mit „ASCII-Zeichen“ und „Nicht-ASCII-Zeichen“ hantieren.
- Alles, was in der Tabelle ISO 8859-1 größer als 126=7E16 ist, bedarf in Punycode einer besonderen Behandlung. Dabei ist es schnurzpiepegal, als was das Zeichen inhaltlich zu interpretieren sei; es ist nur ein Verschlüsselungsverfahren, das alle höheren Codes auf ASCII abbildet.
- IT:
- Hier gibt es unterschiedliche Kontexte; teilweise auch bezogen auf das Vokabular bestimmter Programmiersprachen usw.
- Teilweise wird grundsätzlich alles jenseits ASCII als Sonderzeichen aufgefasst (wie zurzeit umseitig Punycode); in Unicode jedoch wie von mir weiter oben dargestellt differenziert (M+P+S+Z).
- Ein amerikanischer Programmierer könnte ß durchaus als Sonderzeichen begreifen; ist für ihn von einem anderen Stern.
- Literatur:
- Manche davon könne ich mal in der Hand gehabt haben, mindestens Reclam, erinnere mich aber nicht mehr an detaillierte Eingruppierungen.
- Die ersten drei geben wohl die typografische Sichtweise wieder; die vierte die Einstufung jedes einzelnen Zeichens durch das Unicode-Konsortium.
Liebe Grüße --Gräfin Typo 17:47, 1. Feb. 2016 (CET)
Überarbeitungen im Februar 2016
Bearbeiten[Kritik]
Bearbeiten#GT · #UL1 · #UL2 · #UL3 · #GT2 · #UL4 ]
[Ich beobachte mit gewisser Besorgnis, wie der Artikel allmählich aus den Fugen zu geraten droht.
Insbesondere ist es nicht hilfreich, alles auf einen Haufen zu tragen, was die Suchmaschinen irgendwie an Erkenntnissen hergeben. Vor allem lässt sich immer irgendeine absonderliche Einzelmeinung auftreiben; hier das jüngste Fundstück, demzufolge Ziffern ebenfalls Sonderzeichen sein sollen. Nähme man diesen Exoten ernst, dann könnte man statt „Sonderzeichen“ auch „Nicht-Buchstabe“ verwenden.
Ich wies bereits im vorherigen Abschnitt auf einige Punkte hin:
- Es gibt nirgendwo eine gesetzliche, verbindliche, wissenschaftliche, amtliche Definition, was genau „Sonderzeichen“ sein sollen.
- In der klassischen Typografie und in der IT werden unterschiedliche Ansätze benutzt.
- Die Computertechnik hat sich über mehr als ein halbes Jahrhundert entwickelt; dabei haben viele Begrifflichkeiten im Lauf der Jahrzehnte ihre Bedeutung gewandelt, wenn die Technik erweiterte Möglichkeiten bot.
- Eine erste Näherung ist: „Zeichen, das weder Buchstabe noch Ziffer ist.“
- In der Typografie werden aber grob drei Gruppen unterschieden:
- Buchstaben und Ziffern
- Schließt auch kombinierte Zeichen und Ligaturen ein.
- Außerdem beliebige buchstabenbasierte Schriftsysteme, also auch griechisch, kyrillisch, arabisch.
- Satzzeichen
- Wie in einer Rechtschreibregelung aufgeführt; alles, was im Deutschunterricht besprochen wird.
- Sonderzeichen
- Hauptvertreter ist die Untergruppe der „Symbole“, die eine Bedeutung tragen; dazu kommen die zunächst bedeutungslosen Einzelzeichen Unterstreichungsstrich, Überstreichungsstrich, vertikaler Strich und ggf. Schmuckzeichen.
- Weißraum ist hier nie ein „Zeichen“.
- Buchstaben und Ziffern
- In der IT meint man mit dem Begriff eigentlich häufiger „weder ASCII-Buchstabe noch ASCII-Ziffer“.
- Dadurch kommen auch Streitereien zustande, ob ß oder ein akzentuierter Buchstabe nun ein Sonderzeichen wäre. Das liegt aber an der grundsätzlich nicht vorhandenen exakten Definition und der mangelnden Präzision in der Begriffsverwendung.
- Oft meint es auch „reserviertes Zeichen“ oder „Zeichen mit Sonderbedeutung“, wie im Kontext von URL, XML, Programmiersprachen.
- Die Abschnitte zu HTML und LaTeX ufern aus und werden völlig redundant zu Entitäten in Auszeichnungssprachen usw.
- Für HTML würde ein schlichter Satz genügen, dass aus Sicht dieser Sprache drei Zeichen besonders wären und Entities verwendet werden müssen; weiterhin jedes beliebige Zeichen auch als Entity kodiert werden könne;
 
ist ein Leerzeichen unda
ein kleines A – mit Sonderzeichen hat das alles längst nichts mehr zu tun, und für HTML ist es völlig egal, welche Bedeutung ansonsten die Zeichencodes im textlichen Inhalt hätten. - Bei XML kommt übrigens immer noch
'
hinzu.
- Für HTML würde ein schlichter Satz genügen, dass aus Sicht dieser Sprache drei Zeichen besonders wären und Entities verwendet werden müssen; weiterhin jedes beliebige Zeichen auch als Entity kodiert werden könne;
- Während in jüngerer Zeit mit Unicode jeder Zeichencode genau einer Zeichenklasse zugeordet wird (Letter, Digit, Punctuation, Separator + Symbol + Mark, Control) und man als „Sonderzeichen“ identifizieren kann Separator+Symbol+Mark ±Punctuation, ist das in der Typografie nicht gegeben.
- So werden Klammern sowohl den Satzzeichen wie auch den (davon unterschiedenen Sonderzeichen) zugerechnet; je nach Kontext. Im deutschen Hauptsatz sind runde Klammern ein Satzzeichen, in der mathematischen Formel ein Symbol.
- Ebenfalls fallen die zunächst bedeutungslosen grafischen Sonderzeichen, die keine Symbole sind (Überstreichungsstrich), dann in die Gruppe der Symbole, wenn sie in mathematischem Kontext eine Bedeutung erhalten, etwa als Negation oder Strecke.
- Das typografische Standardwerk und Referenz in der Produktion aus der Hoch- und Endphase des Blei- und Lichtsatzes vor dem Computerzeitalter war: Duden-Taschenbuch 5a, Satzanweisungen und Korrekturvorschriften. 1. Auflage 1969. Hier wird auf den Seiten 60–103 in einem eigenen Kapitel nur auf die Sonderzeichen eingegangen, jedes einzelne beschrieben und mit einer Schlüsselnummer versehen, auf die dann Setzer in der Praxis Bezug nahmen, wenn es inhaltliche Unklarheiten betreffend des Manuskripts gab und Lektoren oder Korrektoren sie mit dem Autor besprachen.
Liebe Grüße --Gräfin Typo 09:35, 8. Feb. 2016 (CET)
- Hallo @Gräfin Typo! Vielen Dank für deine Hinweise! Ich habe mich selbst schon länger mit dem Gedanken getragen, hier einen solchen Abschnitt anzufangen. – Im Moment sehe ich es aber so, dass ich für die angebliche typografische Sichtweise
kaum was finden kann.nur ca. 2 Belege habe, denen ich noch nicht recht traue. Ich hätte mich ja dafür interessiert, was in der Literatur da unten steht, und da sehe ich die merkwürdige Auffassung im Buch von Rautenberg und Wetzel – ich hatte wirklich nach weiteren Werken von ihr gesucht. Ich habe viel Zeit damit verbracht, solche Literatur finden. Ich würde mich freuen, wenn du anderes beitragen könntest. Ich habe nicht einseitig nach Literatur gesucht, die deinen Vorstellungen widerspricht, sondern das ist einfach alles, was ich finden konnte.- Viel mehr habe ich bei Lochkarten und Lochstreifen gefunden. Perfekt wäre es mit den Texten von Normen dazu (die die Autoren nennen), denn in den Beschreibungen ist ständig davon die Rede, wie Sonderzeichen im Gegensatz zu Buchstaben/Ziffern kodiert werden. Das wäre schon halbwegs eine offizielle Begriffsfestlegung. Dadurch ist nach meiner Meinung die „IT“-Sichtweise geprägt, noch in den letzten Jahren sind Bücher erschienen, die die Kodierung auf Lochkarten beschreiben. ASCII selbst (damit bin ich gerade beschäftigt) war zunächst für die Telegrafie bedeutsam, deren Texte in Lochstreifen kodiert wurden.
- Dass der
KapitelArtikel in die Breite gerät, ist auch meine Befürchtung, an einem klaren Konzept arbeite ich noch etwas, bzw. eigentlich hab' ich's.. Meine Vorstellung ist, die Sichtweise, alles außerhalb ASCII sei ein „Sonderzeichen“, als Banausentum und nicht als Thema des Artikels zu betrachten. Punycode hat anscheinend im Artikel gar nichts verloren, das ist offenbar nicht ein Verfahren, Satzzeichen, mathematische Symbole usw. in einem Domainnamen unterzubringen, sondern Buchstaben oder jedenfalls Schreibweisen für Wörter in nicht-englischen Sprachen. - Die Abschnitte zu HTML und LaTeX sind im Gegensatz zu den anderen Teilen aus meiner Sicht fertig, jedenfalls einen Schritt weiter als der Rest. Ich wollte nur bringen, was mit Sonderzeichen zu tun hat, da müssen immer einmal die Sonderzeichen behandelt werden, die keine ASCII-Codes haben (das sind hauptsächlich typografisch korrekte Varianten von ähnlichen Interpunktionszeichen in ASCII sowie mathematische Symbole) – und deshalb gerade nicht alle Entitäten in Auszeichnungssprachen, was ja Buchstaben anderer Sprachen einschlösse. Und andererseits sind hier diejenigen ASCII-Sonderzeichen von Interesse, die „reservierte Zeichen“ der jeweiligen Auszeichnungssprache sind.
- Du schreibst jetzt zum dritten Mal eine ausführliche Skizze eines Aufbaus des Artikels. Wenn du Literatur zu Gesichtspunkten des Artikels hast, warum schreibst du das nicht rein?
- – Guten Morgen, Gute Nacht --Lückenloswecken! 06:28, 9. Feb. 2016 (CET)
- Dass die General Category des Unicode-Consortiums manchmal über unterschiedliche Funktionen von Zeichen hinweg geht, stört mich nicht so, könnte man erwähnen, wenn sich der Text des Artikels mal ungefähr erratisch in eine Umgebung davon entwickelt.
- – Korr. 08:50, 9. Feb. 2016 (CET)
- = = = = =
- … und noch zu „Entitäten in Auszeichnungssprachen“:
- die numerischen sind hier gerade noch erwähnenswert. Interessant finde ich den Anteil der Sonderzeichen bei den benannten HTML-Entitäten.
- Ich wäre vielleicht der erste, der von „LaTeX-Entitäten“ spricht, davon steht nichts in Entitäten in Auszeichnungssprachen. Ich fand, dass der Artikel erwähnen sollte, dass „LaTeX-Entitäten“ nicht von einem „Consortium“ verwaltet werden und mit einer Kodierung von Glyphen (als Anordnung in einem Raster) nichts zu tun haben.
- --Lückenloswecken! 09:11, 9. Feb. 2016 (CET)
- = = = = = =
- Zum Thema Banausentum finde ich die Terminologie hier sehr geschickt: Tastaturkürzel für Sonderbuchstaben und Sonderzeichen – nebst netter weiterer Unterteilung. --Lückenloswecken! 17:13, 9. Feb. 2016 (CET)
→ zum Mini-Inhaltverzeichnis am Anfang der Diskussion
- Zu meiner Beteiligung im ANR:
- Zu direkten Edits habe ich mit den Jahren zunehmend weniger Lust.
- Edit-Wars und Streitereien mit einigen unfähigen Naseweisen (mir zwoa hatten noch nicht das Vergnügen; ich meine andere) sind erst recht nicht meine Sache.
- Im vorliegenden Fall geht es um grundlegende konzeptionelle Fragen zu diesem Artikel, an dem du jedoch alle paar Stunden editierst.
- Hier fände ich es kontraproduktiv, wenn ich dir alle paar Tage hinterhereditieren und dich wieder rauswerfen würde.
- Vielmehr wäre zuerst auf dieser Diskussionsseite Klarheit über die Konzeption herzustellen, und erst danach diese Konzeption im ANR umzusetzen.
- Auf meine obigen Beträge in der Diskussion hattest du aber überhaupt nicht reagiert und sie bei der Artikelbearbeitung auch völlig ignoriert.
- Literatur- und Beleglage:
- Du scheinst dich sehr auf Suchmaschinenergebnisse zu stützen.
- Gedruckte Werke der ersten neunzig Jahre des 20. Jahrhunderts sind aber schon aus urheberrechtlichen Gründen kaum im Web zu finden; auch neuere Druckwerke nur in Verlagsvorschau.
- Generell ist die schwarze Kunst immer schon sparsam gewesen mit Standardwerken; so etwas wie offizielle Richtlinien gab es zwar mal, diese waren jedoch sehr knapp und deckten bei weitem nicht alle Fragestellungen ab.
- Insofern ist eine bias zur IT in der großen Masse der Webseiten nicht verwunderlich.
- Zur Typografie gibt es einige wenige seriöse Websites, und alle mögichen privaten Blogs mit teilweise völligem Unsinn.
- Da du dich hinsichtlich IT auch auf alle Texte zu stürzen scheinst, in denen irgendwo das Wort „Sonderzeichen“ vorkommt, ist es kein Wunder, wenn du tausenderlei private Sichtweisen und kontextbezogene Interpretationen dieses „Begriffs“ im Wandel der Jahrzehnte zusammensammelst, die sich alle widersprechen. Das tut der Klarheit des Artikels aber überhaupt nicht gut.
- Ich habe dir oben benannt:
Duden-Taschenbuch 5/5a, Satzanweisungen und Korrekturvorschriften. 1. Auflage 1969.- Das war zu seiner Zeit das gewesen, was man heute reference manual nennen würde; es lag überall griffbereit rum.
- Es geht in einem eigenen Kapitel von 44 Seiten nur auf Sonderzeichen ein.
- Jedes einzelne wird beschrieben und mit einer Schlüsselnummer versehen, die man damals so verwendet hatte wie heutzutage Unicode.
- So wird unterschieden zwischen 21.12 Yen und 21.13 Yuan; das erste mit einem Querstrich, das zweite mit zweien. Wobei ich lustigerweise gerade sehe, dass auf meinem momentanen Rechner in der Überschrift von ¥ nur ein Querstrich dargestellt wird, die identische Zeichenkodierung U+00A5 in normaler Textgröße aber mit zwei Querstrichen; liegt an dem vom Wiki für Überschriften zugewiesenen Font „Georgia“, der nunmal so gestaltet ist: ¥.
- Aber Satzzeichen kommen in diesem Kapitel nicht vor; wohl aber runde Klammern in mathematischen Formeln. Dafür gibt es ein eigenes Kapitel 13 auf Seiten 172–177 nur über „Satzzeichen“, hier mit runden Klammern im Kontext deutscher Texte. Das stützt meine obige Darlegung, dass Satzzeichen in klassischer Perspektive nicht zu den Sonderzeichen gehören.
- Die Typografen hatten den Begriff „Sonderzeichen“ nicht mit wissenschaftlicher Präzision abgegrenzt und herunterdekliniert.
- Wenn irgendein Text zu setzen war, dann benötigte man dafür Buchstaben, Ziffern und Satzzeichen.
- Die waren alle in größerer Menge in dem Setzkasten für diese Schrift enthalten.
- Das betraf natürlich auch alle Umlaute und akzentuierten Buchstaben und Ligaturen. Ein normaler deutschsprachiger Setzkasten enthielt auch die gängigen à und é, oder war von vornherein auf deutsch-französisch abgestimmt, wohl gar skandinavisch, aber nur in der Luxusausstattung mit tschechisch, schon wieder nicht neu-türkisch.
- Alles, was nicht zu den Buchstaben, Ziffern und Satzzeichen im normalen laufenden Text gehört, sind Sonderzeichen.
- Wobei ein paar gängige wie % + − * † regelmäßig dabei waren.
- Andere Sonderzeichen konnten schon mal Probleme bereiten; dann wurde der Text als aufwändiger Spezialsatz eingestuft.
- Wenn etwas in griechischer Schrift einzufügen wäre, dann gab es dazu einen eigenen, technisch passenden Setzkasten, der wieder für Texte in dieser Sprache geeignet war. Griechisch gäbe es als kleinen (neugriechisch) oder großen (altgriechisch) Setzkasten; letzteren polytonisch.
- Man könnte die Perspektive der Schriftsetzer und des Setzkastens grob mit einer Schreibmaschine oder Computertastatur vergleichen: Alles, was ich mit Tastendruck plus Umschalttaste erreichen kann, ist Zeichen des normalen Textes; wenn ich AltGr+ oder Alt+8211 eingeben muss, ist es Sonderzeichen.
- Nun ist für den Schriftsetzer ein & eher eine Ligatur und somit Buchstabe als ein Sonderzeichen. Einen Kopf hat man sich um eine amtliche Klassifizierung jedoch nicht gemacht. In keiner Liste der Sonderzeichen taucht aber ein & auf.
- Genauso ist ein ² eher eine hochgestellte Ziffer als ein Quadratur-Symbol und damit Sonderzeichen. Eine wissenschaftliche Definition hatte man aber nicht, und es fragte auch niemand danach, jede Letter genau in nur eine Klasse zu kategorisieren.
- Die genaue Abgrenzung geht auch unter Mediengestaltern durcheinander.
- http://www.typolexikon.de/ ist eine der respektierlicheren unter den Websites.
- In den Artikeln Dicktengleich und Schriftwahl steht in klassischer Weise gleichberechtigt nebeneinander „Satzzeichen, Sonderzeichen, …“ in der Aufzählung.
- Derselbe Autor definiert in Sonderzeichen urplötzlich aus IT/DTP-Sicht die Satzzeichen als Sonderzeichen. So geht Begriffsverwirrung.
- http://www.typo-info.de/ ist eine weitere recht brauchbare Website, definiert aber vorsichtshalber gar nicht erst.
- Dass da unter den benannten HTML-Entities allerlei Sonderzeichen vorkommen, gar die Mehrzahl stellen würden, ist in keiner Weise bemerkenswert, sondern erstens statistisch falsch und hat zweitens andere Gründe.
- Bei Einführung dieser Entities in HTML 2 hat man ausnahmslos alle Zeichen der ISO 8859-1 und fast alle der Codepage 1252 als mnemonisches Entity abgebildet, und weiter nichts.
- Damit ließen sich in einer 7-Bit-Welt alle auf den 8-Bit-PC der damaligen Zeit repräsentierbaren Zeichen in HTML generieren.
- US-amerikanische Computertastaturen der damaligen Zeit konnten nur ASCII, also 7-Bit.
- Die Entities bilden also die westeuropäischen Sprachen ab, plus etwas gehobenere Typografie, soweit in den genannten Zeichensätzen zufällig enthalten. HTML selbst ist das völlig egal.
- Die Auswahl der benannten Entities in HTML hat somit „Nicht-ASCII-Zeichen“ als Grund; nämlich die Vereinigungsmenge von:
- Sonderzeichen aus der Perspektive der HTML-Syntax
" & < >
- Zeichen mit Code ≥160, sofern auf PCs Mitte der 1990er Jahre im US-amerikanischen Freundeskreis (CoCom) darstellbar.
- Sonderzeichen aus der Perspektive der HTML-Syntax
- Die benannten Entities in XML sind nur die in XML reservierten Zeichen, wobei
'
hinzukommt. - Von den benannten Entities zu HTML.2 gab es 28 mit Nicht-Buchstaben, 4 verkleinerte Buchstaben und Ziffern, 1 Weißraum und 62 Modifikationen lateinischer Buchstaben in Vollgröße sowie 1 griechischen Buchstaben.
- Mit HTML.4 kamen hinzu (vgl. Windows Glyph List 4): 5 Modifikationen lateinischer Buchstaben, 1 buchstabengleiches Zeichen, 52 griechische Buchstaben, 1 hebräischer Buchstabe, 3 Sonderformen von Buchstaben, 2 diakritische Zeichen, 3 Weißraum, 4 unsichtbare Steuerzeichen, 78 Nicht-Buchstaben.
- Insgesamt sind das 168 Codes für Buchstaben, Ziffern und -modifikationen gegen 106 Nicht-Buchstaben plus nichtdruckender Zeichen.
- Ist LaTeX eine Auszeichnungssprache, die Entitäten haben kann?
- Bei der Verwendung im IT-Bereich ist regelmäßig eine Begriffsverwirrung zu beobachten mit:
- „Weder ASCII-Buchstabe noch -Ziffer“
- Reserviertes Zeichen
- Gegensatz zu „Zeichen, das als Bezeichner verwendet werden kann“.
- In den typischen Programmiersprachen und anderen formalen Sprachen kann nur das als Bezeichner verwendet werden, das mit einem ASCII-Buchstaben beginnt und später sonst außerdem nur noch ASCII-Ziffern enthält.
- Alle anderen Zeichen sind aus Sicht dieser Programmiersprache „Sonderzeichen“.
- Nun ist es oft möglich, auch einen Unterstrich „_“ in Bezeichner einzubauen. Schwupps, ist das plötzlich kein Sonderzeichen mehr.
- Ein Bindestrich „-“ würde regelmäßig als Minuszeichen verstanden werden; man würde zwei durch Bezeichner identifizierte Variablen voneinander subtrahieren. Kommt man aber zu CSS, dann ist es auf einmal ein ganz normales Zeichen und kann Bezeichner optisch gliedern; hier ist es kein Sonderzeichen.
- Ein „$“ mag oft überhaupt nicht als Bezeichner erlaubt sein; in Basic wandelt er, sofern einem Bezeichner vorangestellt, den Datentyp in Zeichenkette um, in JavaScript ist er einem Buchstaben gleichgestellt und ganz normales Zeichen.
- Mein Resümee:
- Der Artikel in seiner momentanen Gestalt verdeutlicht nicht, dass es überhaupt keine einheitliche Definition gibt, was ein Sonderzeichen sein soll.
- Zwar wird in etwa in der richtigen Richtung erläutert, dass es etwas wäre, dass „weder Buchstabe noch Zifer ist“.
- Aber schon das krankt an der Unschärfe, ob mit „Buchstabe“ denn nun nur ASCII-Buchstaben gemeint sein sollen, oder beliebige Buchstaben aller Schriften, auch kombiniert. (Übrigens gibt es nicht nur die Ziffern, die wir „arabisch“ nennen, sondern auch wirkliche arabische Ziffern und weitere asiatische Schriften mit eigenen Glyphen für Ziffern).
- Der Abschnitt zu HTML ist, milde formuliert, private TF, um es nicht unfreundlicher ausdrücken zu müssen. Das Wirrwarr um die Frage, was eher mit Nicht-ASCII-Zeichen gemeint wäre und was unter einem Buchstaben zu verstehen sei, kulminiert hier bedenklich.
- Der Abschnitt zu LaTeX ist auch sehr frisches recht privates Forschungsergebnis; und bei der Erfindung der LaTeX-Entität schrillen die Alarmglocken.
- Insgesamt gehen die breit ausgebauten Abschnitte zu LaTeX und HTML völlig am Lemma vorbei, dem dafür die wesentliche Zielrichtung, Übersichtlichkeit und Strukturierung fehlen. Aus diesem Artikel kann man nicht mehr schlau werden; er hinterlässt ratlose Leser.
- Zu meiner Beteiligung im ANR:
- Liebe Grüße --Gräfin Typo 08:32, 11. Feb. 2016 (CET)
- * * *
→ zum Mini-Inhaltverzeichnis am Anfang der Diskussion
- THIS ANSWER IS UNDER CONSTRUCTION — Voraussichtliche Fertigstellung: Die Zeitaufwandabschätzung wird frühestens in KW 7/2016 anlaufen können. Dann müssen Fördergeldanträge gestellt werden, die gewöhnlich nach 2 bis 3 Monaten beantwortet werden.
- – Ad Beteiligung im ANR schon mal vorab: (a) Du könntest einen ersten oder zweiten Abschnitt „Sonderzeichen in der Typografie“ anlegen. (b) Man könnte (müsste!?) den Artikel vielleicht erst mal löschen (Begründung: völlig konfus, baldige Besserung nicht ersichtlich) und dann Rettungsversuche im BNR unternehmen, vielleicht jeder für sich. (c) gegen löschen bin ich insofern, als ich die Einleitung und die Abschnitte über HTML und LaTeX inhaltlich schon OK finde, die fragwürdigen Abschnitte habe ich schon so kennzeichnet. Vielleicht fehlt noch ein {{Lückenhaft}} zum Thema Typografie … und noch eins wegen Einzelheiten zu Lochkarten, Lochstreifen bzw. Baudot-Code und Murray-Code. (d) Ich reduziere aus finanziellen Gründen meine Schlagzahl stark und überarbeite gerade eher ASCII – ich finde, was hier von „Nicht-ASCII-Zeichen“ steht, sollte dortin oder in andere Artikel über Zeichenkodierungen verlegt werden.
- Ad Literatur: Ich habe mit Google Books einiges gefunden – kennst du das? Hast du dir die Links schon mal angeschaut? Mehrere aktuelle Lexika haben „Sonderzeichen“ als Lemma und definieren es wie Duden online. Das gibt dem Artikel eine Daseinsberechtigung, sofern man über die reine Definition hinauskommt. – Da habe ich noch eine Idee …
- Ah, ich sehe, was du über „Bezeichner“ schreibst. Ich finde tatsächlich, dass der Artikel darauf eingehen sollte und dass es seine Überlebenschancen steigern würde. Du könntest einen weiteren Abschnitt dazu anlegen. Ähnlich URL-Encoding.
- So long --Lückenloswecken! 19:39, 12. Feb. 2016 (CET)
- Mehr im Ernst, @Gräfin Typo: Ich bin nicht in Rente und gehe (so oder so) ein Problem nach dem anderen an. Ich kann nicht an einem Tag auf alles in deinen endlosen unnummerierten Listen eingehen. Wenn ich zu einer bestimmten Thema komme, könnte ich mal sehen, was du dazu geschrieben hast, und dich vielleicht noch mal fragen, vielleicht unter einer bestimmten Überschrift hier. – Ich habe mir überlegt, ob du deine Beitragslisten wie im Tractatus logico-philosophicus durchnummerieren könntest, damit man darauf Bezug nehmen kann, Ergebnis: bin nicht sicher. – Zum Teil sprichst du Probleme des Artikels an, die mir schon lange bewusst sind und für die ich noch ein paar Tage brauche. – Mir kommt es auch so vor, als ob du dich wiederholst, ob's stimmt, mal später sehen. --Lückenloswecken! 17:04, 13. Feb. 2016 (CET)
- THIS ANSWER IS UNDER CONSTRUCTION — Voraussichtliche Fertigstellung: Die Zeitaufwandabschätzung wird frühestens in KW 7/2016 anlaufen können. Dann müssen Fördergeldanträge gestellt werden, die gewöhnlich nach 2 bis 3 Monaten beantwortet werden.
→ zum Mini-Inhaltverzeichnis am Anfang der Diskussion
Gründe
BearbeitenZustand vor meinen Überarbeitungen. –
- Von den drei Sätzen in LateX waren die ersten beiden falsch (viele Sonderzeichen werden durch sich selbst dargestellt, und die Umlautmethode benötigt spezielle Pakete), und den dritten kann man allenfalls dann ansatzweise verstehen, wenn man sich selbst gut mit LaTeX auskennt. Außerdem ging aus meiner Sicht unter, dass man mit LaTeX auch andere Zeichenkodierungen als ASCII und UTF-8 verwenden kann. Sehr gefallen hat mir aber die Formulierung „spezielle ASCII-Ketten“, diese Methode wird ja auch bei HTML, Punycode und URL-Encoding angewandt, und das wollte ich herausarbeiten. … aber es sind eher Ketten eines reduzierten Zeichensatzes (The TeXbook S. 43: TeX kann auch Nicht-ASCII-Dateien verarbeiten, als Beispiel wird EBCDIC genannt) …
- HTML war eigentlich ganz OK. Warum habe ich das überarbeitet? Vielleicht, weil HTML-Entität derzeit auf Entitäten in Auszeichnungssprachen#Zeichen-Entitäten umleitet, was ich sehr enttäuschend, zu allgemein, zu technisch finde, es fehlt die Lebendigkeit der tatsächlichen Benennungen im Falle von HTML. In erster Linie ist mein Text wohl ein Entwurf für einen eigenständigen Artikel HTML-Entität. – Außerdem war die Formatierung etwas lieblos.
- Vor meinen ersten Änderungen habe ich die Diskussionsseite gelesen und entsprechend einiges geändert, bevor ich mich an die Änderungen zu LaTeX und HTML gemacht habe. Meine erste Änderung betraf Umlaute.
- Dann stieß ich auf
- In den frühen Zeiten der Informationstechnik war die Beschränkung von Zeichensätzen auf 7 oder 8 Bit technisch bedingt.
- Die Definition von „Sonderzeichen“ war da wie aktuell Schriftzeichen, das weder Buchstabe noch Ziffer ist. Da war ich perplex, was hat denn die Bit-Zahl mit der Definition zu tun? Ich hätte die Passage fast gelöscht, dann habe ich stattdessen den Abschnitt „Sonderzeichen und Technik“ eingeführt, der den Satz diskutiert. Schon innerhalb von 7 Bit gibt es ja ziemlich viele Sonderzeichen im Sinne der Definition. Der neue Text spricht Prinzipien an, für die die Abschnitte über HTML und LaTeX Beispiele sein sollen.
- Der Rest des Artikels in seiner Gestalt vor meinen Überarbeitungen bezieht sich weiter auf Zeichenkodierungen. Ich betrachte das nun als Fehler, Missverständnis. Ein Wikipedia-Artikel über Sonderzeichen müsste gelöscht oder verschoben werden, solange damit bloß Nicht-ASCII-Zeichen oder auch ein eine Eingabemethode erforderndes Zeichen gemeint ist. Ich habe mich bemüht, auch im Zusammenhang mit Zeichenkodierungen den Aspekt der Definition von „Sonderzeichen“ im Blick zu behalten – und arbeite noch daran…
Hier auf der Diskussionsseite fand ich besonders die Hinweise von @Gräfin Typo sehr hilfreich für eine Anhebung des Niveaus des Artikels. Daher wird „Sonderzeichen“ jetzt ungefähr (auch) als Fachterminus in der Typografie genannt. Allerdings verstehe ich augenblicklich noch nicht genau, welche Rolle Sonderzeichen dort spielen, und wenn sich das nicht bessert, muss der Hinweis wieder weg.
Stand: Habe mich dann weiter so durchgewurstelt. Unter LaTeX wurde mir etwas über Funktionszeichen klar, was ich dann in den ersten Abschnitt nach der Einleitung („Sonderzeichen und Technik“) einarbeiten wollte – will… Habe ein paar Einzelnachweise eingebaut, andere stehen noch an. – Weitere Ideen und Entdeckungen …
Beobachtungen
BearbeitenAb dem von mir genannten Satz über die „Beschränkung von Zeichensätzen“ hat sich der Artikel seit der Erstfassung (5. Januar 2004) bis zur Fassung Zustand vor meinen Überarbeitungen kaum verändert. Dagegen schwankte die vorausgehende Definition etwas:
- Erstfassung: Mit Sonderzeichen assoziiert man alle Zeichen, die nicht im ASCII-Zeichensatz vorkommen. Also tatsächlich ein Artikel über Nicht-ASCII-Zeichen.
- Die Fassung die RokerHRO (#Fragwürdiger Artikel) vorfand (7. Juni 2005): Sonderzeichen sind alle in der EDV alle Schriftzeichen, außer englischen Buchstaben, Ziffern und Steuerzeichen. Was Buchstaben betrifft, besteht der Unterschied zur aktuellen Fassung in der Einschränkung auf englische. Das mit den Steuerzeichen könnte andeuten, dass es um ASCII geht, aber ebenso etwa EBCDIC oder Baudot-Code usw. Damit ich es nicht vergesse: Wenn man von Schriftzeichen oder einem Zeichensatz spricht, muss es nicht gleich um eine bestimmte Kodierung gehen, die jedem Zeichen „Plätze“ oder „Nummern“ zuweist.
- RokerHRO machte am 27. Juni 2005 vor seinem Diskussionsbeitrag ganz oben daraus: Sonderzeichen sind alle in der EDV alle Schriftzeichen, welche eine in dem jeweiligen Kontext eine "gesonderte" Bedeutung haben.
- Am 27. Juli 2012 hieß es noch seit langer Zeit: Sonderzeichen sind Satzzeichen, die nicht zu den „in Schriftzeichen festgehaltenen Lauten des Alphabets“ gehören.
- Sinuhe20 stellte am Tag der deutschen Einheit 2012 die Definition her, die erst ich dann etwas erweiterte und bequellte.
Fazit: Einleitung und Rest des Artikels passten zuletzt nicht mehr zusammen, behandelten unterschiedliche Dinge. --Lückenloswecken! 19:42, 14. Feb. 2016 (CET)
Sonderzeichen – wo kommt das eigentlich her?
BearbeitenBleisatz
Bearbeiten- Bei den Schriftsetzern hieß die Definition:
„Zeichen, das nicht in der Grundausstattung einer Schrift enthalten ist.“- Die Definition ist insofern prima, als sie über einen weiteren definitionsbedürftigen Begriff geht: „Grundausstattung“.
- Grundausstattung sind die für eine lateinische, aber auch griechische oder kyrillische Schrift alle Zeichen, die speziell für die Anmutung dieser Schrift gestalteten Schriftzeichen (auch in ihrer optischen Abstimmung zueinander) umfassen; namentlich Buchstaben, Ziffern und Satzzeichen, wobei zu den Buchstaben auch sämtliche Ligaturen und Kombinationen mit diakritischen Zeichen gehören, die in irgendeiner Sprache real vorkommen könnten.
- Setzkasten
- Der nächste Sachverhalt, den man sich klarmachen muss, ist die Aufteilung der Millionen Lettern in einer Setzerei in einzelne Setzkästen, jeder mit etwas über 100 bis etwa 200 Einzelfächern; je nach Lieferant und Jahrzehnt wechselnd.
- Wichtig ist hier der Begriff des „Brotsetzkastens“. Das ist eine Grundschrift typischer Schrifthöhe, etwa Garamond Antiqua 10 Punkt, aus dem ein Großteil der Alltagsprodukte dieser Setzerei hergestellt wird; siehe Brotschrift. Von diesen Brotsetzkästen gibt es je Schrift und abhängig von der Betriebsgröße 5 oder 10 für eine entsprechende Anzahl parallel arbeitender Schriftsetzer.
- Zu den in Normalschnitt bestückten Brotsetzkästen gehört je ein gemeinsamer, von allen gemeinsam benutzter Setzkasten für kursive und für Fettschrift und weitere für besondere Situationen; siehe Tabelle.
- Eine typische Bestückung eines Brotsetzkastens ist nachstehend grün unterlegt.
Eine bestimmte Schriftart und Höhe | Buchstaben: A–Z, a–z, ä ö ü ß à é & |
Selten: Æ å ç ë ñ œ ô ø þ ù ž etc. |
Ziffern: 0–9 auch oft: ² ³ ½ |
Tabellenziffern etc. | |
Satzzeichen: - ’ / . , ? ! : ; – „“ ‚‘ »« ›‹ () [] {} | ||
Alle Schriften gleicher Höhe | Alltägliche Symbole: + − × · = ° § * † ′ ″ | |
Sonderzeichen | bedeutungsfrei: Unterstrich, Überstrich, Vertikaler Strich, Schmuckzeichen | |
Symbole: Mathematik, Astronomie, Kursbuch, Wetterbericht etc. etc. | ||
Weißraum: Blindmaterial, Spationierung. | ||
Linienmaterial, großes Blindmaterial (Mettage), Schmuckelemente |
- Wie die Setzkästen bestückt sind, ist individuell abweichend.
- Wenn man ein skandinavisches oder französisches Buch setzt, kann man für diesen Auftrag ein oder zwei Setzkästen entsprechend umpacken.
- Innerhalb eines Jahrzehnts und innerhalb einer Region wird es meist ähnlich gehandhabt, weil auch das Personal wechselt und nicht gesondert eingearbeitet werden sollte. Über längere Zeiträume und international gibt (gab) es aber immer mal wieder allerlei Moden.
- Kurzum: Sonderzeichen ist eigentlich das, wozu ich zu einem anderen Setzkasten gehen muss und mir ein einzelnes Zeichen holen muss, wenn es mal im Text vorkommt. Weil aber manche Nicht-Buchstabe Nicht-Ziffer Nicht-Satzzeichen häufiger vorkommen, kann ich gleich mal meinen Brotsetzkasten von vornherein damit ausrüsten. So auch die Symbole RM oder M oder später DM.
- Ob ein Schriftschnitt ein eigenes § definiert (dann Grundausstattung) oder nicht (dann Sonderzeichen), ist unterschiedlich.
- Die Einteilung ist grob und pragmatisch; es wird nicht jedem Zeichen exakt nur eine Eigenschaft zugewiesen. Runde Klammern sind Satzzeichen genauso wie mathematisches Symbol.
IT
BearbeitenHier kursierten im Lauf der Zeit unterschiedliche Gruppenbildungen, die bei variierender Bedeutung besser mit der Klarbenennung statt über das verschwommene Wort „Sonderzeichen“ bezeichnet worden wären:
- Nicht-Buchstabe-Nicht-Ziffer
- Nicht-ASCII-Zeichen
- Nicht-Bezeichner-Bestandteil
- Nichtreserviertes Zeichen
- Nicht-ANSI-Zeichen.
Gemeinsam ist ihnen die Negation, dass es sich um Zeichen handeln solle, die über irgendeine Grundmenge hinausgehen sollen. Was aber diese Grundmenge wäre, wechselt je nach Kontext.
Das ist übrigens die Gemeinsamkeit mit dem Setzkasten: Sonderzeichen ist das, was nicht in der Grundausstattung enthalten ist.
- Es gibt noch eine Gemeinsamkeit: Die ASCII und ISO 8859-1 und DIN 66003 sind genau die Bestückung eines Brotsetzkastens mit einer nunmal begrenzten Anzahl von Fächern, die für einen Sprachraum die Minimalausstattung enthalten.
- Unicode wurde maßgeblich von Typografen mitentwickelt; deswegen wird dort auch letter digit punctuation symbol spacing usw. unterschieden.
Liebe Grüße --Gräfin Typo 08:53, 22. Feb. 2016 (CET)
Ein wissenschaftliches Hochgebirge ohne Informationswert für den Otto-Normal-Leser
BearbeitenIch bin eigentlich hier zum Artikel gekommen um mal zu schauen, ob der Asterisk als Sonderzeichen gilt und wenn ja, in welcher Untergruppe er dort ggf angeführt ist, um dann einen entsprechenden Wikilink setzen zu können. Nachdem ich mich durch uferlos viel wissenschaftlich anmutenden Text in den (Unter-)Abschnitten) Sonderzeichen und Technik, Unicode, HTML, Zeichenentitäten, Numerische Zeichenentitäten, Benannte Zeichenentitäten und „HTML-eigene“ Zeichen, Angabe der Quellcode-Kodierung, LaTeX, Sonderzeichen ohne ASCII-Code, Kodierung durch ASCII-Kombinationen gequält habe, finde ich dann fast am Ende des Artikels unter ASCII-Sonderzeichen einen unheimlich informativen Satz zum Sternchen:
- "In LaTeX halten manche Befehle nach folgender linker eckiger Klammer
[
oder dem Stern*
Ausschau. In speziellen Fällen bereitet dies Schwierigkeiten, beispielsweise wenn man eine neue Zeile mit einer eckigen Klammer beginnen will. Statt\\[
tippt man dann besser\\{}[
.",
was meine Frage nun nicht mal im Ansatz beantwortet. Nebenbei entdecke ich in diesem Abschnitt auch noch folgendes:
- "Um das Eintippen zu erleichtern und die Leserlichkeit des Codes zu verbessern, werden 10 der ASCII-Sonderzeichen –
\{}$&#^_~%
„zweckentfremdet“/„reserviert“ (Funktionszeichen)"
Diese Zeichen sind de facto weit aus mehr als nur Funktionszeichen und kommen als typografische Zeichen in Abermillionen, wenn nicht Milliarden Texten weltweit vor. Beispielsweise ist der Gender_Gap (Lehrer_innen) oder das Gender-Sternchen (Schüler*innen) seit vielen Jahren massenhaft im Einstz. Und:
- "z. B. für
m$^2$
(Ergebnis „m²“), wofür man in HTMLm²
oderm<sup>2</sup>
tippt."
Dafür gibt es auf meiner und jeder anderen millionenfach vorhandenen T1-Tastatur entsprechende Tasten, die zum Teil in Kombination mit der Umschalt- oder AltGr-Taste das gewünschte erzeugen, auch die hier nicht aufgeführten Sonderzeichen @
, µ
, *
, °
, |
,
Wenn überhaupt, dann würden sich die aller-aller-meisten Leser*innen bzw Schreiber*innen, die hier aufschlagen, wohl eher eine Info darüber erhoffen, wie sie in ihrem Editor beispielsweise die Sonderzeichen –
, …
, ©
, »
, «
, ®
, ‰
, •
, ¼
, ½
, ¾
, ÷
usw am einfachsten erzeugen können.
Summa summarum werden vermutlich die Fragen von 99,99% aller Leser*innen, die mit dem Suchwort Sonderzeichen auf der Artikelseite landen, etwas völlig anderes erwarten, als sie aktuell hier vorfinden. Hier muss eine gruppierte Auflistung aller wichtigen Sonderzeichen mit ein- bis zwei Sätzen Kurzbeschreibung und jeweiliger Verlinkung zum entsprechenden WP-Lemma her.
Die aktuelle Seite kann man getrost nach Außerirdische Methoden Sonderzeichen zu kreieren oder sinngemäß ähnliches verschieben.--Ciao • Bestoernesto • ✉ 22:49, 30. Apr. 2019 (CEST)
- Der allererste Satz des Einleitungsabschnittes hatte deine Frage bereits kurz, knapp und laienverständlich beantwortet: ja.
- Ein Sonderzeichen ist […] ein Schriftzeichen, das weder ein Buchstabe noch eine Ziffer ist.
- Wenn du über diesen Satz hinaus weiter liest, dann bekommst du naturgemäß weiterführende Informationen.
- Zu der Frage, was genau unter der Vokabel „Sonderzeichen“ zu verstehen ist, gäbe es je nach Jahrzehnt und Berufsgruppe (Schriftsetzer, Computerleute) und Kultur im Detail differenzierte Antworten.
- Bei den Schriftsetzern wäre ein Teil der Sonderzeichen eher „Symbol“ genannt worden, die (deutschsprachigen) Satzzeichen hingegen überhaupt nicht zu den Sonderzeichen gerechnet.
- Ein griechisches Alpha wäre für uns womöglich ein Sonderzeichen oder Symbol, in einem griechischen Kontext hingegen ein normaler Buchstabe, dort hingegen ein lateinisches L ein Sonderzeichen.
- In der IT gelten ggf. schon alle Zeichen jenseits der Buchstaben und Ziffern in ASCII als Sonderzeichen.
- Ein ä oder ü, das wir auf der Tastatur hätten, würde von uns vielleicht als normaler Buchstabe betrachtet werden; ein ç wie im Französischen, ein Š oder ñ hingegen als Sonderzeichen. Dafür würden Schweizer ein ß vielleicht als Sonderzeichen einstufen. Was eine Ligatur, also zwei optisch zusammengerückte f sein soll, würde von vielen Verwendern unterschiedlich beurteilt werden. Schriftsetzer im Bleisatz halten das für normale Buchstaben, Programmierer werden wahnsinnig, weil es die Suchvorgänge aushebelt, und fassen das als Sonder-Spezieal-Extrazeichen auf. Siehe dazu im Übrigen diverse Absätze hier drüber aus den letzten Jahren.
- Es wäre wohlfeil, jedoch Theoriefindung und trivial, sich wie von dir eingefordert alle möglichen „Untergruppen“ auszudenken; sie haben jedoch nichts in unserem Artikel zu suchen. Es kann sich jeder selbst überlegen: Währungssymbole, Satzzeichen, mathematische Formelzeichen, linguistische Symbole, genealogische Symbole, Pfeile, Striche, geometrische Formen (denen allerlei Bedeutung unterlegt werden mag), Schriftzeichen gleich welcher Bedeutung aus anderen Schriftsystemen, Spielkarten und Schachfiguren, die modernen Smileys und Emojis, Gender-Symbole, astrologische Symbole und was auch immer. Das ist aber völlig willkürlich, ansonsten offensichtlich und kann nicht enzyklopädisch im Artikel beschrieben werden. Es gehört auch nicht zwingend nur genau eine Bedeutung zu einem Zeichen, sondern je nach Kontext können Punkte, Striche, Kreuzchen, Sternchen, griechische und hebräische Buchstaben, Wellenlinien, Astro-Zeichen in Mathematik, Botanik, Chemie, Linguistik, IT oder normalen Texten eine völlig andere Interpretation haben. Damit lassen sie sich aber auch nicht in irgendwelche von dir geforderten „Untergruppen“ einordnen.
- Der letzte Absatz deiner Darlegungen und der gemachte Vorschlag lassen jedoch darauf schließen, dass du von der Minimal-Definition „weder Buchstabe noch Ziffer“ bereits überfordert bist, und dein gesamter Abschnitt nicht ernstgenommen werden kann.
- Im Übrigen zählt zu den WP:WWNI: WP ist kein HowTo – wir sind keine Bedienungsanleitung für Tastaturen aller möglichen Sprachen und Schriftkulturen und Hersteller, keine „Sammlung von Anleitungen und Ratgebern“.
- Liebe Grüße --Gräfin Typo 08:43, 2. Mai 2019 (CEST)
- "WP ist kein HowTo", ja leider und es wird natürlich auch auf kein "HowTo" verlinkt und deshalb sind Artikel wie dieser hier für den Alltags-User, der mal eben nachschauen will, wie er ein ç in einem Wikitext erzeugt, leider völlig nutzlos. Mit Bedauern und ebenfalls "lieben Grüßen". --Kerchemer (Diskussion) 10:31, 29. Jun. 2020 (CEST)