Diskussion:ISO 8859-1

Unverständlichkeit

Letzter Kommentar: vor 2 Jahren4 Kommentare4 Personen sind an der Diskussion beteiligt

Was ist denn ein "Codepunkt x" ?

Und was ist ein "nicht Œ/œ" oder ein "nicht €" ? Was ein Euro-Zeichen (€) ist, weiß ich zwar, aber ein "nicht-Euro" ?

Man sollte doch in der Wikipedia sich bemühen, keine kryptischen Ausdrücke zu verwenden. (nicht signierter Beitrag von 95.91.208.35 (Diskussion) 18:26, 26. Dez. 2021 (CET))Beantworten

Der gesamte Artikel ist für nicht-Informatiker völlig unverständlich! Hier kann man niemanden hinschicken, der mal wieder Win-1252 im Charset seiner Frontpage-generierten Homepage hat stehen lassen. Das ist sicher einigermaßen schwierig zu erklären aber wäre nicht genau das der Sinn von Wikipedia?

Ein Tutorial zu (Pseudo-)HTTP-Headern und HTML gehört nicht in die Wikipedia, die Beschreibung von ISO 8859-1 und Windows-1252 sowie evtl. der Unterschied schon.

Genau, ich erwarte eine Beschreibung, kein Technokauderwelsch! Ich habe das FP für ein praktisches Beispiel benutzt, das ständig vorkommt. Was der Eintrag im Header bewirkt ist einfach zu erklären, warum es einen Unterschied macht - und welchen - ob man ISO 8859-1 oder Windows-1252 benutzt, das würde imho sehr wohl in die Wikipedia passen.

Ich dachte bisher eigentlich, dass die Einleitung in Verbindung mit den Tabellen genau das leistet. Ich würde natürlich nie behaupten, dass die Formulierung im Artikel oder Vorlage:ISO 8859-X perfekt wäre.

Gegenfrage: ist die Anforderung der Allgemeinverständlichkeit überhaupt sinnvoll bei einem Artikel in dem es um ìnternationale Normen bzw. Standards geht? Zumindest ich habe in diesem Artikel genau die Antworten gefuden, die ich gesucht habe. Nämlich eine Begriffserklärung. Auf Tutorials für Laien kann man meinetwegen einen Link setzen, aber in der Wikipedia hat das nichts zu suchen.

Es würde vielleicht schon mal helfen zu erklären, wie man die Tabellen zu lesen hat!

Das hier ist meiner Meinung nach ein Widerspruch in sich:
"Den Positionen 0x00–1F und 0x7F–9F sind in ISO/IEC 8859 und damit ISO/IEC 8859-1 keine Zeichen zugewiesen. ISO-8859-1 jedoch besetzt alle diese Stellen mit nicht darstellbaren Steuerzeichen."
Oder sind ISO/IEC 8859-1 und ISO-8859-1 jetzt doch zwei Paar Stiefel?

Ja, genau das soll der Text aussagen. Eselsbrücke: mit Bindestrich ist mit (C1-)Steuerzeichen.

Sind ISO/IEC 8859-1 und ISO-8859-1 dann doch nicht das selbe? Im Text steht, daß ISO/IEC 8859-1 die genauere Bezeichnung für ISO-8859-1 wäre.

Nein, das steht da nicht. Guck dir die Begriffe noch einmal an, die beim ersten Auftreten fett sind. Christoph Päper 04:15, 29. Aug 2005 (CEST)

Ich musste erst in der en-wiki nachschauen um erklärt zu bekommen, dass der Bindestrich den Unterschied ausmacht. Dort wird nämlich clevererweise explizit darauf hingewiesen, wie man es hier auch besser machen sollte. --Majoran 01:23, 2. Dez. 2006 (CET)Beantworten

Sorry im voraus für den etwas harschen Ton, aber ist das eine Enzyklopädie oder "ich sehe was, was Du nicht siehst"? Auf solche Unterschiede muss doch wirklich im Artikel hingewiesen werden! Ich versuche mal, die Vorlage zu verbessern. --vwm 10:15, 15. Feb. 2007 (CET)Beantworten

Dieser Satz ist auch ein wunderbarer Beleg für meine Behauptung, daß der Artikel unverständlich sei. Kein "normaler" Mensch kann was mit Hexadezimal Codierung anfangen! MichaelXXLF 08:50, 27. Aug 2005 (CEST)

In einer 16×16-Tabelle bietet sich hexadezimal nun mal an und verlinkt ist es. Ist es nicht konsequent, diese Codes auch im Text zu verwenden? Christoph Päper 01:46, 28. Aug 2005 (CEST)

Ach du Schande, da oben links *in* der Tabelle :-/

MichaelXXLF 11:02, 28. Aug 2005 (CEST)

Ich finde die Hexadezimalschreibweise im Gegenteil sehr sinnvoll, weil sie identisch ist zur Darstellung, welche man auch in den "Code Charts" auf unicode.org findet. Man sollte aber vielleicht den Link http://www.unicode.org/charts/ als Quelle mit erwähnen. Weil dies IMHO die maßgebliche Stelle ist, wenn man nach Tabellen für eine Kodierung sucht.

Also, ich hätte hier auch gerne eine Anleitung gefunden, wie ich denn nun die vielbesprochenen Zeichen als einfachster Anwender in eine Datenbankzeile oder einen einfachen Text ganz praktisch rein bekomme. Halt so wie "alt135" das "ç" ergibt. (nicht signierter Beitrag von Henrich1E (Diskussion | Beiträge) 14:36, 18. Mär. 2014 (CET))Beantworten

Die Unwissenheit um die Unterschiede zwischen ISO/IEC 8859-1, ISO-8859-15 und Windows-1252 sowie ggf. weiterer 8-Bit-Zeichensätze bzw. überhaupt deren Existenz sind steter Quell für Software- und Websitefehler. Der Grund liegt darin, dass man mit dieser Codierung ein Fundamentalgesetz der Informatik verletzt, nämlich dass man ein Ding (eine Einheit) nur mit einer Code-Nummer repräsentieren soll. Eine Codenummer soll nicht verschiedene Dinge bedeuten können.

Verzeihung, was es mit dieser Passage auf sich hat, kapiere ich nicht. Was bitte haben »Fundamentalgesetze der Informatik« an dieser Stelle suchen, und welchen Sinn hat die Kritik an der Existenz der Zeichensätze? Das ist eine Meinungsäußerung, die sicher streitbar ist. Aber es gibt nun einmal verschiedene Kodierungen. Das hat Gründe. Das führt zu Konfusion, das sollte man den Wikipedia-Lesern vermitteln. Der Hinweis auf Unicode ist also angebracht. Aber bitte nicht in diesem »Fundamentalgesetz der Informatik«-Sprech. Kann man das zumindest in menschenlesbarem Deutsch formulieren? Vor allem dieses »Ding« herausnehmen - hier sind ganz konkret Zeichen gemeint. Die informationswissenschaftlichen Hintergründe braucht Wikipedia m.E. an dieser Stelle nicht zu klären. --molily 21:13, 15. Okt 2004 (CEST)

Indonesisch

Wie viele Sonderbuchstaben (=Buchstaben außerhalb von ASCII) werden in der indonesischen Sprache verwendet? --84.61.31.185 12:04, 4. Mär 2006 (CET)

Keine, es sei denn es wird (wie früher) in arabischer Schrift geschrieben, siehe Indonesische Sprache. Was die Frage hier soll, verstehe ich nicht? Christoph Päper 14:09, 4. Mär 2006 (CET)

Malaiisch

Letzter Kommentar: vor 18 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Wie viele Sonderbuchstaben (=Buchstaben außerhalb von ASCII) werden in der malaiischen Sprache verwendet? --84.61.45.197 18:39, 29. Mai 2006 (CEST)Beantworten

Latin1 Untergruppen

Falls sich jemand mit dem Thema auskennt, wäre es nett wenn er unten dran noch festschreiben könnte was es sich mit latin1_bin, latin1_german1_ci, latin1_german2_ci usw auf sich hat. Danke! --Benutzer:Holzwurm 15:08, 19. Juli 2006 (CEST)

Was soll das sein? --RokerHRO 18:50, 19. Jul 2006 (CEST)

Das sind keine Untergruppen sondern sprachspezifische Sortierregeln, und zwar in der MySQL-eigenen Ausprägung. Wir haben nur die sehr allgemeinen Artihel Sortierung und Alphabetische Sortierung, en: hat immerhin noch en:Collation und en:Unicode collation algorithm. --Pjacobi 20:48, 19. Jul 2006 (CEST)

Aha, MySQL-Kram... das soll nu einer wissen. ;-( Aber IMHO hat das in einem Artikel über Zeichensätze nichts zu suchen. --RokerHRO 22:23, 19. Jul 2006 (CEST)

Nynorsk hat Ò/ò auch.

Letzter Kommentar: vor 17 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Es gibt einen Abschnitt im Artikel, in dem aufgezählt wird für welche Sprachen ISO 8859-1 ausreicht, hier aber werden beim Norwegischen (Nynorsk) die Buchstaben Ò/ò nicht erwähnt.

na, verlassen wir uns mal auf die angabe des anonymos.. -- W!B: 23:35, 6. Jan. 2007 (CET)Beantworten

Browserverhalten

Letzter Kommentar: vor 17 Jahren6 Kommentare3 Personen sind an der Diskussion beteiligt

Ich würde gerne hinzufügen, wie sich aktuelle Browser wie IE, FireFox und Opera verhalten. Die benutzen nämlich einfach immer cp1252 statt iso-8859-1.

Ist das so? Also mein Firefox 2.0.0.2 (unter Windows) hat in seiner Liste (Menü Ansicht - Zeichenkodierung - Weitere - Westeuropäisch) sowohl iso-8859-1 als auch windows-1252. Spontan hab ich auch eine Seite gefunden, wo ISO-8859-1 ausgewählt ist [1]. Was ich nicht geprüft hab, ist, ob da auch alle Zeichen richtig sind. Wenn Du eine Quelle hast (z.B. eine Seite, auf der der Unterschied erkennbar ist), dann schreib die einfach hier rein, und ergänze den Artikel entsprechend. --vwm 10:27, 2. Mär. 2007 (CET)Beantworten

Ich wäre genauere Quellenangaben auch dankbar. Normalerweise sollten aktuelle Browser die Zeichenkodierung verwenden, die im HTTP- oder HTML-Header angegeben worden ist. Wenn dort nichts steht, okay, dann können die Browser irgend eine Heuristik zur Zeichensatzerkennung machen. --RokerHRO 11:13, 2. Mär. 2007 (CET)Beantworten

Ich kann für diese Erkenntnis leider keine Quelle angeben. Wäre selber an einer guten Quelle interessiert. Ich kann aber den Beweis mit Hilfe einer HTML-Seite liefern. Wer es selber ausprobieren möchte, den wird z.B. verblüffen, dass selbst HTML-Unicode-Entities bewusst falsch dekodiert werden.  wäre normalerweise ein Steuerzeichen. Es wird aber ein € dargestellt. Man kann alle Werte zwischen  und  probieren. Die Darstellung entspricht nicht der Unicode-Tabelle, sondern haargenau cp1252. Die Zeichen 0x80 bis 0x9F sind in der Unicode-Tabelle nämlich auch nur Steuerzeichen, genauso wie bei ISO-8859-1. Hier ist der Link zu einer Seite, die das Phänomen demonstriert: [2] JSP-Programmierer dürften auf diese Problem alle Nase lang stoßen, weil die Browser das Euro- und die anderen Zeichen als cp1252 senden, was aber vom ServletContainer als ISO-8859-1 interpretiert wird, was zu inkorrektem Unicode führt. (Auf Server-Seite tauchen z.B. Java-Strings auf, in denen der char 0x80 das Euro-Zeichen darstellt) --skoehler 22:15, 3. Mär. 2007 (CET)Beantworten

Das kann ich mir nur so erklären: Viele Webseiten geben vor, ISO-Latin-1-kodiert zu sein, verwenden dann aber fehlerhafterweise Zeichen aus CP 1252, entweder als &#-Code, oder direkt die Bytewerte. Da die Browserhersteller sich aber genötigt sehen, auch fehlerhafte HTML-Seiten (und dabei nicht nur fehlerhafte Zeichensatzangaben, auch sonstige HTML-Fehler) zu tolerieren und irgendwie sinnvoll darzustellen, werden sie wohl eine gewisse Heuristik verwenden oder ganz pragmatisch, die (in HTML) wenig sinnvollen CS1-Steuerzeichen von ISO-Latin-1 (im Bereich von 80_hex bis 9F_hex) als CP-1252-Zeichen aufzufassen. :-( --RokerHRO 22:38, 3. Mär. 2007 (CET)Beantworten

Ja, das erkläre ich mir auch so - und das würde die Darstellung erklären. Warum dann allerdings dazu übergegangen wurde, die Daten auch als cp1252 zu SENDEN - das ist mir ein Rätsel, und es lässt mir die Haare zu Berge stehen, weil es nur Probleme bringt. Deswegen juckt es mich auch in den Fingern, dieses Verhalten gut zu dokumentieren. --skoehler 23:31, 3. Mär. 2007 (CET)Beantworten

Okey, Danke für die Beispielseite. Zumindest für Firefox ist dieses Verhalten dokumentiert und wird von den Entwicklern diskutiert: [3], [4]. Damit, würde ich sagen, liegen mehr als genügend Quellen vor. Du kannst es also guten Gewissens in den Artikel schreiben, Skoehler. --vwm 11:15, 6. Mär. 2007 (CET)Beantworten

Synonym von Windows-1252

Letzter Kommentar: vor 13 Jahren3 Kommentare2 Personen sind an der Diskussion beteiligt

Hallo Leute! Im Artikel steht am Ende des Absatzes Windows-1252 (unter der Tabelle), für die Kodierung Windows-1252 werde auch „CP1252“ als Synonym akzeptiert. Als Einzelnachweis ist dafür diese Seite der IANA angegeben, auf der steht, dass es keine Aliasse für Windows-1252 gebe. MfG Stefan Knauf 00:29, 27. Feb. 2011 (CET)Beantworten

Den Verweis auf http://www.iana.org/assignments/charset-reg/windows-1252 habe ich nachträglich hinzugefügt. Ich habe damals nach einem Beleg für die Aussage gesucht, aber im Prinzip das Gegenteil gefunden. Vielleicht kann die Aussage im Artikel abgeschwächt werden, denn anscheinend ist CP1252 kein offizieller Alias, aber ein bekannter Alternativname. --Fomafix 11:02, 27. Feb. 2011 (CET)Beantworten

Hallo Fomafix! O.K., ich habe die Angabe gerade mal selber entfernt. MfG Stefan Knauf 21:56, 28. Feb. 2011 (CET)Beantworten

ISO/IEC 8859-1 == ISO 8859-1

Letzter Kommentar: vor 11 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Beim Blick auf die Tabelle viel mir folgender Text auf:

wie ISO/IEC 8859-1 und ISO 8859-1

Laut http://de.wikipedia.org/wiki/ISO_8859 ist ISO 8859-1 ein Synonym zu ISO/IEC 8859-1.

Ist hier statt ISO 8859-1 eventuell ISO-8859-1 gemeint? Sollte mit beiden Begriffen dasselbe gemeint sein wäre die Formulierung

wie ISO/IEC 8859-1 bzw. ISO 8859-1

wohl besser geeignet. Den Rest des Artikels habe ich jetzt nicht nach dieser Feinheit durchforstet. (nicht signierter Beitrag von 109.84.86.1 (Diskussion) 15:37, 18. Okt. 2013 (CEST))Beantworten

Verwendung

Letzter Kommentar: vor 9 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Entweder ist es sehr ungeschickt formuliert oder es steht schlicht falsch da. Nämlich, dass ISO 8859-1 ausreichen würde um deutsche Zeichen wie Ö, ö, Ü, ü und ß darzustellen. Das trifft ja wohl definitiv nicht zu! Diese Zeichen sind in ISO 8859-15 enthalten, aber nicht in ISO 8859-1! 178.25.113.42 21:23, 19. Feb. 2015 (CET)Beantworten

ISO 8859-1 beinhaltet ebenso wie ISO 8859-15 die Zeichen Ä, Ö, Ü, ä, ö, ü und ß. Was ist ungeschickt formuliert oder falsch? --Fomafix (Diskussion) 22:11, 19. Feb. 2015 (CET)Beantworten

Windows Tabelle

Letzter Kommentar: vor 8 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Man liest, gleich vor den zusätzlichen Windows-Zeichen, "wie ISO wie ISO 8859-1 und US-ASCII-1 und US-ASCII". Die ersten 7 von diesen 8 Zeichen in dieser Tabelle sind jedoch auch in 8859 enthalten; lediglich Dezimal-127 fehlt. Bitte die Tabelle korrigieren. (nicht signierter Beitrag von 217.226.94.238 (Diskussion) 10:09, 19. Mai 2016 (CEST))Beantworten

Windows-1252

Letzter Kommentar: vor 7 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Im Abschnitt Windows-1252 muss es in der Tabelle "Kodierungstabelle, Übersicht" im untersten gelben Kasten wohl heißen:
"wie ISO/IEC 8859" statt "wie ISO/IEC 8859-1" --MTimann (Diskussion) 02:50, 11. Feb. 2017 (CET)Beantworten

So wie ich das sehe ist genau an dieser Stelle "wie ISO/IEC 8859-1" richtig, also Part 1 der Normenfamilie ISO/IEC 8859. --Fomafix (Diskussion) 09:18, 11. Feb. 2017 (CET)Beantworten

Amiga

"[...] die sich lediglich durch vier Modifikationen unterscheidet", welche denn?

Tabelle ISO/IEC 8859-1

Letzter Kommentar: vor 4 Jahren3 Kommentare3 Personen sind an der Diskussion beteiligt

Warum ist das DEL-Zeichen (0x7F) in der Tabelle ISO/IEC 8859-1 aufgeführt? Laut ISO/IEC 8859-1:1998(E) sind nur Bereiche 0x20-0x7E und 0xA0-0xFF belegt. --195.145.170.156 17:25, 12. Feb. 2020 (CET)Beantworten

Geändert. --Peter.A.Schneider (Diskussion) 17:51, 12. Feb. 2020 (CET)Beantworten

Das ging ja schnell Hr. Schneider :-) --Jens Nuglisch (Diskussion) 21:47, 12. Feb. 2020 (CET)Beantworten

Diese (!) Bereich wurde bewusst freigehalten

Letzter Kommentar: vor 2 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Im zweiten Absatz der Einleitung steht "Diese Bereich wurde bewusst freigehalten..." Ich habe versucht den Artikel zu bearbeiten um das fehlende 'r' (in "Dieser") hineinzufügen, aber das ist mir nicht gelungen: Der ganze Absatz taucht nicht auf! An seiner Stelle steht irgendwas von "Textbox", mit vielen "{x|y|z|}" usw. Diese (sic!) Textbox finde ich nicht, und weiss auch nicht ob ich die Befügnisse hätte an ihr irgendwas zu ändern. Möge jemand der es kann das berichtigen. -- CRConrad (Diskussion) 18:50, 11. Aug. 2021 (CEST)Beantworten

Der Artikel verwendet diverse Vorlagen und "Module", die am Ende der Bearbeitungsseite angegeben sind. Mal sehen, ob sich so eine Vorlage korrigieren lässt. Ich versuche es mal. (nicht signierter Beitrag von 95.91.208.35 (Diskussion) 18:24, 26. Dez. 2021 (CET))Beantworten

Abschnitt hinzufügen