Wikipedia:Technik/Archiv/UTF8-Probleme/Erledigtes
Bis 2005 abgearbeitete Probleme nach Umstellung auf UTF-8 bzw. Unicode.
Erledigte UTF8 - Probleme
Bearbeitenhierher verschoben von UTF-8-Probleme
Darstellung als "Fragezeichenraute"
BearbeitenIn der Suche
BearbeitenSuche ich in WIKIPEDIA nach 'Objekt im Weltraum' (ohne "Tüttelchen, natürlich!), so wird auf [1] auch Ufo anzezeigt:
3: ...�rzung für ein „unidentifiziertes fliegendes Objekt“ (englisch: unidentified flying object)...
Das "ü" in "Abkürzung" wird von Mozilla/5.0 (Windows; U; Windows NT 5.1; de-AT; rv:1.7) Gecko/20040514 als Raute dargestellt, das "ü" in "für" nicht. Ich sehe das gleiche Verhalten sowohl abgemeldet mit mit Skin MonoBook als auch eingelogt Skin Standard (andere nicht getestet, da vermutlich irrelevant). Beim Einsetzen der Textpassage hier mit Cntrl-C / Cntrl-V wurde im Editfenster ebenfalls die Raute angezeigt. IE6 zeigt ein Fragezeichen an der fraglichen Stelle. Rufe ich die UFO- Seite normal auf, wird da "ü" korrekt angezeigt, Editieiren der Seite ("ü" gelöscht und neu eingesetzt) brachte keine Verbesserung. Wer weiß eine Erklärung für diesen exotischen Fehler?
- nachdem der Text damit anfängt, habe ich einen Verdacht: Das "ü" ist jetzt ja ein 2Byte-Zeichen. Nun schneidet irgendwas vor der Ausgabe x Byte vorne ab. Und erwischt dabei das erste Byte vom "ü". Das zweite Byte ist für sich gesehen kein gültiges Zeichen. Übrigens: in konqueror beginnt die Anzeige *nach* dem "ü". TheK 13:22, 1. Aug 2004 (CEST)
in der Versionsgeschichte
BearbeitenDort finde ich auch gelegentlich (habe noch nicht allzu viel studiert) die Fragezeichenrauten. Ob das ein eigenständiges Problem ist vermag ich nicht zu sagen. Beispiel: "Das Schwarze Auge". -- RainerBi
- hier geht's (konq 3.2.3) - also entweder inzwischen weg oder nicht global...
- Firefox zeigt hier auch die Fragezeichen an. --Daniel Beyer ✉ 14:15, 30. Jul 2004 (CEST)
- Und mein "Mozilla/5.0 (Windows; U; Windows NT 5.1; de-AT; rv:1.7) Gecko/20040514" bleibt dabei: Rauten, auch nach Cachelöschung! -- RainerBi 14:18, 30. Jul 2004 (CEST)
- Das passiert auch regelmäßig auf den anderen UTF-8-Wikipedias, ist also nicht umstellungsspezifisch. Woher das kommt, weiß ich nicht, anscheinend zeigt die MediaWiki-Software die Carriage Returns oder die Linefeeds falsch an. -- ~ 15:40, 30. Jul 2004 (CEST)
Problem behoben? Wenn ich die Versionsseite über den Beispiellink ansehe, erscheinen bei mir die Fragezeichen-Rauten nicht mehr, und ganz allgemein habe ich den Fehler schon länger nicht mehr beobachtet. Falls sich im Laufe des Tages kein Widerspruch regt, verschiebe ich dieses Problem in das Archiv. -- RainerBi ✉ 07:58, 10. Aug 2004 (CEST)
Anmeldung - Sonderzeichen in Benutzernamen
BearbeitenFall 3
Bearbeiten- Auch bei mir der GAU, kann mich nicht mehr anmelden! Mein Benutzername ist hatte ein "ö", ich würde den auch gerne behalten!!
(Ich war während der Umstellungsphase noch angemeldet, kann das ein Problemgrund sein?) Es wurde dann auch bei mir als Name nach der Umstellung ein "?" statt des "ö" angezeigt. Wollte mich ausloggen, ging nicht. Habe dann IE 6 beendet, Cookies gelöscht, wollte wieder einloggen, Pustekuchen, User existiert angeblich nicht... Bitte um Hilfe. Meine Emailadresse liegt vor, bitte ggf. Lösung an wikipedia@2cool.info mailen. Danke.
Mein Paßwort hat keine Umlaute, sondern mein Benutzername. Den IE Cache habe ich gelöscht, auch eine automatische Paßwortangabe erfolgt nicht (wäre ja hier auch egal, ich will nur die Standardfragen vorab beantworten). --195.27.237.226 15:16, 30. Jul 2004 (CEST)
- Versuch jetzt nochmal, dich einzuloggen. --Head 15:42, 30. Jul 2004 (CEST)
Vielen Dank, es geht jetzt. (Übrigens: Meine Signatur war direkt nach der UTF-8 Umstellung schon kaputt, standen wirre Formatierungsbefehle (Size, Font) drin, läßt sich aber natürlich in den Einstellungen beheben.)
Mit stolzer Signatur: --Philip Erdös 16:01, 30. Jul 2004 (CEST)
Fall 4
BearbeitenIch kann mich zwar einloggen, meine Beobachtungsliste und meine Einstellungen sind auch noch da, aber wenn ich einen Artikel schreibe, kommt nur ein J? statt Jörny - Jörny 17:57, 30. Jul 2004 (CEST)
- komisch, reparieren deines Benutzerseiten-Links klappt nicht..?!? Übrigens bist du Fall 4 :) TheK 18:15, 30. Jul 2004 (CEST)
- Ist erledigt. --Head 19:15, 2. Aug 2004 (CEST)
Fall 5
BearbeitenFall 5 ist Benutzer:Bullenwächter. Anscheinend ist Shaihulud der einzige Developer, der es schafft, Benutzernamen zu reparieren. --Head 16:16, 1. Aug 2004 (CEST)
Fall 6
BearbeitenBenutzer:Gernot Wollé kann sich nicht einloggen, habe es im SourceForge-Tracker gemeldet. --Head 19:15, 2. Aug 2004 (CEST)
- Anscheinend erledigt. --Head 15:54, 7. Aug 2004 (CEST)
Das Problem ist wirklich erledigt, danke: ich habe herausfinden müssen, wíe die Cookies zu löschen sind :-)) ... dann klappte es wieder völlig reibungslos! Gruß, --Gernot
Fall 7
BearbeitenIch bin Benutzer:Josef Spindelböck und kann mich vom Zweitcomputer aus nicht mehr einloggen (Benutzer unbekannt). Auf dem Erstcomputer, wo ich mich auch jetzt eingeloggt habe, funktioniert noch das Cookie. Was soll ich tun? [[Benutzer:Josef Spindelb�ck|Josef Spindelb�ck]] 21:10, 8. Aug 2004 (CEST) (auch diese Urheberanzeige ist gestört)
- Hallo, ist dieses Problem noch aktuell? -- RainerBi ✉ 17:21, 10. Aug 2004 (CEST)
- Inzwischen habe ich mich neu mit demselben Namen registriert. Kann jemand meine alte Histories in den neuen Account überführen? Benutzer:Josef Spindelböck
- Bitte mal schaun, ob von beiden Rechnern der gleiche Account verwendet wird (Benutzerseiten, Eigene Beiträge, etc.) - das neu registrieren unter dem selben Account sollte eigentlich nicht möglich sein. Es könnte sein, dass einer der Rechner (bzw. der entsprechende Browser) mit UTF-8 nicht zurechtkommt. -- srb 00:12, 11. Aug 2004 (CEST)
- Sollte erledigt sein. -- JeLuF 08:18, 11. Aug 2004 (CEST)
- Danke an alle, die mitgeholfen haben, mein Problem zu lösen, besonders an JeLuF! Josef Spindelböck 09:06, 11. Aug 2004 (CEST)
- Sollte erledigt sein. -- JeLuF 08:18, 11. Aug 2004 (CEST)
- Bitte mal schaun, ob von beiden Rechnern der gleiche Account verwendet wird (Benutzerseiten, Eigene Beiträge, etc.) - das neu registrieren unter dem selben Account sollte eigentlich nicht möglich sein. Es könnte sein, dass einer der Rechner (bzw. der entsprechende Browser) mit UTF-8 nicht zurechtkommt. -- srb 00:12, 11. Aug 2004 (CEST)
- Inzwischen habe ich mich neu mit demselben Namen registriert. Kann jemand meine alte Histories in den neuen Account überführen? Benutzer:Josef Spindelböck
- Hallo, ist dieses Problem noch aktuell? -- RainerBi ✉ 17:21, 10. Aug 2004 (CEST)
Linkprobleme
Bearbeiten
Verweis auf anderssprachige Wikipedias
BearbeitenIch bin nicht völlig sicher, ob das ein UTF8- Problem ist, stelle das aber trotzdem erst mal hier 'rein: Auf Saturn (Planet) ist der Link minnan:Thó·-chheⁿ nicht korrekt unter "Andere Sprachen" eingeordnet, probehalber löschen und wieder einsetzen gab keine Besserung. -- RainerBi ✉ 07:40, 24. Aug 2004 (CEST)
- Das liegt vermutlich nicht an UTF8, sondern daran, dass die Software mit Interwiki-Links zu wikipedias, die eine URL mit mehr als den zwei oder drei üblichen Buchstaben vor .wikipedia.org haben, nicht korrekt umgeht (die Links zu http://minnan.wikipedia.org werden soweit ich sehe überall falsch angezeigt). 1001 14:11, 24. Aug 2004 (CEST)
- Da hast du wohl recht, ich habe mal Probehalber einen Verweis auf en:Thó·-chheⁿ 'reingebastelt, und schon war das Problem verschwunden und der Verweis korrekt in "... in anderen Sprachen ..." eingebaut. Ich verschiebe das hier morgen nach "Ich brauche Hilfe", falls nicht jemand weiß, das das Problem schon bekannt und in arbeit ist - z.B. auf Mediazilla. -- RainerBi ✉ 14:42, 24. Aug 2004 (CEST)
- Ist schon bekannt bei bugzilla.wikipedia. Ich archiviere das hier. -- RainerBi ✉ 16:52, 24. Aug 2004 (CEST)
Großangelegter Bilder-Bug in der Wikipedia dank UTF-8?
BearbeitenHi, seitdem die großangelegte Serverumstellung auf UTF-8 vollzogen ist, warte ich wie viele andere auf eine dringende Verbesserung der Servergeschwindigkeit! Doch das Gegenteil ist der Fall. Von den großen Problemen der ersten Woche verschont, bemerkte ich jedoch auch gestern den Bug der "leeren Seite"! Dafür beklage ich heute das Phänomen des nicht enden-wollend-ladenden Bildes headbg.jpg s. Screenshot (also unserer Murmel oder dem Hintergrund?), welches bei der Darstellung jeder Seite umsonst reklamiert wird und dementsprechend lange benötigt. Zudem ist das Bild angeblich auch nicht einmal vorhanden! Kann es sein, dass UTF-8 plötzlich nur noch J-Packs mit jpeg statt jpg-Endung erkennt??? Vgl. Artikel Fahrrad, wo das Problem nie auftrat. Unter diesen Umständen ist jedes vernünftige Arbeiten eine Qual. Ein frustierter --Herrick 14:55, 4. Aug 2004 (CEST)
- Hallo Herrick, dein Problem kann ich nicht reproduzieren, das Laden von Bild:Headbug.jpg geht bei mir wie das sprichwörtliche Semmelbacken, und ich kann auch keinen Anhaltspunkt für einen Zusammenhang mit der UTF-8 - Umstellung erkennen. Hilfst du mir auf die Sprünge? -- RainerBi 16:43, 4. Aug 2004 (CEST)
- Da das Problem auch auf Wikipedia:Ich brauche Hilfe erörtert wird und die Diskussion auch dort keinen rechten UTF8- Zusammenhang zeigt, habe ich die Neigung, diesen "Bilder-Bug" hier in's Archiv zu verschieben. Gegenstimmen? -- RainerBi ✉ 06:58, 5. Aug 2004 (CEST)
Umlaute in Upload-Dateinamen
BearbeitenBilder mit Umlauten
BearbeitenIch hatte gerade ein Bild mit einem Ä im Namen hochgeladen. Ich konnte es in keine Seite einbauen, das Ä hat den Namen zerschossen. Vor der UTF-8-Umstellung hatte ich nie Probleme mit Umlauten in Bildnamen. Stern !? 20:57, 5. Aug 2004 (CEST)
- Welcher Browser? --Head 15:52, 7. Aug 2004 (CEST)
Ich wollte grade ein Bild mit ö drin hochladen, das wurde kommentarlos verweigert. --Wiki Wichtel 17:16, 10. Aug 2004 (CEST)
Im Artikel Königsforst sollte das Bild Königsforst_Waldlehrpfad_Rath.png erscheinen. Ich habe das Bild hochgeladen und kann es bei den letzten Änderungen auch aufrufen. Browser Konqueror. Warum nicht im Artikel? --Jan Wellem 21:20, 10. Aug 2004 (CEST)
- Ich habs grade mit w2k/moz1.7 nochmal hochgeladen, da gehts - anscheinend machen da einige Browser noch Probleme. Vielleicht sollten alle, die Probleme haben, mal ihre Browser angeben. -- srb 22:49, 10. Aug 2004 (CEST)
- und die Version angeben. Konqueror 3.2.2 -> Bild is da. Oder Cache? TheK(?!) 22:52, 10. Aug 2004 (CEST)
Ebenfalls hier her gehört wohl ein Problem, das derzeit bei Wikipedia:Ich_brauche_Hilfe#Umlaute_in_Upload-Dateinamen erörtert wird (evtl. sollten wir die Diskussion hier her verschieben?) -- RainerBi ✉ 08:56, 16. Aug 2004 (CEST)
Dies ist vermutlich ein Mac OS X spezifisches Problem. Mac-Benutzer bitte auf Diskussionseite schauen.
UTF-8, Unicode, NFC, NFD
BearbeitenHierher verschoben von Wikipedia:Ich_brauche_Hilfe#Umlaute_in_Upload-Dateinamen
Habe vorhin mal ein Bild mit einem Umlaut im Dateinamen hochgeladen. Ich hatte gehofft, dass das seit UTF-8 problemlos geht, habe auf der anderen Seite aber auch befürchtet das UTF-8 nur für die Darstellung in html und nicht für die im Wikipedia-(Linux-)Dateisystem eine Rolle spielt.
Beim Hochladen bekommt man eine Meldung das der Name geändert wird und ob man die Datei trotzdem hochladen möchte. Optisch sieht der geänderte Dateiname genauso aus, wie auch lokal auf meinem Computer („ü“ = „ü“). Irgendwas ist aber anders. Über die
Bildersuche wird das Bild nicht gefunden, weder in der einen (mit „ü“) noch in der anderen (auch mit „ü“ ?!) Schreibweise. Gerade das wollte ich aber erreichen, wer sucht schon nach „Inbusschluessel“ statt „Inbusschlüssel“. Außerdem ist nun ein weiteres Problem hinzu gekommen. Wie kann ich das „Wikipedia-ü“ über meine Tastatur (Mac OS X) eingeben? Aus der Upload-Meldung heraus kopieren ist nicht gerade Benutzerfreundlich. Hat irgendjemand eine Idee? Eine Erklärung wie das zusammenhängt wäre auch nicht schlecht. Ups, ganz schön groß diese Seite, kann die mal jemand archivieren? — KMJ 22:35, 15. Aug 2004 (CEST)
- Unter welchem Namen hast du die Datei hochgeladen? (also "Impusschlüssel.jpg"?) -- da didi | Diskussion 08:01, 16. Aug 2004 (CEST)
- Ich fand Inbusschlüssel_01_KMJ.jpg . . 50126 Byte . . KMJ . . 19:10, 15. Aug 2004 (GNU-FDL, selbst fotografiert), die tatsächlich etwas vertrackt ist. Wie der screenshot zeigt, sind die Ü-Pünktchen halbwegs über das "s" hinter dem "ü" gewandert. Auf der Upload-Liste lautet der Dateiname http://de.wikipedia.org/upload/a/aa/Inbusschlu%CC%88ssel_01_KMJ.jpg Es wäre möglichwer Weise hilfreich, wenn du eine kleine Datei geleichen Namens irgendwo in's Netz stellen könntest, damit das näher untersucht werden kann. Evtl. gehört das eher auf die Seite Wikipedia:UTF-8-Probleme? -- RainerBi ✉ 08:48, 16. Aug 2004 (CEST)
- Ich schätze, die Dateinammensänderungs-Warnung, die KMJ sah, bezog sich darauf, dass die Leerzeichen im Namen durch Unterstriche ersetzt wurden - das hatte nichts mit dem 'ü' zu tun. Ich bin mir zu 99% sicher, dass das Problem auf KMJ's Rechner und nicht bei Wikipedia liegt. Ich habe mal testhalber eine Bilddatei erstellt und hochgeladen [3]. Den Dateinamen habe ich von [[:]] übernommen, aber das 'ü' gelöscht und neu eingegeben, dann sieht's ganz normal aus. Ich schätze, KMJ's Rechner benutzt ein inkompatibles 'ü'. Solche Probleme kenne ich aus dem ASCII <-> ANSI - Spannungsfeld. Für bestimmte technische Anwendungen benötige ich öfters ASCII- Dateien. Wenn ich die mit einem ANSI- Editor (Notepad) erstelle, sind die deutschen Umlaute ASCII- unverträglich codiert. -- RainerBi ✉ 09:13, 16. Aug 2004 (CEST)
- Die Warnung bezog sich höchstwahrscheinlich nicht auf die Leerzeichen, da ich alle Dateien schon mit dem Unterstrich statt Leerzeichen auf meinem Rechner habe und sie dann auch so hochlade. Die Meldung kommt also wirklich nur wenn Umlaute vorhanden sind, ansonsten sehe ich die Meldung nie (bei keinem Bild). Mein System Mac OS X Server 10.3.5 (also quasi BSD UNIX) — inkompatibles „ü“ kann ich nicht glauben, hatte noch nie Probleme damit. Hallo da didi, die Datei um die es geht heißt genau „Inbusschlüssel_01_KMJ.jpg“ und kann auch unter Benutzer:KMJ/Bilder/G angeschaut werden. Ich bin mir nicht sicher ob es wirklich mit UTF-8 zusammenhängt. Wenn ich das „ü“ über die Tastatur eingebe wird das Bild nicht gefunden, kopiere ich es aus dem Quelltext der obigen Adresse dann schon. Guckst Du hier:
1. kopiert
2. nochmal kopiert nur das „ü“ per Tastatur ausgetauscht:was RainerBi schon demonstriert hat. — KMJ 00:52, 17. Aug 2004 (CEST)
- Die Warnung bezog sich höchstwahrscheinlich nicht auf die Leerzeichen, da ich alle Dateien schon mit dem Unterstrich statt Leerzeichen auf meinem Rechner habe und sie dann auch so hochlade. Die Meldung kommt also wirklich nur wenn Umlaute vorhanden sind, ansonsten sehe ich die Meldung nie (bei keinem Bild). Mein System Mac OS X Server 10.3.5 (also quasi BSD UNIX) — inkompatibles „ü“ kann ich nicht glauben, hatte noch nie Probleme damit. Hallo da didi, die Datei um die es geht heißt genau „Inbusschlüssel_01_KMJ.jpg“ und kann auch unter Benutzer:KMJ/Bilder/G angeschaut werden. Ich bin mir nicht sicher ob es wirklich mit UTF-8 zusammenhängt. Wenn ich das „ü“ über die Tastatur eingebe wird das Bild nicht gefunden, kopiere ich es aus dem Quelltext der obigen Adresse dann schon. Guckst Du hier:
- Habe die Datei auf Wunsch von RainerBi noch mal auf einen Server geladen (mit GoLive CS). Beim Versuch sie anzuschauen gibt es die folgende Meldung The requested URL /Inbusschlüssel 01 KMJ.jpg was not found on this server. In die URL-Zeile des Browsers hatte ich den Text aus dem Wikipedia-Quellcode kopiert. Gebe ich das „ü“ per Hand ein lautete die Fehlermeldung The requested URL /Inbusschlüssel 01 KMJ.jpg was not found on this server.. Ob Unterstrich oder Leerzeichen spielt auf diesem Server natürlich keine Rolle. Was nun??? — KMJ 01:13, 17. Aug 2004 (CEST)
- Erst mal zwei Screenshots (Safari und Mozialla mit dem Mauszeiger über dem obige Wort/Link Server
Sieht doch beides gut aus. Jetzt wird es aber ganz komisch. Ich habe mal keinen Screenshot gemacht, sondern beschreibe die Darstellung mal. Gehe ich mit dem Mauszeiger auf den hier (korrekt) abgebildeten Inbusschlüssel (1. kopiert) erscheint die URL in der Statuszeile des Browsers. Das gleiche gilt für die mißglückte Darstellung unter 2. Beide Darstellungen zeigen exakt den gleichen Text, der eine Text (1.) ist aber kürzer als der andere (2.). Der auf das korrekt dargestellte Bild scheint die Statuszeile des Browsers zu irritieren. Der Text steht 1 Pixel höher als gewöhnlich. Ist da irgendwo versteckt noch ein Zeilenvorschub mit drin? Das gilt für Safari als Browser, Mozilla stellte beide Links in der Statuszeile identisch dar — merkt also quasi nicht das da irgendein Unterschied ist. *ratlos*— KMJ 02:20, 17. Aug 2004 (CEST)
- Erst mal zwei Screenshots (Safari und Mozialla mit dem Mauszeiger über dem obige Wort/Link Server
UTF-8, Unicode, NFC, NFD
Technische Details zum Uploadproblem. Es ging um das Beispiel:
"u%CC%88" in einer URL repräsentiert die Bytefolge 0x75 0xCC 0x88. Interpretiert als UTF-8 ist das in Unicode:
U+0075 LATIN SMALL LETTER U U+0308 COMBINING DIAERESIS
Dies ist die sogenannte NFD-Form (Unicode normalization form D)
"%C3%BC" in einer URL repräsentiert die Bytefolge 0xC3 0xBC. Interpretiert als UTF-8 ist das in Unicode:
U+00FC LATIN SMALL LETTER U WITH DIAERESIS
Dies ist die sogenannte NFC-Form (Unicode normalization form C)
Beide Formen sind canonically equivalent. Und jeder Unicode-konforme Anwendung sollte es egal sein, welche Form benutzt wird. Wenig überraschend, war hier an irgendeiner Stelle eine nicht-Unicode-konforme Anwendung im Spiel.
Schlußfolgerung:
- Wer Dateinamen in anderer Form als NFC erzeugt, sollte sich mit ASCII Dateinamen begnügen.
- Die mediaWiki Software sollte in einer zukünftigen Version alle Upload Dateinamen in NFC umwandeln
Weblinks: [4], [5], [6], [7], [8]
217.227.9.44 10:19, 17. Aug 2004 (CEST) == Pjacobi 10:25, 17. Aug 2004 (CEST)