874 | Thai |
932 | Japanisch |
936 | Vereinfachtes Chinesisch |
949 | Koreanisch |
950 | Traditionelles Chinesisch |
1200 | Unicode UTF-16, little endian |
1201 | Unicode UTF-16, big endian |
1250 | Mitteleuropäisch |
1251 | Kyrillisch |
1252 | Westeuropäisch |
1253 | Griechisch |
1254 | Türkisch |
1255 | Hebräisch |
1256 | Arabisch |
1257 | Baltisch |
1258 | Vietnamesisch |
12000 | Unicode UTF-32, little endian |
12001 | Unicode UTF-32, big endian |
65000 | Unicode UTF-7 |
65001 | Unicode UTF-8 |
Windows-1251 (auch Codepage 1251, kurz cp1251) ist eine 8-Bit-Zeichensatztabelle zur Darstellung von Sprachen im kyrillischen Alphabet wie Russisch oder Ukrainisch. Sie wird auch häufig für Bulgarisch verwendet.
Windows-1251 und KOI8-R (oder seine ukrainische Variante KOI8-U) sind viel weiter verbreitet als ISO 8859-5[1]. Zukünftig könnten sie durch UTF-8 (Unicode) verdrängt werden. Im März 2022 verwenden 0,6 % aller Websites Windows-1251, ISO-8859-5 wird von weniger als 0,05 % verwendet.[2]
Tabelle
BearbeitenCode | …0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0… | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1… | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2… | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4… | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5… | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6… | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7… | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
8… | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Ќ | Ћ | Џ |
9… | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | ќ | ћ | џ | |
A… | NBSP | Ў | ў | Ј | ¤ | Ґ | ¦ | § | Ё | © | Є | « | ¬ | SHY | ® | Ї |
B… | ° | ± | І | і | ґ | µ | ¶ | · | ё | № | є | » | ј | Ѕ | ѕ | ї |
C… | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
D… | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
E… | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
F… | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
SP (space) auf Position 2016 ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A016 ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD16 ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.
Einzelnachweise und Quellen
Bearbeiten- ↑ Roman Czyborra: The Cyrillic Charset Soup. 1998, abgerufen am 6. März 2022 (englisch).
- ↑ Comparison of the usage statistics of Windows-1251 vs. ISO-8859-5 for websites. In: W3Techs. 6. März 2022, abgerufen am 6. März 2022 (englisch).
Weblinks
Bearbeiten- Microsoft Windows Codepage : 1251 (Cyrillic). Microsoft, archiviert vom am 7. Oktober 1999 (englisch).
- cp1251 to Unicode table. Unicode-Konsortium, 15. April 1998 (englisch).
- Petko Yotov: Universal Cyrillic decoder. (englisch, eine Anwendung, die helfen kann, verschieden codierte kyrillische Texte lesbar zu machen).