Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Windows-1252 — Wikipédia
Windows-1252 — Wikipédia 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.

Windows-1252
Image illustrative de l’article Windows-1252

Famille Microsoft Windows
Langues Allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois, parmi d'autres langues européennes
Nombre de caractères ~223
État du projet Standardisé par Microsoft
Plates-formes Windows
Organisme /
Parrainage
Microsoft
Numéro d'enregistrement 1252
Séquences d'échappement Non prises en charge
Unité de codage (codet) 8 bits
modifier 

Windows-1252 ou CP1252 (abréviation de « code page – 1252 » , signifiant Page de code – 1252) est un jeu de caractères, utilisé historiquement par défaut sur le système d'exploitation Microsoft Windows en anglais et dans les principales langues d’Europe de l’Ouest, dont le français.

Contexte

[modifier | modifier le code]

Au début des années 1990, l'utilisation du codage Windows-1252 se développe en Occident, avec la diffusion de Windows 3.x. Les caractères codés sont appelés par confusion « ANSI » au lieu d'« occidentaux » (en anglais : Western )[1]. L'erreur est corrigée mais l'usage est perpétué par ses successeurs (notamment Windows 95, 98, NT, 2000, XP, Vista, 2003, 7). À cette époque, le jeu de caractères Windows-1252 se substitue aux jeux de caractères DOS, c'est-à-dire à la page de code 437 dans les pays anglophones, et à la page de code 850 dans la plupart des pays d'Europe de l'Ouest. L'ensemble des logiciels développés pour Windows fonctionne alors avec cet ensemble de caractères.

Toutefois, sous l'influence des problèmes d'interopérabilité, des régions francophones multilingues (Union européenne, Maghreb) ainsi que de la mondialisation des échanges et du développement d'Internet en particulier, et bien que le codage Windows-1252 reste encore utilisé, ce codage subit la concurrence et le développement du standard Unicode.

De nos jours, les applications modernes n'utilisent plus ce type de codage, sauf lorsqu'il est nécessaire pour :

  • communiquer avec des applications anciennes ;
  • communiquer avec des serveurs anciens, qui peuvent éventuellement ne pas supporter encore Unicode ;
  • communiquer avec la console Windows[2].

Aspects techniques

[modifier | modifier le code]

Windows-1252 est une extension de l'ISO/CEI 8859-1 : il diffère du codage ISO-8859-1 par l'utilisation de caractères imprimables, plutôt que des caractères de contrôle, dans les codes 128 à 159. Pour les utilisateurs de Windows, Microsoft appelle ceci de manière générique ANSI, mais, en fonction de l'endroit où le système d'exploitation a été vendu, l'ensemble de caractères peut avoir un autre nom, comme CP1252 aux États-Unis ou, dans les pays de l'Europe de l'Ouest, le nom validé par l'IANA, Windows-1252.

Table des caractères

[modifier | modifier le code]

Le tableau suivant montre Windows-1252. Les numéros 81, 8D, 8F, 90, et 9D ne sont pas utilisés et sont signalés par la couleur vert pâle. Les changements par rapport à ISO-8859-1 sont signalés par la couleur jaune.

Windows-1252 (CP1252)
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ DEL
8x € ‚ ƒ „ … † ‡ ˆ ‰ Š ‹ Œ Ž
9x ‘ ’ “ ” • – — ˜ ™ š › œ ž Ÿ
Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
Bx ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Interopérabilité

[modifier | modifier le code]

Windows-1252 est reconnu et utilisé par les plates-formes Windows et n'est pas reconnu dans d'autres systèmes d'exploitation : DOS n'utilise que les pages de codes d'IBM, et Linux/Unix utilisent nativement les pages de codes ISO (exemple ISO-8859-15) ou UTF-8.

Pour ces raisons notamment, Unicode (et plus généralement ISO/CEI 10646) tend à lui être préféré.

Interopérabilité en HTML

[modifier | modifier le code]

Selon les standards HTML du W3C, UTF-8 est un codage adapté à la plupart des documents HTML[3]. Cependant, l'usage de Windows-1252 a été si répandu que plusieurs navigateurs supportent les références numériques de caractères pour les codes 128 à 159, alors qu'ils ne correspondent à des caractères que pour Windows-1252, mais correspondent à des contrôles C1 en Unicode si on les code en UTF-8 et non pas en référence numérique.

Ainsi, le symbole « € » est le caractère Unicode numéro 8364 — 20AC(16) —, donc &#8364; — &#x20AC; — est la référence numérique standard du symbole « € » ; mais, comme « € » est le caractère Windows-1252 numéro 128 — 80(16) —, certains navigateurs supportent aussi &#128; — &#x80; — comme référence numérique de ce caractère, bien que ce soit illégal en HTML où cela devrait indiquer un contrôle C1 (par ailleurs, la plupart des contrôles C1 sont illégaux également en HTML, en dehors des contrôles de séparation de ligne pour lesquels il est légal en HTML de les représenter sous forme de référence numérique, aussi bien en décimal qu'en hexadécimal, ce qui explique alors l'illégalité des références numériques des numéros 128 à 159 pour indiquer un caractère du code Windows-1252 ; cependant divers navigateurs font exception à cette règle pour les codes qui ne sont pas associés aux quelques contrôles C1 autorisés, et alors les afficher selon le code Windows-1252 et non selon le point de code Unicode standard)[4].

Voir aussi

[modifier | modifier le code]

Articles connexes

[modifier | modifier le code]
  • ISO/CEI 8859
  • ISO/CEI 8859-1
  • ISO/CEI 8859-15
  • Page de code
  • Page de code 850

Liens externes

[modifier | modifier le code]
  • ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WindowsBestFit/bestfit1252.txt

Notes et références

[modifier | modifier le code]
  1. ↑ Glossaire des termes utilisés, Centre de développement sur la globalisation, Microsoft Developer Network (MSDN), page A
  2. ↑ https://docs.microsoft.com/en-us/windows/desktop/intl/code-pages
  3. ↑ « Les codages de caractères », sur www.w3.org (consulté le 10 novembre 2015)
  4. ↑ « Codage valide des caractères Windows illégaux en HTML et XHTML | Openweb.eu.org », sur openweb.eu.org (consulté le 25 octobre 2024)
v · m
Jeux de caractères codés
Multi-octets
Unicode
  • ISO/CEI 10646
  • Table des caractères Unicode
  • UTF-8
  • UTF-16
  • UTF-32
  • UTF-EBCDIC
  • CESU-8
  • BOCU-1
Asiatiques
  • ISO/CEI 2022
  • ISCII (Inde)
  • SLS 1326 (Sri Lanka)
  • Codage des caractères chinois
  • Shift-JIS (Japon)
  • Big5 (Taiwan et Hong Kong)
  • HKCS (Hong Kong)
  • GBK (Rép. Pop. de Chine)
  • GB 18030 (Rép. Pop. de Chine)
Ancienne encodeuse de texte sur ruban perforé
8 bits
ISO/CEI 8859
  • -1 (Latin-1)
  • -2 (Latin-2)
  • -3 (Latin-3)
  • -4 (Latin-4)
  • -5 (Cyrillique)
  • -6 (Arabe)
  • -7 (Grec)
  • -8 (Hébreu)
  • -9 (Latin-5)
  • -10 (Latin-6)
  • -11 (Thaï)
  • -12 (Devanagari)
  • -13 (Latin-7)
  • -14 (Latin-8)
  • -15 (Latin-9)
  • -16 (Latin-10)
Pages de code Windows
  • 874 / TIS-620
  • 932 / Shift JIS
  • 936 / GBK
  • 949 / EUC-KR
  • 950 / Big5
  • 1250
  • 1251
  • 1252
  • 1253
  • 1254
  • 1255
  • 1256
  • 1257
  • 1258
  • 54936 / GB18030
Pages de code Mac OS MacRoman
Pages de code DOS
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • Kamenický
  • Mazovia
  • MIK
  • Iran System
Pages de code diverses
  • ANSEL
  • DEC-MCS
  • KOI8-R (russe)
  • KOI8-U (ukrainien)
  • StandardEncoding (PostScript)
  • Page de code vidéotex
  • Page de code ZX Spectrum
  • Page de code Amstrad CPC
  • Page de code Atari ST
  • Page de code Amiga
Non basés sur ISO/IEC 646
  • VISCII
  • EBCDIC
  • EBCDIC 297
  • EBCDIC 8859
7 bits
  • ISO/CEI 646 (base commune invariante et liste des spécialisations)
  • US ASCII
Moins de 7 bits
  • Code Chappe
  • Alphabet sémaphore
  • Code international des signaux maritimes
  • Code Morse international
  • Code wabun
  • Code Baudot
  • RADIX-50
  • Sixbit
  • Codage des caractères
  • Clavier d’ordinateur
  • Police numérique
  • Glyphe
  • Mojibake
  • Portail:Écriture
  • icône décorative Portail de l’écriture
  • icône décorative Portail de l’informatique
  • icône décorative Portail de Microsoft
Ce document provient de « https://fr.teknopedia.teknokrat.ac.id/w/index.php?title=Windows-1252&oldid=228239131 ».
Catégorie :
  • Page de code Windows
Catégories cachées :
  • Article utilisant une Infobox
  • Portail:Écriture/Articles liés
  • Portail:Langues/Articles liés
  • Portail:Informatique/Articles liés
  • Portail:Technologies/Articles liés
  • Portail:Microsoft/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id