Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Normalisation Unicode — Wikipédia
Normalisation Unicode — Wikipédia 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.

La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.

La décomposition canonique peut être utilisée dans l’échange normalisé de textes. Elle permet d’effectuer une comparaison binaire tout en conservant une équivalence canonique avec le texte non normalisé d’origine.

NFD

[modifier | modifier le code]

Les caractères sont décomposés par équivalence canonique et réordonnés.

Exemples NFD
chaîne caractères   caractères
normalisés
chaîne
normalisée
À AU+0041 + ◌̀U+0300 = AU+0041 + ◌̀U+0300 À
ẹ́ eU+0065 + ◌́U+0301 + ◌̣U+0323 → eU+0065 + ◌̣U+0323 + ◌́U+0301 ẹ́
ñ ñU+00F1 → nU+006E + ◌̃U+0303 ñ
Ω (ohm) ΩU+2126 → ΩU+03A9 Ω (oméga)
fi (ligature) fiU+FB01 = fiU+FB01 fi (ligature)
² (exposant) ²U+00B2 = ²U+00B2 ² (exposant)
한 한U+D55C → ᄒU+1112 + ᅡU+1161 + ᆫU+11AB 한
が かU+304B + ◌゙U+3099 = かU+304B + ◌゙U+3099 が
ئ ئU+0626 → يU+064A + ◌ٔU+0654 ئ
בּ בּU+FB31 → בU+05D1 + ◌ּU+05BC בּ

NFC

[modifier | modifier le code]

Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.

Exemples NFC
chaîne caractères   caractères
normalisés
chaîne
normalisée
À AU+0041 + ◌̀U+0300 → ÀU+00C0 À
ẹ́ eU+0065 + ◌́U+0301 + ◌̣U+0323 → ẹU+1EB9 + ◌́U+0301 ẹ́
ñ ñU+00F1 = ñU+00F1 ñ
Ω (ohm) ΩU+2126 → ΩU+03A9 Ω (oméga)
fi (ligature) fiU+FB01 = fiU+FB01 fi (ligature)
² (exposant) ²U+00B2 = ²U+00B2 ² (exposant)
한 한U+D55C = 한U+D55C 한
が かU+304B + ◌゙U+3099 → がU+304C が
ئ ئU+0626 = ئU+0626 ئ
בּ בּU+FB31 → בU+05D1 + ◌ּU+05BC בּ

NFKD

[modifier | modifier le code]

Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.

Exemples NFKD
chaîne caractères   caractères
normalisés
chaîne
normalisée
À AU+0041 + ◌̀U+0300 = AU+0041 + ◌̀U+0300 À
ẹ́ eU+0065 + ◌́U+0301 + ◌̣U+0323 → eU+0065 + ◌̣U+0323 + ◌́U+0301 ẹ́
ñ ñU+00F1 → nU+006E + ◌̃U+0303 ñ
Ω (ohm) ΩU+2126 → ΩU+03A9 Ω (oméga)
fi (ligature) fiU+FB01 → fU+0066 + iU+0069 fi
² (exposant) ²U+00B2 → 2U+0032 2
한 한U+D55C → ᄒU+1112 + ᅡU+1161 + ᆫU+11AB 한
が かU+304B + ◌゙U+3099 = かU+304B + ◌゙U+3099 が
ئ ئU+0626 → يU+064A + ◌ٔU+0654 ئ
בּ בּU+FB31 → בU+05D1 + ◌ּU+05BC בּ

NFKC

[modifier | modifier le code]

Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.

Exemples NFKC
chaîne caractères   caractères
normalisés
chaîne
normalisée
À AU+0041 + ◌̀U+0300 → ÀU+00C0 À
ẹ́ eU+0065 + ◌́U+0301 + ◌̣U+0323 → ẹU+1EB9 + ◌́U+0301 ẹ́
ñ ñU+00F1 = ñU+00F1 ñ
Ω (ohm) ΩU+2126 → ΩU+03A9 Ω (oméga)
fi (ligature) fiU+FB01 → fU+0066 + iU+0069 fi
² (exposant) ²U+00B2 → 2U+0032 2
한 한U+D55C = 한U+D55C 한
が かU+304B + ◌゙U+3099 → がU+304C が
ئ ئU+0626 = ئU+0626 ئ
בּ בּU+FB31 → בU+05D1 + ◌ּU+05BC בּ

Annexes

[modifier | modifier le code]

Articles connexes

[modifier | modifier le code]
  • Unicode
  • Équivalence Unicode
  • L’outil uconv (ICU) permet de normaliser du texte, par exemple « uconv -x '::nfkd;' » applique la normalisation NFKD.

Liens externes

[modifier | modifier le code]
  • Formes de normalisation
v · m
Unicode
Jeux de caractères de base
  • UCS (ISO/CEI 10646)
  • Table des caractères Unicode
  • ISO/CEI 646, ASCII
  • ISO/CEI 8859-1
  • WGL4
  • Unihan
Logo d'Unicode
Codification de fichiers et protocoles
  • UTF-8
  • UTF-16
  • UTF-32
  • CESU-8
  • UTF-7
  • BOCU-1
  • SCSU
  • BOM
Adaptations de référence
  • UTF-EBCDIC (Amérique, Europe occidentale)
  • ISO/CEI 8859-11 (ou TIS-620) (Thaïlande)
  • ISCII (Inde)
  • SLS 1326 (ou TSCII) (Sri Lanka)
  • Shift-JIS (Japon)
  • GB 18030 (Chine)
  • HKSCS (Hong Kong)
Équivalences standards
  • NFC (forme précomposée, recommandée)
  • NFD (forme décomposée)
  • NFKC (forme précomposée de compatibilité)
  • NFKD (forme décomposée de compatibilité)
Propriétés et algorithmes
  • Texte bidirectionnel
  • Casse
  • Ordonnancement UCA
Transformations
  • Stringprep
  • Punycode
Standards et normes liés
  • BCP 47 (étiquettes IETF d’identification de langues)
  • ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
  • ISO 15924 (codes pour la représentation des noms d’écritures)
  • ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
  • ISO 4217 (codes pour la représentation des noms de devises monétaires)
Mises en œuvre et applications
  • ICU
  • CLDR
  • IDN
  • IRI
  • Entités de caractère XLM et HTML
  • OpenType
  • Uniscribe
  • Courriel et Unicode
  • icône décorative Portail de l’informatique
  • icône décorative Portail de l’écriture
Ce document provient de « https://fr.teknopedia.teknokrat.ac.id/w/index.php?title=Normalisation_Unicode&oldid=204245941 ».
Catégorie :
  • Unicode
Catégories cachées :
  • Portail:Informatique/Articles liés
  • Portail:Technologies/Articles liés
  • Portail:Écriture/Articles liés
  • Portail:Langues/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id