Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Caractère (informatique) — Wikipédia
Caractère (informatique) — Wikipédia 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.
Page d’aide sur l’homonymie

Pour les articles homonymes, voir Caractère et Char (homonymie).

Chaîne de caractères.

En informatique, un caractère est à la fois un type de donnée et un élément d'un ensemble mathématique A {\displaystyle A} {\displaystyle A}, appelé alphabet ou ensemble de caractères. Comme en typographie, un caractère informatique peut représenter une lettre minuscule, une lettre majuscule, un chiffre, un signe de ponctuation ; mais aussi un espace, une tabulation, un retour à la ligne et quelques autres opérations spéciales (sonnerie, effacement, etc.) qui ne représentent pas des symboles (caractères de contrôle).

En informatique, la notion de caractère est une notion qui dans le principe associe à un glyphe un nombre, de manière à dissocier la représentation physique du caractère de sa signification.

Historique

[modifier | modifier le code]
Article détaillé : Codage des caractères.

Si le caractère existe depuis environ deux millénaires, sa représentation abstraite sous forme numérique est plus récente. Elle a notamment été développée pour le télégraphe. Cette abstraction permettant d'améliorer l'efficience des communications. L'émergence d'un codage unifié s'est cependant heurtée à des différences d'approche conventionnelles et culturelles du concept de caractère.

Considérations techniques

[modifier | modifier le code]

Comme les ordinateurs fonctionnent en binaire, un numéro est attribué à chaque caractère. Ce nombre peut être codé avec des chiffres binaires (bits).

À la fin du XXe siècle, 8 bits (c'est-à-dire un octet) étaient assez habituelles et permettait de représenter 256 nombres, donc 256 caractères différents. Cette première limite à 256 nombres a conduit à des normes de codage de caractères.

Normalisation et standardisation

[modifier | modifier le code]

Il existe plusieurs normes de codage de caractères dont, parmi les plus connues, ASCII, ISO/CEI 8859 et Unicode. Les normes diffèrent dans le jeu de caractères couverts, dans le code attribué à chaque caractère et dans la représentation binaire du code. Ainsi, le caractère € qui n'existe pas en ASCII a le nombre 164 en ISO 8859 et le nombre 8364 en Unicode. 7 bits suffisent pour coder tous les caractères de la norme ASCII, mais il en faut 8 (1 octet) pour ISO 8859, et plus de 16 (2 octets) pour Unicode. Il existe plusieurs représentations binaires différentes d'Unicode, dont UTF-8 et UTF-16 ; ainsi il faut 3 octets pour coder le 8364 de € en UTF-8, contre 2 octets en UTF-16.

Les différents nombres attribués ne permettent pas seulement d'identifier les caractères de certains alphabets, mais également les variantes liées aux accents, les chiffres, certains symboles, ainsi que des caractères non imprimables, comme les espaces, les tabulations et les retours à la ligne.

Une suite de caractères informatiques représente un texte brut, avec les espaces et les retours à la ligne, mais sans formatage plus élaboré tel que choix de polices de caractères, tailles ou couleurs de texte, etc. Les caractères spéciaux (comme l'astérisque et l'esperluette) étaient surtout utilisés comme codes de contrôle par le matériel informatique (terminaux et imprimantes[1]) d'avant les années 1990 qui ne fonctionnait qu'en mode texte. Les caractères d'échappement permettaient de combiner plusieurs codages et étaient le principe de base de l'ISO/CEI 2022.

Terminologie

[modifier | modifier le code]

La standard Unicode différencie les caractères abstraits et les caractères codés qui sont associés à des codes numériques pour faciliter leur représentation informatique.

Police de caractères

[modifier | modifier le code]
Article détaillé : police de caractères.

L'affichage d'un caractère sur un moniteur d'ordinateur ou son impression avec une imprimante nécessite les données spécifiant le dessin exact du caractère, le glyphe. Le fichier numérique de caractères contenant la liste des codes renvoyant à des glyphes est une police de caractères.

Type de données

[modifier | modifier le code]
Article détaillé : chaîne de caractères.

Très souvent les ordinateurs traitent des mots, des phrases, des paragraphes entiers. Il existe un type de données pour représenter une suite de caractères, c'est la chaîne de caractères.

En fait on confond souvent l'unité de code (unité de 8, 16 ou 32 bits) codant une partie du caractère proprement dit et le caractère proprement dit. Cette confusion vient de l'influence de la norme ASCII et des anglophones qui confondaient le caractère et l'octet.

Propriétés

[modifier | modifier le code]

Dans le cas d'Unicode, chaque caractère est doté de propriétés définies par la norme Unicode. Ces propriétés sont consultables avec des bibliothèques logicielles, ce qui permet au logiciel de traiter chaque classe de caractères de manières appropriée, par exemple lors de l'affichage ou du tri des données, qui peuvent devoir prendre en compte le sens d'écriture ou la dépendance de l'ordre lexicographique à la casse.

Notes et références

[modifier | modifier le code]
  1. ↑ http://www.megatron.fr/imprimantes/pdf/manuels/dotmatrix/shuttle/doc_MRxi-x200_f10.pdf p. 23

Voir aussi

[modifier | modifier le code]
  • Type de données
  • Chaîne de caractères
  • Codage des caractères
  • Police de caractères
v · m
Types de données
Non interprétée
  • Bit
  • Byte
  • Trit
  • Tryte
  • Mot
Numérique
  • Bignum
  • Complexe (en)
  • Décimal (en)
  • Virgule fixe
  • Virgule flottante
  • Entier
    • Non signé (en)
  • Intervalle
  • Rationnel (en)
Texte brut
  • Caractère
  • Chaîne de caractères
Pointeur
  • Adressage mémoire
    • Physique
    • Virtuelle
  • Référence
Composite (en)
  • Type algébrique de données
    • Généralisé
  • Tableau
  • Tableau associatif
  • Classe
  • Dépendant
  • Égalité (en)
  • Inductive (en)
  • Liste
  • Objet
    • Métaobjet
  • Option (en)
  • Produit
    • Enregistrement
  • Ensemble (set)
  • Vecteur
  • Union (en)
    • Disjointe
Autres
  • Booléen
  • Type vide
  • Collection
  • Conteneur
  • Type énuméré
  • Exception
  • Fonction
  • Opaque (en)
  • Type récursif
  • Sémaphore
  • Flux
  • Top (en)
  • Type class (en)
  • Type unité
  • Void
Articles liés
  • Type abstrait
  • Structure de données
  • Généricité
  • Kind (en)
    • Métaclasse
  • Parametric polymorphism (en)
  • Primitive data type (en)
  • Interface
  • Subtyping (en)
  • Type constructor (en)
  • Conversion de type
  • Type system (en)
v · m
Éléments de programmation informatique
Bibliothèque logicielle
  • Bibliothèque standard
  • Espace de noms
  • Framework
  • Gabarit
  • Interface
  • Interface de programmation (API)
Vocabulaire
  • Algorithme
  • Expression
  • Indentation
  • Instruction
  • Ligne de code
  • Opérateur
  • Pseudo-code
  • Ramasse-miettes
Fonctions
  • Dispatch multiple
  • Factorisation
  • Fonction imbriquée
  • Fonction de rappel
  • Fonction d'ordre supérieur
  • Fonction récursive
  • Généricité
  • Opérande
  • Paramètre
  • Polymorphisme
  • Procédure
  • Signature de type
  • Surcharge
Objet
  • Classe
  • Constructeur
  • Destructeur
  • Encapsulation
  • Héritage
  • Héritage multiple
  • Instance
  • Méthode
Événementiel Inversion de contrôle
Code source
Structures de données
  • Arbre
  • Enregistrement
  • Ensemble
  • File
  • Liste
  • Liste chaînée
  • Pile
  • Sémaphore
  • Tableau
  • Tas
  • Type abstrait
  • Vecteur
Déclarations
  • Affectation
  • Convention de nommage
  • Pointeur
  • Portée
  • Référence
  • Tableau associatif
  • Type énuméré
  • Type récursif
  • Typage statique
  • Variable
  • Variable globale
  • Variable locale
Structures de contrôle
  • Case
  • Eval
  • For
  • Goto
  • Switch
  • While
Fonctions usuelles
  • Concaténation
  • Incrémentation
  • malloc
  • printf
Outil de développement
  • Environnement de développement
  • Générateur de documentation
  • Gestion de versions
  • Modèle
  • Patch
  • Spécification
Folklore
  • Hello world
  • Principe KISS
  • Langage de programmation exotique
Catégories :
  • Programmation informatique
  • Développement logiciel
  • icône décorative Portail de l’informatique
  • icône décorative Portail de la programmation informatique
Ce document provient de « https://fr.teknopedia.teknokrat.ac.id/w/index.php?title=Caractère_(informatique)&oldid=225364871 ».
Catégorie :
  • Structure de données
Catégories cachées :
  • Article contenant un appel à traduction en anglais
  • Portail:Informatique/Articles liés
  • Portail:Technologies/Articles liés
  • Portail:Programmation informatique/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id