Les jeux de caractères

Etude très fouillée

 

Un jeu de caractères, également appelé alphabet, est l'ensemble fermé et ordonné des caractères utilisés par un langage. Fermé signifie que l'on ne peut ajouter d'autres éléments à l'ensemble. L'ensemble est ordonné car les caractères peuvent être énumérés dans un ordre constant. Chaque caractère entretient avec les autres caractères une relation d'ordre, appelée ordre lexicographique, qui détermine s'il vient avant ou après un autre caractère dans l'alphabet.

Les microordinateurs utilisent régulièrement plusieurs jeux de caractères selon le type d'application. Tous les jeux de caractères sont basés sur le code ASCII ou American Standard Code for Information Interchange, créé en 1963.

Un code établit une correspondance entre les symboles d'un alphabet et des nombres entiers et définit de cette manière l'ordre de cet alphabet. Le code ASCII est un code à 7 moments ou 7 bits. Cela signifie qu'il utilise les entiers pouvant être représentés avec 7 bits, soit 27 = 128. Le code ASCII permet donc de coder 128 caractères. Ces 128 caractères se répartissent comme suit :

La raison pour laquelle seuls 7 des 8 bits d'un octet étaient utilisés, est que le 8ème bit servait de bit de contrôle lors des transmissions de données. Ce n'est que plus tard que se généralisa l'usage de codes à 8 moments.

 

- 32 caractères de contrôle
- 26 lettres majuscules
- 26 lettres minuscules
- 10 chiffres
- 34 signes de ponctuation, symboles mathématiques et monétaires.

Il n'y a donc pas de place dans ce jeu de caractères pour coder les symboles diacritiques (caractères accentués, cédilles, points, ronds, ...).

PositionCaractèrePositionCaractèrePositionCaractère
32 64@ 96 `
33! 65A 97 a
34" 66B 98 b
35# 67C 99 c
36$ 68D 100 d
37% 69E 101 e
38& 70F 102 f
39' 71G 103 g
40( 72H 104 h
41) 73I 105 i
42* 74J 106 j
43+ 75K 107 k
44, 76L 108 l
45- 77M 109 m
46. 78N 110 n
47/ 79O 111 o
480 80P 112 p
491 81Q 113 q
502 82R 114 r
513 83S 115 s
524 84T 116 t
535 85U 117 u
546 86V 118 v
557 87W 119 w
568 88X 120 x
579 89Y 121 y
58: 90Z 122 z
59; 91[ 123 {
60< 92\ 124 |
61= 93] 125 }
62> 94^ 126 ~
63? 95_ 127 

Normalisé aux USA sous la norme ANSI X3.4, (American National Standards Institute) le code ASCII fut adopté par l'ISO (ang. International Standards Organization) en 1972 sous la norme ISO-646 . Bien que ne supportant pas encore les caractères accentués, cette norme présentait déjà des variantes nationales. Par exemple :

DecimalHexASCIIDEDK/NOGBSEYU
3523###£##
1237B{ äæ{äs
1247C| öø|öđ
1257D} üå}åć
1267E~ ß~~~č

 

Dès que l'utilisation d'un code à 8 moments (8 bits = 28 = 256 caractères), la norme ISO-646 fut remplacée par l'ISO-8859.