Exercice : Encodage des fichiers de texte et HTML
Éditeur de texte

Nous utiliserons pour cet exercice l'éditeur de texte Visual Sudio Code. Ajoutez l'extension Hex Editor.
Question
Ouvrez Visual Studio Code vérifiez dans la barre d'icone basse que l'encodage est en UTF-8.
Ajoutez un nouveau fichier texte avec le texte ci-dessous :
sans accent
Question
Sauvegardez le fichier : quel est sa taille en octets ?
Question
Effacez le texte précédent et saisissez le suivant :
avec àccent
Question
Sauvegardez le fichier : quel est sa taille en octets ? Que peut-on en déduire ?
Éditeur hexadécimal
Question
Ouvrez le fichier texte. Effacez le texte précédent et saisissez la lettre v :quel est le code hexadécimal de la lettre ?
Question
Ouvrez le fichier texte. Effacez le texte précédent et saisissez la lettre è :quel est le code hexadécimal de la lettre ?
Complément : normes pour les pages web
L'UTF[1]-8 est une sorte d'extension du code ASCII : on y retrouve donc, dans sa première partie, les 128 premiers caractères de l'ASCII (voir par exemple ce lien) et donc codés sur 8 bits. Les caractères accentués sont codés sur 16 bits à l'aide d'un préfixe d'un octet (par exemple
C3 B6
code le ö,C3 A9
code le é, etc).Pour être sûr que le navigateur interprète correctement l'UTF-8, il faut, de préférence, utiliser un éditeur de textes (ou HTML) qui le permette et insérer dans l'entête de la page HTML, la commande suivante :
<head>
<meta charset="utf-8">
</head>
Exemple
Grâce à ce principe de préfixe, il est possible de coder de nombreux types de caractères.
Question
Grâce à la table des codes UTF-8
, déterminez celui du caractère Æ
Question
Créez un fichier html
contenant le texte suivant et ouvrez-le avec Firefox :
<html>
<head>
<meta charset="ASCII">
</head>
<body>
Voyez vous le caractère Æ ?
</body>
</html>
Que constatez-vous ?
Question
Modifiez le fichier précédent pour qu'il affiche correctement le caractère Æ.