Résumé de l'article :

Nous avons déjà consacré un article, en juillet dernier, au codage des lettres accentuées en vue d'un référencement. Voici quelques indications complémentaires à ce sujet pour faire suite à la première partie de ce dossier et aux questions qu'elle a générées de la part de nos lecteurs...

Début de l'article :

Pour faire suite à notre article intitulé "Référencement et lettres accentuées" (lettre R&R de juillet-août 2007), nous avons reçu plusieurs questions de lecteurs nous demandant plus de précisions à ce sujet. Nous allons donc essayer ci-dessous de faire un point plus précis concernant ce domaine si complexe du codage des lettres accentuées pour le référencement.

Tout d'abord, il est important de savoir que les deux codages les plus fréquemment rencontrés sur le Web francophone sont l'ISO-8859-1 - ou l'ISO-8859-15 qui rajoute notamment le signe € à la norme précédente - (pour les pages affichant un jeu de caractère occidental), et UTF-8 (pour des jeux de caractères plus internationaux comme le russe, le chinois, le grec, etc.). Les indications de codage des lettres accentuées et caractères diacritiques peuvent alors venir de 3 sources différentes...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).