L'en-tête HTTP est l'espace qui contient des indications échangées entre le serveur et le navigateur, donc les robots des moteurs de recherche. La bonne utilisation de ces données dans une optique de référencement naturel peut vous faciliter la vie, en extrayant un certain nombre de directives du code HTML, ce qui peut s'avérer très intéressant pour faciliter une refonte, par exemple. Voici quelques cas dans lesquels ces en-têtes HTTP sont très utiles. Liste non exhaustive (et qui sera complétée dans de futurs articles)...

Début de l'article :

Depuis quelques années, Google accepte l'implémentation de plusieurs directives liées au référencement naturel dans les en-têtes HTTP. Ces directives peuvent concerner l'indexation de vos URL et le suivi (ou non) des liens qu'elles contiennent, des indications sur la similarité de certaines URL (DUST : Duplicate URL, Same Text) pour l'utilisation de la balise "canonical", ou encore permettre à Google de mieux identifier les différentes versions linguistiques et géographiques de vos URL via l'attribut hreflang.

L'utilisation des en-têtes http pour effectuer ces déclarations auprès de Google est utile pour les fichiers PDF, DOC ou encore JPG dont le type Mime ne permet l'insertion de balise HTML ou dans le corps des documents. Ces en-têtes sont également utiles dans d'autres cas. En effet, leur implémentation pouvant être faite directement côté serveur (Apache ou encore Nginx, par exemple), permet d'éviter de faire des modifications dans les templates/fonctions du CMS, la manipulation de ces balises (robots) ou (canonical et hreflang) pouvant parfois être assez délicate.

Nous détaillerons dans cet article les différentes en-têtes supportées par Google ainsi que leur implémentation côté serveur pour des raisons de rapidité d'intégration et de performances, bien que la mise en place de ces dernières soient également possible via l'applicatif (ASP, PHP, etc.). Les exemples de code concerneront le serveur Web Apache, qui reste le plus courant. Afin de manipuler ces en-têtes via le serveur Web, il vous faudra installer ou faire installer le module mod_headers ainsi que mod_rewrite d'Apache.

Rappel : fonctionnement d'un en-tête http

Quand votre navigateur appelle un fichier sur un serveur Web (html, image, css, js, etc.), il lui envoie entre autres des informations sur sa capacité à pouvoir gérer la réponse, et plusieurs informations additionnelles : encodage accepté, type de navigateur, langue du navigateur, referer, etc.
...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).