en indiquant aux robots du moteur de recherche un "plan du site" au format XML, sous la forme d'un ou de plusieurs fichiers. Dans cette série d'articles, nous indiquons comment utiliser cette fonctionnalité pour obtenir une meilleure visibilité. Ce mois-ci : explication du concept des "Google Sitemaps".
L'ofre Google Sitemaps (https://www.google.com/webmasters/sitemaps/login) est récente puisqu'elle a été lancée par le moteur de recherche en juin dernier (http://actu.abondance.com/2005-23/google-sitemaps.php). Il s'agit d'une solution permettant de fournir aux crawlers de Google (Googlebot) un plan du site au format XML. Les robots peuvent alors identifier et aller chercher toutes les pages qui y sont décrites, selon les indications fournies dans le fichier.
Dans cette série d'articles sur ce sujet, nous allons évoquer plusieurs points :
- Explication du concept et du fonctionnement de Google Sitemaps (ce mois-ci).
- Outils automatisés disponibles pour créer un fichier Sitemaps (le mois prochain).
- Résultats de tests que nous sommes en train de mener, expliquant comme Google prend en compte les fichiers XML (le mois suivant).
Dans un premier temps, il est nécessaire de bien comprendre comment fonctionne le système, assez complet et parfois méconnu dans ses fonctionnalités avancées, proposé par Google...
Le concept de Google Sitemaps
Le concept de l'outil est extrêmement simple : vous créez un fichier XML qui contient la liste des pages de votre site, plus certaines informations sur chacune d'entre elles (fréquence de mise à jour, priorité de crawl, etc.). Vous téléchargez ce fichier sur votre serveur. Vous signalez à Google sa présence. Les robots de ce dernier viennent alors le lire et tiennent compte des données qui y sont proposées pour mieux indexer, plus en profondeur et de façon plus exhaustive, votre site. Simple non ? Encore faut-il que votre fichier soit bien créé, bien soumis et bien placé sur votre site... C'est ce que nous allons explorer tout au long de cette série d'articles...
Notez bien, cependant, que :
- L'utilisation d'un "SiteMap" n'est en rien une garantie que Google indexera TOUTES les pages qui y sont décrites. Le moteur de recherche reste maître de la façon dont il indexe les sites. Mais l'utilisation d'un tel fichier facilite, logiquement, ce processus...
- De même, Google Sitemaps n'est en rien une garantie que votre site sera mieux positionné. Cet outil n'est qu'un outil d'indexation, pas un outil de positionnement ("ranking")...
- Enfin, l'utilisation de Google Sitemaps ne remplace pas le "crawling" classique de votre site par ses robots, suivant les liens des pages web de façon traditionnelle. Les deux méthodes restent tout à fait complémentaires...
Formats du fichier à fournir à l'applicatif
Google Sitemaps reconnaît un certain nombre de formats :
- OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), format inutilisable cependant pour les sites optimisés pour les mobiles. Peu utilisé, ce format (http://www.openarchives.org/OAI/openarchivesprotocol.html) est proposé par Google uniquement pour les sites utilisant déjà ce standard. Nous n'en parlerons pas ici.
- Fichiers de syndications RSS 2.0 et Atom 0.3, ce qui peut-être très intéressant si votre site utilise déjà ce type de format. Il est tout à fait possible de signaler à Google, via l'interface Google Sitemaps, vos fichiers de syndication.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).