Le référencement de sites web dynamiques est l'une des principales sources d'interrogations des webmasters actuels. Après avoir longtemps été un facteur totalement bloquant pour les moteurs de recherche, la situation s'est assouplie depuis quelques mois. Quels sont les types de pages qui sont compatibles avec les moteurs et ceux qui ne le sont pas ? Comment contourner les obstacles ? Voici quelques éléments de réponse dans cette première partie d'un article consacré à ce vaste sujet...
Il existe, et cela est vrai depuis que les moteurs de recherche existent, un certain décalage de temps entre le moment où les techniques de création de sites web sont utilisées et la façon dont les moteurs de recherche les indexent.
Cela s'est vérifié pour les frames (souvenez-vous d'Excite qui ignorait totalement les sites ainsi réalisés), puis pour le Flash ou le Javascript, par exemple. Cela se vérifie encore avec les sites web dynamiques, qui ont longtemps représenté un obstacle rédhibitoire pour les moteurs. La situation semble, certes, s'améliorer aujourd'hui, mais elle n'est pas encore parfaite, loin de là.
Dans cette série d'articles, nous allons passer en revue les différents obstacles que représente ce type de site pour les moteurs, ainsi que les différentes solutions proposées par les sociétés de référencement, avant de faire un "focus" sur les techniques d'"url rewriting", qui représentent souvent la meilleure solution face à ce phénomène.
Qu'est-ce qu'un site dynamique ?
Avant d'aller plus loin dans cet article, il est nécessaire de définir ce qu'est un site dynamique, par opposition à un site statique. Le site statique gère des pages créées au préalable. Il va avoir à sa disposition, sur son disque, des pages HTML dites "statiques", qu'il va afficher "telles quelles" dès qu'un internaute les demande. Les pages sont donc créés à l'aide d'un éditeur HTML, puis stockées pour être affichées sous leur forme initiale.
Le site dynamique, pour sa part, puise ses informations dans une base de données (qui peut être d'origines diverses) et crée des pages "à la volée", en fonction d'une action ou d'un évènement. Par exemple : une saisie effectuée par un internaute. L'exemple type de site dynamique, est... le moteur de recherche !
En effet, un internaute, lorsqu'il arrive sur un moteur, saisit une requête dans un formulaire et l'outil, sur la base des mots clés demandés, va créer une page de résultats "sur mesure" en fonction des termes demandés. Bien entendu, cette page n'existe pas en tant que tel sur le disque dur du moteur, et elle est donc créée "à la volée". Un moteur de recherche est donc un site "dynamique" !
Il en sera de même avec des sites web d'E-commerce, par exemple dans le cadre d'un catalogue en ligne, mais également la consultation d'archives de presse, etc.
Ce qui bloque le plus souvent les moteurs de recherche est représenté par l'url des pages, qui contient, pour ce type de sites, deux caractères spécifiques et représentatifs des sites dynamiques : le point d'interrogation (?) et l'esperluette (&).
Format d'une url de site dynamique
En effet, l'url d'une page émanant d'un site dynamique est le plus souvent affichée sous une forme du type :
http://www.sitedynamique.com/prog.cgi?kw=motcle&langue=fr&zone=france&encodage=ISO-8859-1
Cette adresse peut s'interpréter ainsi : "sur le site www.sitedynamique.com, on a lancé le programe nommé prog.cgi en lui passant comme paramètres les variables kw (de valeur "motcle"), langue (de valeur "fr"), zone (de valeur "france") et encodage (de valeur "ISO-8859-1").
Il en est exactement de même sur Google. Si vous allez sur le site http://www.google.fr/ et que vous tapez le mot clé "abondance", l'url de la page de résultat aura comme intitulé :
http://www.google.fr/search?q=abondance&ie=ISO-8859-1&hl=fr&btnG=Recherche+Google&meta=
Sur Google, c'est le programme nommé "search" qui a été lancé, avec pour paramètres :
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).