Sur Google, Yahoo! et MSN, la syntaxe site: permet de rechercher des informations sur un site particulier. Mais elle permet également des requêtes bien plus approfondies et / ou plus précises. D'autre part, est-elles prise en compte par Exalead, AskJeeves, Gigablast et Voilà ? Réponse...

Peut-être connaissez-vous déjà la syntaxe "site:" qui vous permet de restreindre vos recherches à un site donné sur les moteurs de recherche majeurs comme Google, Yahoo! et MSN. Mais en connaissez-vous toutes les subtilités ? C'est ce que nous allons essayer d'explorer dans cet article...

Back to basics...

Dans un premier temps, revenons sur l'utilisation "classique" de cet opérateur : il permet de restreindre une recherche à un site web. Par exemple :

google site:www.abondance.com

donnera comme résultat : "toutes les pages du site www.abondance.com qui contiennent le mot google". Cette syntaxe marche parfaitement sur Google, Yahoo! Search et MSN Search mais aussi sur Exalead, AskJeeves, Voila ou Gigablast. Bref, un vrai standard... Mais comment est-il possible de l'utiliser autrement ?

Combien de pages d'un site web sont indexées par les moteurs ?

Une autre utilisation possible est de taper uniquement la requête "site:www.abondance.com" qui vous donnera comme résultat "toutes les pages du site web indexées par le moteur de recherche" en question.

Là encore, cette syntaxe fonctionnera sur tous les moteurs... sauf Voila et AskJeeves, outils sur lesquels la syntaxe "site:" doit obligatoirement être accompagnée d'un mot clé. Dans ce cas, en tout cas, Voila semble donner parfois des résultats exacts, mais pas tout le temps, bref, il ne semble pas que cette syntaxe soit parfaitement gérée par le moteur de France Telecom... AskJeeves, lui, la refuse.

Recherche sur les sous-domaines d'un site

Il peut également être intéressant d'effectuer des recherches sur les sous-domaines d'un site ("quelquechose.votresite.com"). Par exemple, la requête "google site:abondance.com" aura pour vocation de rechercher "tous les documents appartenant à un sous-domaine du site abondance.com - par exemple www.abondance.com, actu.abondance.com ou outils.abondance.com - contenant le mot google".

Cette syntaxe fonctionne parfaitement sur Google, Yahoo!, MSN, Gigablast, AskJeeves, Exalead et Voila (avec quelques dysfonctionnements parfois observés sur Voila).

Recherche de toutes les pages de tous les sous-domaines

De la même façon que nous avons lancé la requête "site:www.abondance.com", la saisie de "site:abondance.com" devrait nous donner la liste de toutes les pages indexées par le moteur pour tous les sous-domaines du site en question. Et, en effet, tous les moteurs, hormis AskJeeves et Voila (avec un bémol sur ce dernier, voir la remarque ci-dessus) la prennent en compte.

Recherche sur les "TLD"

Mais la requête "site:" peut également vous aider à effectuer des recherches filtrées sur les "tld" (pour Top Level Domain), c'est-à-dire les domaines comme ".com", ".edu", ".fr" ou ".gov".

Par exemple, la requête "chirac site:gov" aura pour vocation de rechercher "toutes les pages des sites du Gouvernement américain - dont les sites se terminent en ".gov" - contenant le mot chirac".


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).