Comment appréhender au mieux le Budget Crawl sur son site (2nde partie) ?

Le « Budget crawl » représente les ressources de temps-machine allouées par un moteur de recherche à l’exploration de votre site. Cette notion, dont on parle très souvent depuis quelques temps, doit être prise en compte dans certains cas. Alors, comment Google calcule-t-il ce « crawl budget » et surtout, votre site est-il concerné ? Après les définitions le mois dernier, il est temps de voir ce mois-ci les différents points à prendre en compte pour améliorer ce budget d’exploration de votre site par les robots.

Le budget d’exploration ou budget crawl (décrit dans la newsletter du mois de Novembre 2022) concerne essentiellement deux types de site :

les sites avec une grosse volumétrie de page (> 100.000 URL).
les sites avec un nombre plus restreint d’URL (minimum 10 000 URL) dont le contenu de la majeure partie des pages change quotidiennement. En complément, cela peut également concerner votre site si ce dernier comporte un nombre non négligeable d’URL qui sont considérées comme « Détectées, actuellement non indexées » dans la section « Pages » de l’outil Search Console de Google. Cela signifie qu’il a détecté un certain nombre d’URL pour lesquelles il ne disposait de pas suffisamment de ressources pour les explorer.

Nous traiterons donc ces derniers sites dans cet article.

Afin qu’il n’impacte pas la façon dont Google doit crawler votre site, plusieurs corrections et optimisations sont nécessaires afin de limiter au maximum le crawl d’URL non pertinentes. Mais avant tout, il est important d’avoir des données sur son crawl.

[box type= »info »] Pour aller plus loin :

➜ Découvrez la formation Crawl et indexation par Olivier Andrieu

[/box]

Les outils pour surveiller l’exploration de Google

La Search Console

Les statistiques sur l’exploration de la Search Console, qui se trouvent dans la section « Paramètres » de l’outil donnent des indications importantes sur la façon dont Google crawle votre site. Une baisse des demandes d’exploration peut signifier plusieurs choses, notamment le fait que le site répond trop lentement, ou qu’il rencontre des difficultés d’exploration.

Suivi des codes réponses

Le bloc « Par réponse » donne notamment des indications sur les codes réponses renvoyés par le serveur.

Codes réponses reçus par Google lors de son crawl

La suite est réservée à nos abonnés. Déjà abonné ? Se connecter

Envie de lire la suite ?

-10% sur nos Abonnements de 6 mois et + avec le code :

JEVEUXPASPAYERPLEINPOT

Apprenez auprès des meilleurs experts, grâce à leurs partages de connaissances et leurs retours d’expérience.

Voir les commentaires (2) Voir les commentaires (2)

5

Reacteur

12 décembre 2022 à 9 h 19 min

Répondre
Merci pour cet excellent article!
Petite question, concernant les URL non pertinentes, peuvent elles être des URL à très faible potentiel par exemple? l’idée est de réduire de manière importante le nombre de pages à crawler tout en laissant ces url accessibles via le moteur interne.
Merci
Charles

Charles

19 janvier 2023 à 14 h 19 min

Répondre

Comment appréhender au mieux le Budget Crawl sur son site (2nde partie) ?

Les outils pour surveiller l’exploration de Google

La Search Console

Cliquez ici pour annuler la réponse.

Google Business Profile : l’arme ultime de votre SEO local ? (2nde partie)

Search Console et Data (Looker) Studio

Les articles du moment

La génèse d’une météo pour Google Discover – Partie 2

Optimiser la vitesse d’un site WordPress pour les grandes audiences – Partie 2

SEO Agentique : les audits SEO – Partie 2

La génèse d’une météo pour Google Discover – Partie 1

Optimiser la vitesse d’un site WordPress pour les grandes audiences – Partie 1

Logs serveur : repérer les opportunités et les anomalies que les outils standards ne détectent pas

Les étapes essentielles pour une refonte d’arborescence réussie [Le Point]