Connaissez-vous R ? Il s'agit d'un langage de programmation et un environnement de travail largement utilisé lorsqu'il s'agit d'analyser des données statistiques issues de sources diverses. Dans cet ensemble de deux articles, nous allons vous présenter cet outil et son utilisation pour proposer des graphiques et tableaux de bord plus ou moins simples ou sophistiqués en partant des données extraites de Google Analytics. Après avoir appris, le mois dernier, à récupérer les informations d'Analytics et à créer un graphique simple affichant le nombre de visites sur un site web, nous poursuivons notre exploration avec 3 exemples de graphiques réalisés avec R autour du taux de rebond d'un site, du trafic par région et du « not provided ».
Début de l'article :
Ce mois-ci nous poursuivons l’article portant sur l’utilisation de R pour créer des visualisations de données issues de Google Analytics. Maintenant que nous avons vu les basiques, nous allons pouvoir nous attaquer à quelques représentations plus fouillées, qui pourraient par exemple être utiles pour la création d’un dashboard (tableau de bord) hebdomadaire.
La suite de l’article sera donc présentée sous forme de tutoriels pour trois visualisations différentes. La première va permettre de réfléchir au taux de rebond d’un site. La deuxième offrira une vision géolocalisée des sessions des visiteurs, du temps passé par ces derniers sur le site et du taux de rebond associé. Enfin, la troisième se consacre à la représentation du fameux « not provided ».
Une réflexion sur le taux de rebond, grâce à une belle visualisation
Le taux de rebond est une métrique très ambiguë. La définition en est simple : il s’agit du pourcentage de visiteurs qui, après avoir vu la page par laquelle ils sont entrés sur le site, vont le quitter aussitôt (et ne verrons donc qu’une seule page).
L’interprétation du taux de rebond est en revanche plus complexe. Un taux de rebond très fort peut-être vu comme un signal d’insatisfaction des visiteurs du site (qui sont déçus et donc s’en vont rapidement) ou au contraire comme un signal de qualité (l’information recherchée a été délivrée efficacement, et donc le visiteur peut aller visiter un autre site rapidement).
Nous allons voir comment réaliser une visualisation permettant une vraie réflexion sur le taux de rebond d’un site donné.
Nous commençons par charger les packages indispensables et réactiver le token Google Analytics que nous avons pris soin de stocker le mois dernier. ...
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).