Introduction à l'analyse web avec R
Introduction à l'analyse web avec R
En fonction des préférences de l’analyste web ou selon le point de vue d’une entreprise ou d’une agence sur l’analyse web, il est possible d’utiliser le logiciel de statistiques R. Ce logiciel est particulièrement adapté lorsque l’analyste web doit évaluer statistiquement des quantités de données ou faire des prévisions.
Qu'est-ce que R ?
R est un logiciel disponible gratuitement sur Internet ou un langage de programmation orienté objet pour les calculs statistiques et les visualisations. Le langage de programmation a été créé en 1992.
Le package de base de R permet d’effectuer les principaux tests et calculs statistiques. Cependant, la grande communauté R présente et propose constamment de nouveaux paquets à télécharger. Le logiciel évolue ainsi constamment. Par exemple, un webanalyste qui souhaite effectuer des analyses avec l’outil de suivi Google Analytics via R peut télécharger le package Google Analytics. Il est ainsi possible de traiter les données de suivi directement dans R via l’API Google Analytics.
Où télécharger R ?
R peut être téléchargé gratuitement sur la plate-forme https://www.r-project.org/. Sous « Téléchargement », on trouve le terme « Cran », qui signifie « Comprehensive R Archive Network ». C’est ici que se trouvent les paquets ainsi que le logiciel lui-même.
Installer et charger le package Google Analytics dans R
a) Installation
Pour installer n’importe quel paquet qui n’est pas présent dans le paquet par défaut de R, nous cliquons sur « Paquets » dans la barre de menu supérieure et sélectionnons « Paquets installés ».

Dans la fenêtre qui s’ouvre ensuite, nous pouvons choisir un miroir CRAN. Il s’agit d’un serveur sur lequel les données sont enregistrées.
Après la sélection du serveur, une autre fenêtre apparaît, dans laquelle tous les paquets prêts à être installés sont affichés par ordre alphabétique.

Il est également possible d’installer le paquet souhaité dans la console R en tapant install.packages(« googleAnalyticsR »).
b) Téléchargement
Lorsqu’un paquet est installé, il peut être chargé à tout moment pour de nouveaux projets. Cela se fait via l’onglet « Paquets » dans la barre de menu. Il faut ensuite cliquer sur « Charger le paquet ».
Premières commandes dans R
Dans R, les commandes sont saisies après le caractère d’entrée « > » (également appelé « prompt »). Il est important de mentionner ici que l’on fait la différence entre les minuscules et les majuscules.
Si l’on saisit 5+15 après le prompt, 20 apparaît comme résultat.

En outre, des requêtes logiques telles que 3>2 peuvent être effectuées.

Les entrées sont effectuées en appuyant sur la touche de confirmation (Enter).
Créer le premier objet
Lorsque l’on travaille avec R, il est nécessaire d’écrire les résultats des fonctions dans un objet. Par exemple, si l’analyste web veut créer un vecteur nommé « OrganicTraffic » et le remplir avec les chiffres des sessions des cinq derniers jours, il peut entrer ce qui suit :
OrganicTraffic <- c(100,120,150,180,200)

Lorsque l’on appelle « OrganicTraffic », les valeurs s’affichent (voir illustration).
Un objet est donc créé en saisissant d’abord un nom d’objet et en appelant ensuite au moins une fonction. Dans ce cas, la fonction « c », qui signifie « combine », a été utilisée. Les valeurs sont ainsi combinées.
Si l’analyste web souhaite connaître la valeur moyenne des sessions au cours des cinq jours sélectionnés, il peut taper mean(OrganicTraffic).

Alternativement, l’analyste web aurait pu créer un nouvel objet :

Créer des facteurs
Dans le domaine des statistiques et de l’analyse web, il existe des données qui ne peuvent pas être classées dans un ordre naturel. Il s’agit de données à l’échelle nominale. Dans l’analyse web, il s’agit par exemple du type de visiteur (nouveau visiteur et visiteur récurrent ou les différents canaux d’accès comme Paid, Organic, Display, Direct, etc.)
Dans R, un objet ou un vecteur est converti en un facteur de la manière suivante :
Tout d’abord, un vecteur est créé avec les canaux d’entrée correspondants. 1 correspond ici à « Direct », 2 à « SEO » et 3 à « SEA ».
Canal d’entrée <- c(1,2,2,1,3,1,3,2,2,2)
Pour effectuer la conversion, il faut maintenant utiliser la fonction factor(nom du vecteur) :

Dans cet exemple, le facteur canal d’entrée comprend trois niveaux ou valeurs : 1, 2 et 3.
Data Frames
Souvent, les données ne se trouvent pas seulement dans une ligne ou une colonne, mais l’analyste voit plusieurs lignes et colonnes avec des types de données très différents. Une exportation CSV typique de Google Analytics avec au moins une dimension et une métrique est un exemple de data frame.
Comme nous ne lierons R à Google Analytics qu’ultérieurement, nous créons notre propre Data Frame.
Tout d’abord, nous créons deux vecteurs supplémentaires en plus du vecteur « OrganicTraffic » que nous avons déjà créé :

Ensuite, nous relions les données dans un data frame en utilisant la fonction data.frame(a,b). Cela permet de lier le vecteur a au vecteur b.

L’appel dataframe.channel permet d’afficher nos trois canaux d’accès en ligne.
Une manière plus simple de créer un tel data frame serait de créer un tableau vide :

La fonction edit(as.data.frame(NULL)) permet de créer un tableau vide et de l’appeler dans l’éditeur de données. Dans ce tableau, un clic de souris permet d’accéder à n’importe quelle cellule et de saisir les données manuellement.
Cliquez ici pour accéder à la deuxième partie de l’analyse web avec R :
AUTRES SERVICES D'IT-WINGS
NEWSLETTER IT-WINGS
Restez toujours à jour !
Plus d'articles de blog

Analyse des protocoles téléphoniques NFON & visualisation dans Klipfolio
Analyse des protocoles téléphoniques NFON & visualisation dans Klipfolio Chez IT-WINGS, nous proposons différents services dans le domaine de l’analyse numérique. Un exemple récent et intéressant a été le projet

Les disciplines du marketing en ligne et leurs KPIs
Les principales disciplines du marketing en ligne et leurs KPIs Dans notre monde de plus en plus numérisé, les entreprises décident de plus en plus souvent d’établir une présence en

Bye bye Google Optimize – quelles sont les alternatives au test AB ?
Bye bye Google Optimize Tout sur les tests AB et leurs alternatives Augmenter le chiffre d’affaires et améliorer les taux de conversion, c’est le souhait de toute entreprise. Mais comment