Introduction à l'analyse web avec R

Introduction à l'analyse web avec R

En fonction des préférences de l’analyste web ou selon le point de vue d’une entreprise ou d’une agence sur l’analyse web, il est possible d’utiliser le logiciel de statistiques R. Ce logiciel est particulièrement adapté lorsque l’analyste web doit évaluer statistiquement des quantités de données ou faire des prévisions.

Qu'est-ce que R ?

R est un logiciel disponible gratuitement sur Internet ou un langage de programmation orienté objet pour les calculs statistiques et les visualisations. Le langage de programmation a été créé en 1992.

Le package de base de R permet d’effectuer les principaux tests et calculs statistiques. Cependant, la grande communauté R présente et propose constamment de nouveaux paquets à télécharger. Le logiciel évolue ainsi constamment. Par exemple, un webanalyste qui souhaite effectuer des analyses avec l’outil de suivi Google Analytics via R peut télécharger le package Google Analytics. Il est ainsi possible de traiter les données de suivi directement dans R via l’API Google Analytics.

Où télécharger R ?

R peut être téléchargé gratuitement sur la plate-forme https://www.r-project.org/. Sous « Téléchargement », on trouve le terme « Cran », qui signifie « Comprehensive R Archive Network ». C’est ici que se trouvent les paquets ainsi que le logiciel lui-même.

Installer et charger le package Google Analytics dans R

a) Installation

Pour installer n’importe quel paquet qui n’est pas présent dans le paquet par défaut de R, nous cliquons sur « Paquets » dans la barre de menu supérieure et sélectionnons « Paquets installés ».

RGui

Dans la fenêtre qui s’ouvre ensuite, nous pouvons choisir un miroir CRAN. Il s’agit d’un serveur sur lequel les données sont enregistrées.

Après la sélection du serveur, une autre fenêtre apparaît, dans laquelle tous les paquets prêts à être installés sont affichés par ordre alphabétique.

Packages

Il est également possible d’installer le paquet souhaité dans la console R en tapant install.packages(« googleAnalyticsR »).

b) Téléchargement

Lorsqu’un paquet est installé, il peut être chargé à tout moment pour de nouveaux projets. Cela se fait via l’onglet « Paquets » dans la barre de menu. Il faut ensuite cliquer sur « Charger le paquet ».

Premières commandes dans R

Dans R, les commandes sont saisies après le caractère d’entrée « > » (également appelé « prompt »). Il est important de mentionner ici que l’on fait la différence entre les minuscules et les majuscules.

Si l’on saisit 5+15 après le prompt, 20 apparaît comme résultat.

En outre, des requêtes logiques telles que 3>2 peuvent être effectuées.

Les entrées sont effectuées en appuyant sur la touche de confirmation (Enter).

Créer le premier objet

Lorsque l’on travaille avec R, il est nécessaire d’écrire les résultats des fonctions dans un objet. Par exemple, si l’analyste web veut créer un vecteur nommé « OrganicTraffic » et le remplir avec les chiffres des sessions des cinq derniers jours, il peut entrer ce qui suit :

OrganicTraffic <- c(100,120,150,180,200)

Organic Traffic

Lorsque l’on appelle « OrganicTraffic », les valeurs s’affichent (voir illustration).

Un objet est donc créé en saisissant d’abord un nom d’objet et en appelant ensuite au moins une fonction. Dans ce cas, la fonction « c », qui signifie « combine », a été utilisée. Les valeurs sont ainsi combinées.

Si l’analyste web souhaite connaître la valeur moyenne des sessions au cours des cinq jours sélectionnés, il peut taper mean(OrganicTraffic).

Alternativement, l’analyste web aurait pu créer un nouvel objet :

Organic Traffic

Créer des facteurs

Dans le domaine des statistiques et de l’analyse web, il existe des données qui ne peuvent pas être classées dans un ordre naturel. Il s’agit de données à l’échelle nominale. Dans l’analyse web, il s’agit par exemple du type de visiteur (nouveau visiteur et visiteur récurrent ou les différents canaux d’accès comme Paid, Organic, Display, Direct, etc.)

Dans R, un objet ou un vecteur est converti en un facteur de la manière suivante :

Tout d’abord, un vecteur est créé avec les canaux d’entrée correspondants. 1 correspond ici à « Direct », 2 à « SEO » et 3 à « SEA ».

Canal d’entrée <- c(1,2,2,1,3,1,3,2,2,2)

Pour effectuer la conversion, il faut maintenant utiliser la fonction factor(nom du vecteur) :

Einstiegskanal Faktoren

Dans cet exemple, le facteur canal d’entrée comprend trois niveaux ou valeurs : 1, 2 et 3.

Data Frames

Souvent, les données ne se trouvent pas seulement dans une ligne ou une colonne, mais l’analyste voit plusieurs lignes et colonnes avec des types de données très différents. Une exportation CSV typique de Google Analytics avec au moins une dimension et une métrique est un exemple de data frame.

Comme nous ne lierons R à Google Analytics qu’ultérieurement, nous créons notre propre Data Frame.

Tout d’abord, nous créons deux vecteurs supplémentaires en plus du vecteur « OrganicTraffic » que nous avons déjà créé :

Organic Traffic

Ensuite, nous relions les données dans un data frame en utilisant la fonction data.frame(a,b). Cela permet de lier le vecteur a au vecteur b.

Data Frame Channel

L’appel dataframe.channel permet d’afficher nos trois canaux d’accès en ligne.

Une manière plus simple de créer un tel data frame serait de créer un tableau vide :

Console dateneditor Tabelle

La fonction edit(as.data.frame(NULL)) permet de créer un tableau vide et de l’appeler dans l’éditeur de données. Dans ce tableau, un clic de souris permet d’accéder à n’importe quelle cellule et de saisir les données manuellement.

Cliquez ici pour accéder à la deuxième partie de l’analyse web avec R :

NEWSLETTER IT-WINGS

Restez toujours à jour !

Plus d'articles de blog