Accueil » Le blog Looker Studio » Comment simuler l’opérateur UNION ALL avec Looker Studio pour regrouper des jeux de données

Comment simuler l’opérateur UNION ALL avec Looker Studio pour regrouper des jeux de données


L’opérateur UNION ALL permet de combiner plusieurs jeux de données, partageant la même structure et les mêmes champs. Nous allons simuler son principe au sein de Looker Studio (anciennement Data Studio) grâce au tutoriel ci-dessous.

Simuler l'opérateur UNION ALL avec Looker Studio pour regrouper des jeux de données

C’est assez habituel d’utiliser l’opérateur UNION lorsque qu’on travaille en langage SQL pour regrouper différentes sous requêtes en normalisant l’ordre, le format et les valeurs des champs souhaités.

Pour les besoins de cet article, je vais utiliser des données provenant de la Google Search Console (données de site) en combinant les statistiques provenant des propriétés Web + Image + Video.

Ces données sont fournies de manière séparée par le connecteur Looker Studio dédié à la Search console et nous souhaitons les unir.

Le résultat sera affiché dans un simple graphique en tableau. Comme d’habitude, vous pouvez appliquer ce tutoriel pour n’importe quel source de données et changer la représentation graphique.

Table des matières


Ingrédients

Pour créer notre opérateur UNION et combiner des données dans un graphique au sein de Looker Studio, nous allons avoir besoin des éléments suivants :

  • Entre 2 et 5 sources de données ou instances de sources de données (tables) : Je connecte 3 sources de données à mes propriétés web, image et vidéo de la Google Search Console sur les données de site
  • Une combinaison de données (data blending) utilisant les sources citées précédemment
  • Un graphique de type Tableau pour afficher le résultat final
  • Des champs calculés au niveau du graphique pour créer l’opérateur UNION ALL pour chaque champ affiché


Sources de données

Les propriétés (web, image, video…) du connecteur de la Google Search Console (GSC) sont disponibles grâce à un paramètres au sein de la source de données Looker Studio.

Malheureusement, on ne peut sélectionner qu’un paramètre à la fois, nous allons donc devoir créer une source de données séparées par nature de média.


Sources de données Google Search Console( GSC)

Combinaison de données

A présent, nous configurons la combinaison de données (blended data) « BD – GSC properties » comme suit :

  • Une table par source de données Google Search Console (x3)
    • Noms des tables: Une valeur unique correspondant « Google Property », donc respectivement : « Video », « Image » & « Web »
    • Dimensions : Google Property, Device category
    • Métrique : Impressions
  • Conditions
    • Jointure externe entière (Full outer join) pour les 2 configurations de jointure
    • 1 clé de conditions de jointure : Google Property de chaque côté (sans se soucier des tables sélectionnées)
    • Explication :
      L’objectif ici n’est pas de réconcilier des lignes mais de les empiler en utilisant une valeur propre à chaque table. Dans le cas de la GSC, c’est assez simple, l’information est fournie dans un champ. Pour d’autres cas, vous pouvez ajouter une valeur statique en guise de dimension calculée sur chaque table.

Combinaison de données de Google Search Console


Lignes de données jointes

Faisons une petite pause pour regarder à quoi ressemblent nos données combinées et constater que nous sommes proches du but final.

Le tableau ci-dessous affiche notre combinaison de données. Les lignes possèdent des valeurs uniquement pour une source à la fois et les autres champs sont valorisés à null. Comme souhaité, il n’y a pas de correspondance et nos données sont dans des champs séparés.

C’est la première étape nécessaire pour créer notre opérateur UNION.


Résultat des données combinées des 3 sources de données Google Search Console

Champs calculés

Enfin, pour joindre les valeurs des champs similaires de manière transversale aux tables de notre combinaison de données, nous avons besoin de champs calculés très simples en utilisant la fonction : COALESCE

La fonction COALESCE retourne la première valeur non nulle, trouvée dans une liste de champs fournis en paramètre.

Donc, cette fonction COALESCE sera complémentaire à la jointure externe entière (full outer join). C’est l’usage combiné de ces 2 fonctionnalités Looker Studio qui permet de créer une version « maison » de l’opérateur UNION ALL.

Les champs calculés ci-dessous sont créés sur un graphique de type Tableau en guise de dimensions et de métrique.


Property
COALESCE(Google Property (Video),Google Property (Image),Google Property (Web))

Device
COALESCE(Device Category (Video),Device Category (Image),Device Category (Web))

Impressions
COALESCE(Impressions (Video),Impressions (Image),Impressions (Web))

Vérification de la configuration

Rien de mieux qu’une rapide vidéo pour vérifier que votre configuration est similaire à celle de ce tutoriel.

Retour en haut