Arabesque quick tutorial (v.0)
Réalisation : Equipe gflowiz, 2019.
Licence : CC-BY-SA 3.0-FR.
Arabesque est une application web de cartographie thématique des flux développée dans le cadre du projet gflowiz. (Voir le blog du projet pour plus de détails.
Arabesque est disponible gratuitement à l'adresse suivante : http://arabesque.ifsttar.fr/
Elle fonctionne avec Chromium et Mozilla. La documentation générale (travail en cours) et le code informatique sont disponibles sur le dépôt suivant : https://github.com/gflowiz/arabesque
Pour ce tutoriel, nous avons utilisé les flux commerciaux historiques répertoriés dans la base de données RICARDO. Les fichiers utilisés sont disponibles dans ce dépôt et ont la structure suivante :
-
SAGEO_RICardo_nodes.csv : fichiers de localisation géographique des entités
- id (identifiant de l'entité géographique)
- name (nom de l'entité géographique)
- type (type de l'entité : country, city, ...)
- continent (continent)
- lat (latitude)
- long (longitude)
-
SAGEO_RICardo_edges_small.csv : flux commerciaux historiques agrégés (pour réduire la taille du jeu de données)
- idorigine (identifiant de l'entité d'origine du flux)
- iddestination (identifiant de l'entité de destination du flux)
- volume (volume financier du flux en Livre sterling)
- decennie (décennie concernée par le flux)
-
SAGEO_RICardo_edges_nona.csv : flux commerciaux historiques non agrégés
- idorigine (identifiant de l'entité d'origine du flux)
- iddestination (identifiant de l'entité de destination du flux)
- volume (volume financier du flux en Livre sterling)
- annee (année de l'échange)
- periode (période de l'échange)
- decennie (décennie de l'échange)
Arabesque vous permet également d'importer vos propres ensembles de données de flux, sous la forme d'une matrice origine-destination (format liste d'adjacence en CSV), de les explorer, de les filtrer pour créer une carte de flux lisible, en accord avec les principes de la sémiologie cartographique.
La réalisation d'une carte de flux avec Arabesque se décompose en 5 grandes étapes :
- Importation des données de flux (liens et/ou nœuds)
- Traitement des données de flux (création d'indicateurs, statistiques)
- Exploration et filtrage des données
- Symbolisation graphique
- Exportation
Pour une première découverte d' Arabesque, vous pouvez utiliser les jeux de données fournis comme exemple dans la section Démo.
Arabesque nécessite le chargement d'au moins un ensemble de données de flux : un fichier de liens au format CSV (séparateur : virgule) et format long.
Vous devez également déclarer les 3 champs minimums requis pour la cartographie des flux : ceux correspondant aux lieux d'origine, aux lieux de destination et aux valeurs de flux.
Si la matrice OD est temporelle ou disponible pour différentes catégories, vous devez également choisir une méthode d'agrégation.
Sur la page d'accueil d'(Arabesque), chargez au moins un ensemble de données de flux.
Application
Chargement des données SAGEO_RICardo_edges_small.csv
Si vous avez des données de localisation associées à vos OD, vous pouvez charger les fichiers de nœuds correspondants par "import Location", sinon vous pouvez utiliser des localisations pré-définies avec "Preset Location".
Si vous sélectionnez "Import Location", vous devez charger un fichier GEOJSON ou CSV, puis choisir l'ID des nœuds et leurs coordonnées géographiques lat/long.
Application
Chargement des données SAGEO_RICardo_nodes.csv
Lorsque vous sélectionnez "Preset Location", il vous suffit de choisir le niveau, la région et le code des nœuds géo-numériques correspondants (si disponible).
Après le chargement des fichiers de liens et de nœuds, l'application effectue automatiquement une jointure d'attribut entre les deux fichiers.
Les liens qui n'ont pas d'ID d'origine ou de destination sont automatiquement supprimés, de même pour les nœuds.
La liste des nœuds et liens supprimés est alors affichée, uniquement pour consultation - vous devez la copier si vous souhaitez conserver la liste.
Les jeux de données sont automatiquement modifiés lors de leur importation, l'application calcule différents indicateurs - qui sont disponibles dans une liste pouvant être téléchargée au format CSV (Voir sections Export et sauvegarde):
Indicateurs sur les liens : distance euclidienne entre les entités d'origine et de destination
Indicateurs sur les nœuds : Exemple d'indicateurs additionnels calculés sur les nœuds (données RIcardo)
Une carte est réalisée par défaut lors de l'arrivée sur l'interface : seuls les 10% de liens les plus importants (en valeur) sont représentés et symbolisés selon leur volume (variable renseignée à l'import) ; les noeuds sont symbolisés selon leur degré (calculé automatiquement).
L'interface est composée des deux panneaux suivantes.
La gestion de l'information géographique (des couches) est réalisée sur la partie de gauche de l'interface. Elle composée de deux sous-parties:
- Projections
- Titre
- Gestion et symbolisation des couches (Add Layers)
- Liens
- Nœuds
- Autres couches
La partie centrale correspond à la vue cartographique. Elle résulte du choix des couches à afficher (réalisé sur la partie gauche) et du filtrage des valeurs des liens et des nœuds (réalisé sur la partie droite).
Elle présente en outre différents boutons permettant la mise en oeuvre d'actions primaires.
Icône permettant de revenir à la page d'accueil pour commencer une nouvelle visualisation.
Boutons permettant de réaliser successivement des zooms avant et après de la vue - de la même façon qu'avec la molette de la souris.
Bouton permettant de sauvegarder le projet pour pouvoir l'utiliser ultérieurement.
Bouton visant à exporter la carte au format image (.PNG), en incluant les légendes et les sources des contributeurs pour les fonds externes tels que NaturalEarth, par exemple.
Bouton entraînant le recentrage et l'affichage de l'emprise totale des flux - sans zoomer/dézoomer ni paner.
Bouton servant à exporter les données filtrées - celles qui sont visibles sur la carte - sous la forme d'un fichier liste au format .JSON.
Bouton permettant d'afficher / masquer la légende.
Bouton permettant de passer en mode d'affichage en plein écran - avec fond noir.
Bouton permettant d'ouvrir ou de fermer les panneaux situés de chaque coté de la carte.
Une légende est générée automatiquement pour chaque carte, elle reprend les éléments de symbolisation (taille, couleur et opacité) présents sur la carte pour symboliser les indicateurs présentés. Ici, le volume des flux et le degré des lieux.
La gestion de l'information statistique à savoir l'exploration et le filtrage est réalisée sur la partie droite de l'interface.
Elle permet d'agir sur n'importe quelle variable caractérisant les nœuds et/ou les liens et/ou la distance parcourue par les flux (variable calculée lors du chargement des données).
Les résultats de l'application d'un ou de plusieurs filtres sont proposés par défaut en tête du panneau.
Pour les données observées à l'échelle mondiale ou régionale (sub-continentale), il est possible de changer la projection du fond de carte proposé ou de la vue affichée - pour les données locales, il est possible d'ajouter des tuiles vectorielles (voir section 5.5).
Pour cela, il faut soit sélectionner le système de projection dans une liste pré-établie, soit renseigner directement son code EPSG identifiant (European Petroleum Survey Group).
Exemple : World Mollweide (EPSG Correspondant : 54009)
Il est possible d'ajouter un titre simple sur la vue principale.
Il est possible d'agir sur la symbolisation graphique des différentes couches dessinées en : -- modifiant leur apparence ; -- ajouter de nouvelles couches qui serviront d'habillage ; -- gérant la disposition des différentes couches
La symbologie des nœuds consiste à paramétrer leur dessin, et à appliquer des variables visuelles permettant d'enrichir qualitativement la carte.
Couleur / Fixe : La teinte est identique pour tous les nœuds.
Application sur les nœuds : symbolisation des nœuds (barycentre des zones) avec une forme cercle (choix unique) de taille fixée et de teinte unique noire.
Couleur / Variable : La teinte des nœuds ne sera pas identique pour tous, mais basée sur un dégradé de ton prédéfini. Le choix de la progression (divergente ou non) sera fonction du type de caractère (précisé dans le champs type).
Le choix de nuancer la teinte des nœuds est associé ici à un caractère (ici le nombre de degrés pondéré - weighted degree) dont on précise le type (quantitatif).
Idéalement, il est nécessaire de paramétrer simultanément la taille des nœuds, en utilisant le même caractère (ici le degré pondéré - weighted degree) - sinon, les nœuds conserveront la même taille et le résultat de l'application d'une nuance sera peu visible.
Taille / Fixe : La taille (surface) des nœuds est identique pour tous et fixée sur une valeur donnée.
Taille / Variable La taille (surface) des nœuds est variable, selon une fonction (racine, racine carrée ou logarithmique) proportionelle à la valeur d'un caractère (quantitatif discret - de stock).
La correspondance entre les valeurs du caractère et leur symbolisation graphique est paramétrable grâce à l'application d'un ratio.
Le ratio est fixé par défaut à 0,02% de la plus grande dimension du rectangle d’encombrement maximal du jeu de données de flux.
Une étiquette, correspondant aux modalités d'un des champs du jeu de données, peut être ajoutée aux nœuds, sa teinte et son opacité fixées.
L'opacité consiste à agir sur le degré de transparence d'une teinte.
Opacité / Fixe : L'opacité de la teinte des nœuds est identique pour tous les nœuds, elle est paramétrable, entre 0 et 1.
Opacité / Variable : L'opacité de la teinte des nœuds est variable, en fonction d'un caractère (ici le degré pondéré, weighted degree), selon une fonction (linéaire, carrée, racine carrée et logarithmique) paramétrable, dont il est possible de définir les valeurs minimum et maximum, respectivement 0.25 et 0,85, par défaut.
Application sur les nœuds : symbolisation des nœuds avec une forme cercle de taille variable selon une fonction linéaire, représentée avec une teinte noire nuancée avec variation d'opacité.
La symbologie des liens consiste à paramétrer leur dessin, et à appliquer des variables visuelles permettant d'enrichir qualitativement la carte.
Exemple: lien droits bilatéraux orientés, teinte noire unique
**Géométrie / Orientée **
La géométrie orientée prend en compte la direction des flux, si nécessaire.
Géométrie / Non Orientée
La géométrie orientée ne tient pas en compte de l'éventuelle direction des flux.
Le type de la géométrie correspond à l'application de la (variable visuelle) forme du corps du lien, que celui-ci soit orienté ou non.
Type / Droit - "Straight" Le lien est rectilinéaire et orienté, grâce à une demi-tête de flèche
Type / Droit sans crochet - "Straight no hook" Le lien est rectilinéaire et orienté, il présente une pointe sans crochet
Type / Triangle - "Triangle" Le lien est rectilinéaire et prend la forme d'un triangle
Type / courbe - "Curve" Le lien est courbe et orienté, sa courbure est paramétrable.
Type / Triangle courbe - "Triangle curve" Le lien est courbe et prend la forme d'une goutte d'eau, sa courbure est paramétrable.
Type / Non orienté - "Non oriented" Le lien est droit valué ou non, il ne présente pas d'orientation.
La flèche de la géométrie du lien correspond à la (variable visuelle) forme de la tête du lien, lorsque celui-ci est orienté.
La courbure de cette tête est générée, selon l'algorithme de Chaikin qui permet de paramétrer sa hauteur et sa base, par rapport aux corps du lien.
Arrow / Hauteur (Height curve): La valeur de la hauteur de la tête est le pourcentage de la distance cartographique du lien (distance entre l'origine et la destination) utilisé pour définir la largeur (cartographique) maximale du lien - la largeur étant elle même fonction de la valeur du flux.
Arrow / Hauteur (Base) : La valeur de ([0,1]) est celle du centre de la courbe ; le point est identifié par l'indication d'un d'éloignement au nœud d'origine du lien.
Couleur / Fixe : La teinte des liens est identique pour tous.
Couleur / Variable : La teinte des liens n'est pas identique pour tous, elle est basée sur un dégradé de ton prédéfini. Le choix de la progression (divergente ou non) sera fonction du type de caractère (précisé dans le champs type).
Le choix de nuancer la teinte des liens est associé ici à un caractère (pseudo) continu dont il est nécessaire de préciser le type (quantitatif).
Idéalement, il est nécessaire de paramétrer simultanément la taille des liens, en utilisant un caractère discret (ici le degré pondéré - weighted degree) et leur couleur en utilisant un caractère continu (rapport ou taux) - sinon, les liens conserveront la même taille et le résultat de l'application d'une nuance sera peu visible.
Application sur les liens : symbolisation des liens avec une forme triangle courbe avec une couleur variable selon une fonction linéaire et présentant une variation d'opacité
Carte résultat :
Différents fonds de carte ou éléments d'habillage vectoriels, préchargés sont proposés. Leur sélection est réalisée à partir d'une liste.
La symbolisation de ce nouveau fond d'habillage peut être modifiée en paramétrant l'apparence du dessin de ses contours et fonds, de sa teinte et de son opacité.
Il est également possible d'importer un fond en indiquant son URL :
Applications sur la vue en cours
-
Ajout d'une bounding box, symbolisation graphique et disposition en arrière-plan (voir section Gestion des dispositions).
-
Ajout de lignes graticules_20, symbolisation graphique et disposition au-dessus de la bounding box (voir section Gestion des dispositions).
- Ajout d'une couche land (espaces continentaux), symbolisation graphique et placement au-dessus de la couche graticules_20
Pour les données observées à l'échelle locale, il est possible d'ajouter des couches tuiles - la mention des contributeurs sera alors insérée automatiquement sur la carte, en bas à droite.
Plusieurs tuiles sont proposées, elles sont triées par fournisseur ...
.. et par type de tuile (texte - Fond de carte)
- Selectionner Carto_basemap dans Type
- Selectionner Carto_Dark_NoLabel dans tiles
- Cliquer sur
- Un fond de carte vient alors recouvrir la carte affichée sur la partie centrale, cachant alors les flux.
- Il faut ensuite gérer la disposition des couches pour parfaire l'affichage.
Il est également possible d'ajouter ses propres tuiles via un géo serveur, en cliquant sur
Quelle que soit l'échelle (mondiale, régionale ou locale), il est possible d'ajouter un fond de carte vectoriel quelconque, au format geojson.
Pour cela,il faut charger son ficher et le nommer.
Ensuite, il est possible de modifier son dessin, sa couleur de fond et de contour.
L'ajout de couches d'information contribue à masquer les couches initiales de nœuds et de liens ; les dernières couches ajoutées s'étant placées au premier plan.
Pour rendre les flux visibles, il convient de modifier la disposition des différentes couches, en changeant leur ordre - par glisser / déplacer (drag & drop).
- Cliquer sur la couche link et la maintenir appuyée ;
- Glisser / déplacer la couche link et la placer au premier plan ;
- Relacher la couche ;
- Répéter la même opération avec la couche node si nécessaire.
On observe ainsi que la couche des flux vient d'être mise au premier plan.
Les vignettes correspondant aux différentes couches présentent des icônes permettant de gérer leur apparence.
: Afficher (rendre visible) une couche
: Paramétrer une couche de liens
: Modifier l'apparence d'une couche de liens
L'apparence des couches de liens (forme, couleur, opacité, taille) peut être modifiée à deux moments : soit lors de l'import, ou de la création de la couche - ce qui entraînera alors la suppression de la couche actuelle - (voir section 5.2), soit lors de la gestion des couches affichées, en agissant sur les icônes :
Modifier le style des liens Le bouton permet d'accéder à la fenêtre de paramétrage du style de la couche de liens.
Modifier le style des flèches
Le bouton permet de modifier le style des flèches
Il est réalisé soit visuellement à l’aide d’une fenêtre de sélection sur un histogramme interactif à fenêtre coulissante (slider), soit de manière numérique (en indiquant un seuil).
La part d’information sélectionnée, les valeurs minimales et maximales sont indiquées automatiquement sur la figure. Pour les liens, la possibilité d’un filtrage selon la distance géodésique parcourue est en outre proposée.
Application sur la vue en cours L'affichage des filtres par défaut est le suivant.
L'application précise littéralement les valeurs de filtrage :
- la part en pourcentage de liens (figurés) représentée (ici 10 % de l'ensemble des liens)
- la part en pourcentage du total de l'information de flux (valeur) représentée (83,5 %)
- la part en pourcentage de l'ensemble des nœuds : 36,5 %
Commentaire : 84 % de l'information est échangée entre 36 % des lieux qui représentent les 10 % des liens les plus forts, en volume - seul un tiers des lieux est impliqué dans ces échanges.
Il est possible de modifier ces paramètres de filtrage, en agissant sur les données de flux (liens ou nœuds)
-
Sélection des 25 % des échanges les plus importants,soit 8 % des nœuds et 0,6 % des liens les plus forts
- Sélection des 50 % des échanges les plus importants,soit 14 % des nœuds et 2 % des liens les plus forts
- Modification des paramètres de distance parcourue
Sélection des flux parcourant entre 4 000 et 12 000 kilomètres
- Résultat
Commentaire : la sélection des flux commerciaux qui parcourent de l'ordre de 4 000 à 12 000 kilomètres de distance correspond aux flux commerciaux à moyenne distance, qui s'expriment principalement dans l'hémisphère nord.. Ces flux de moyenne distance représentent 34 % du volume total de marchandises qui correspond à 25 % des relations financières commerciales les plus importantes, qui s'expriment entre 4 % des pays les plus riches. On notera que seules l'Amérique du nord et des pays de l'Europe de l'ouest sont impliqués dans ces échanges - dont on rappelle qu'ils correspondent au cumul des valeurs observées sur l'ensemble de la période.
Pour appliquer un double filtrage, il suffit d'ajouter deux filtres différents sur les liens, puis de paramétrer chacun d'entre eux.
Application sur la vue en cours
Distance parcourue inférieure à 8 000 km (de moyenne à petite longue distance) Volume total échangé supérieur à 47 millions (paramètre empirique, pris au hasard)
Commentaire : les échanges qui s'expriment à moyenne voire longue distance (moins de 8 000 km environ) et qui représentent plus de 48 millions de livres sterling échangés correspondent à 50 % du total de ces interactions commerciales qui sont réalisées entre les 16 % de noeuds les plus importants.
Les données étant découpées dans le temps, il est possible de sélectionner une ou plusieurs dates à représenter. Les paramètres décrivant la part d'information représentée sont alors actualisés.
Application sur la vue en cours
Bouton permettant d'exporter une carte au format image (.PNG).
Bouton permettant d'exporter la carte au format .ZIP.
Pour ouvrir une carte sauvegardée, il faut charger le fichier .ZIP de sauvegarde - et ne pas l'avoir modifié entre temps.