Lignage des données : qu'est-ce que c'est et comment ça marche

Modifié

Qu'est-ce que le lignage des données ?

La fonction de lignage des données fournit une visualisation de vos objets ODS (jeux de données, pages, cartes et graphiques), de la manière dont ils sont liés à d'autres objets, où ils sont utilisés et par qui.

Opendatasoft propose deux niveaux d'information :

  • Lignage fonctionnel : cela décrit les relations entre les objets. Il offre une vue globale des dépendances entre ces objets, fournissant une compréhension générale de la manière dont différents ensembles de données ou objets sont connectés au sein de la plateforme.

  • Lignage niveau champ : cette option fournit une vue plus détaillée des relations entre les objets en se concentrant spécifiquement sur les champs liés au sein de ces objets. Cette vue met l'accent sur les dépendances au niveau des champs de données, offrant une compréhension approfondie des connexions spécifiques entre les champs dans différents objets ODS.

Vous pouvez :

  • Garder une trace du cycle de vie de votre jeu de données

  • Comprendre comment un objet affecte ou est affecté par les modifications apportées aux objets en amont ou en aval de celui-ci

  • Voir rapidement quels jeux de données sont utilisés et à quel point ils sont populaires

Notez que les informations fournies dans le lignage ne sont pas les mêmes que le volume d'utilisation . Le volume d'utilisation et la fonction de lignage des données ont des objectifs différents. La fonctionnalité de lignage permet de visualiser les liens entre les objets ODS quelle que soit leur utilisation (nombre de téléchargements ou nombre d'appels API).

Où dois-je aller pour utiliser le lignage des données ?

Le lignage des données vous permet d'examiner vos jeux de données et leur relation avec d'autres objets ODS de deux manières. Dans le back-office :

  1. Accédez à l'ensemble de données que vous souhaitez examiner et cliquez sur l'onglet Lignage. Pour plus de détails sur l'utilisation du lignage sur un jeu de données, voir ici.

  1. Allez dans le menu Statistiques dans la barre latérale et cliquez sur "Lignage". Pour plus de détails sur l'utilisation du tableau de bord de lignage, voir ici.

Quelques notions clés et vocabulaire

De nombreux clients Opendatasoft disposent de véritables écosystèmes de données. Le lignage de données fournit une vue de l'origine et de l'utilisation de vos données. Mais pour ce faire, il utilise quelques concepts clés qui vous aidera à comprendre : En gros, quels sont les éléments fondamentaux de votre écosystème, et surtout comment s'articulent-ils les uns aux autres ?

Objets et relations ODS

Un objet ODS est un jeu de données, une page ou encore une carte ou un graphique créé avec un constructeur de cartes ou de graphiques. Un objet tiers fait référence à une source externe (fichier, URL ou service distant) d'un jeu de données. Ce sont les différents éléments de votre écosystème de données.

Une relation fait référence à la manière dont deux objets sont liés l'un à l'autre, l'un étant l'origine et l'autre la destination.

Dans cet exemple, A est l'objet d'origine et B l'objet de destination. B dépend de A.

Ces relations peuvent être directes ou indirectes, comme décrit ci-dessous.

Une relation directe

Une relation directe est une relation dans laquelle deux objets sont liés sans aucune transformation. L'un est identifié comme l'origine et l'autre comme la destination.

Dans cet exemple, le jeu de données A est l'objet d'origine et le jeu de données B est l'objet de destination.

Une relation indirecte

Une relation indirecte se produit lorsqu'un objet ODS de destination dépend d'une chaîne de relations directes ou indirectes avec d'autres objets.

Dans cet exemple, le jeu de données E est l'origine du jeu de données A. À son tour, le jeu de données A est l'origine du jeu de données B. Les jeux de données E et B ont donc une relation indirecte.

Une relation invalide

Une relation est invalide lorsque l'objet d'origine n'est plus disponible dans l'écosystème Opendatasoft. Cela peut se produire en raison de la suppression du jeu de données, de la suppression ou de la désactivation de l'espace de travail, ou de l'indisponibilité de la source du jeu de données.

Relations amont et aval

Un objet ODS a une relation amont s'il est l'objet destination d'un autre objet et utilise d'autres objets pour sa construction. Un objet a une relation en aval s'il est utilisé par d'autres objets.

Dans l'exemple ci-dessous, le jeu de données E est en amont du jeu de données A. La page P est en aval du jeu de données A.

Types de relations spécifiques

Les relations visibles dans le lignage des données sont :

  • Utilise une fédération (fédération publique ou privée, fédération par récolteur ou fédération par distribution)

  • A pour source un fichier, une URL ou un service distant

  • Est le résultat d'une jointure simple (à l'aide du processeur Join datasets) ou d'une jointure fournie (réalisée à l'aide de processeurs géographiques)

  • Est utilisé sur les pages, dans le Studio ou dans les constructeurs de cartes et de graphiques

Les réutilisations ne sont pas incluses dans le lignage de données.

Invalidité

Une relation devient invalide au sein de l'écosystème Opendatasoft dans les cas suivants :

  1. Suppression ou désactivation ou inaccessibilité : Lorsque l'objet ODS d'origine est supprimé ou dépublié, ou lorsqu'un objet tiers devient inaccessible, la relation devient invalide.

  2. Suppression de l'espace de travail : Si l'espace de travail associé à la relation n'existe plus car l'environnement où les données étaient stockées n'est plus disponible.

  3. Altérations des champs liés : Des modifications dans les champs liés telles que la suppression, le renommage ou les mises à jour de type peuvent également invalider les relations.

Modes déclaré et incognito

Pour rendre possible une fonctionnalité de lignage de données à haute valeur ajoutée et visualiser les relations entre différents objets, il est nécessaire de partager les métadonnées d'utilisation avec d'autres clients qui possèdent des espaces de travail.

Nous voulons que nos clients comprennent parfaitement quelles données sont collectées, utilisées et où elles sont utilisées, et qu'ils soient en mesure de choisir de partager ou non les noms de leurs espaces de travail.

Besoin de plus d'informations sur notre processus de collecte ? Une note d'information est disponible sur legal.opendatasoft.com

Des modes de partage sont disponibles pour empêcher le partage de l'identité de l'objet ODS de destination avec les propriétaires des objets ODS d'origine.

Deux modes sont disponibles :

  1. Mode déclaré

C'est le mode par défaut. Le nom de l'espace de travail est partagé en plus des informations sur le type de relation. Ensuite, les conditions d'accès de l'objet sont utilisées pour déterminer quelles informations sont partagées sur l'objet de destination. Nous encourageons ce mode car il donne aux autres utilisateurs la meilleure visibilité sur leur utilisation des données. Dans l'onglet de lignage, vous verrez une icône verrouillée sur les objets ODS si vous n'avez pas les autorisations nécessaires.

  1. Mode incognito

Seules les informations sur le type de relation seront partagées avec les espaces de travail concernés. C'est le niveau de connaissance minimum pour mettre en place le lignage de données en liant anonymement producteurs et consommateurs de données.

L'utilisation au sein d'un même portail est automatiquement en mode déclaré.Cependant, un espace de travail primaire et ses espaces de travail secondaires sont considérés comme des portails indépendants et n'auront aucune relation particulière entre eux lors du partage des métadonnées d'utilisation. Par défaut, un espace de travail se voit attribuer le mode de partage de son espace de travail parent, mais cette valeur peut être surchargée.

Mode déclaré

Le type de la relation, le titre ou le nom de l'espace de travail de destination sont partagés. D'autres informations peuvent être ajoutées, selon l'accès de l'utilisateur à l'objet de destination. C'est le mode par défaut.

L'utilisateur n'a pas les permissions nécessaires

Paramètres : L'objet ODS a un accès restreint, mais l'utilisateur n'a pas les autorisations pour le voir.

Résultat : L'utilisateur peut voir le titre ou le nom de l'espace de travail et le type de l'objet de destination, mais pas son titre.

L'objet ODS est public OU l'utilisateur a les autorisations nécessaires

Paramètres : l'objet ODS a un accès restreint et l'utilisateur dispose des autorisations nécessaires pour l'afficher avec des autorisations ou un rôle (peut afficher le jeu de données ou la page, parcourir tous les jeux de données, afficher toutes les pages, parcourir les statistiques). Dans ce cas, l'utilisateur peut également voir l'identifiant, le titre et les champs liés de l'objet de destination.

ou

Paramètres : l'objet ODS a un accès public.

Résultat : L'utilisateur peut voir les informations précédentes (niveau 1) et l'identifiant ou le titre de l'objet de destination.

Les objets tiers et leurs relations ne sont visibles que sur les objets ODS appartenant à l'espace de travail courant et selon les conditions d'accès de l'utilisateur. Ils ne seront pas transmis à d'autres espaces de travail qui utilisent l'objet ODS.

Mode incognito

Il s'agit du niveau d'information minimum requis pour lier les objets ODS. Par défaut et pour chaque relation, son type et les informations sur la nature de l'objet ODS destination sont partagés avec l'espace de travail d'origine. Les objets tiers ne sont pas concernés et ne sont pas visibles.

Un résumé de ce qui est partagé dans chaque mode

Mode incognito

Mode déclaré (par défaut)

Type de relation

Type d'objet ODS

Nom ou titre de l'espace de travail

Identifiant ou titre de l'objet ODS

Dépend des permissions de l'utilisateur

Champs liés de l'objet ODS

Dépend des permissions de l'utilisateur

Objet tiers

Dépend des permissions de l'utilisateur.

Non transmis en dehors de

l'espace de travail actuel.