Analyser l'utilisation des données

Modifié

Les utilisateurs doivent disposer de l'autorisation « Parcourir les statistiques » pour consulter les tableaux de bord Statistiques.

Le tableau de bord Données présente la popularité des ensembles de données via des mesures de téléchargement et d'interaction.

Pour le voir, accédez à Statistiques > Données.

Dans ce tableau de bord, nous prenons en compte uniquement les jeu de données publiés. Les jeu de données qui n'ont pas été publiés ne sont pas inclus dans les figures, graphiques ou autres analyses calculées affichés ici.

Filtrage des données

Vous pouvez filtrer les données en fonction des conditions d'accès jeu de données.

Il n'y a pas de limite de temps. Les compteurs indiquent les chiffres cumulés depuis la première publication du jeu de données.

Indicateurs clef

  • Jeux de données : le nombre total actuel des jeux de données publiés, y compris le pourcentage d'ensembles de données fédérés.

  • Téléchargements : le nombre total de téléchargements des jeux de données publiés.

  • Appels API : le nombre total d'appels API des jeux de données publiés.

  • Réutilisations : Il s'agit des réutilisations actuelles des ensembles de données publiés, y compris le pourcentage d'ensembles de données liés à au moins une réutilisation. Par exemple, si vous avez 10 ensembles de données publiés et que l'un d'entre eux comporte quatre réutilisations, le pourcentage serait de 10 %.

    Les réutilisations des KPI sont disponibles si l'option « Autoriser les réutilisations » est activée sur l'espace de travail. Dans le cas contraire, des informations supplémentaires sur les KPI suivants seront affichées.

  • Enregistrements : Il s'agit du nombre total d'enregistrements de vos ensembles de données (les ensembles de données fédérés sont exclus).
    Information complémentaire si la réutilisation des KPI n'est pas affichée : la partie des jeux de données qui représente au moins 50% du nombre total d'enregistrements.

  • Jeux de données avec informations incomplètes : Il s'agit du nombre total de jeux de données avec au moins un champ de métadonnées non renseigné parmi les champs suivants : éditeur, thème ou licence.
    Informations complémentaires si la réutilisation des KPI n'est pas affichée : le pourcentage de jeux de données publiés avec des informations manquantes. Vous pouvez consulter la liste des ensembles de données en cliquant sur le lien.

  • jeu de données populaires : Le score de popularité est le résultat d'un calcul qui utilise le nombre de téléchargements, de réutilisations et d'appels API d'un ensemble de données. Plus le score est élevé, plus l’ensemble de données est utilisé. Vous pouvez trier ces ensembles de données par nombre cumulé de téléchargements, d'appels API ou de réutilisations en cliquant sur Afficher plus.

  • Distribution des thèmes : Cette section du tableau de bord Données affiche un organigramme représentant tous les thèmes de jeux de données actuellement utilisés. Ce graphique vous aide à analyser quels thèmes sont les plus ou les moins utilisés.

    Passez la souris sur un thème dans l'arborescence pour afficher le score de popularité moyen des jeu de données appartenant à ce thème.

Les données sous-jacentes

Pour afficher l'ensemble de données complet, faites simplement défiler vers le bas du tableau de bord et cliquez sur Voir la source de données.

Ce jeu de données s'appuie sur les champs API suivants :

Nom du champ

Description

dataset_id

L'identifiant du jeu de données

title

Le titre du jeu de données

domain_id

L'identifiant de l'espace de travail auquel appartient le jeu de données

modified

La date à laquelle le jeu de données a été modifié pour la dernière fois

publisher

Nom de l'éditeur du jeu de données

license

Le type de licence

keyword

Une liste des mots-clés attachés au jeu de données

theme

Le nom du thème du jeu de données

Reuse count

Le nombre de réutilisations

API call count

Le nombre total cumulé d'appels API

Download count

Le nombre total cumulé de téléchargements

Attachments download count

Le nombre total cumulé de fois qu'une pièce jointe a été téléchargée depuis le jeu de données

File fields download count

Le nombre total cumulé de téléchargements de fichiers (stockés dans un champ)

Popularity score

Ce calcul est basé sur trois métriques : nombre de téléchargements, nombre d'appels API et nombre de réutilisations.

records_count

Le nombre total d'enregistrements dans le jeu de données

records_size

La taille du jeu de données (en octets)

security

Liste des utilisateurs ayant accès (si des règles ont été configurées)

visibility

Conditions d'accès au jeu de données

federated

La source si le jeu de données est une fédération