Référencer ses jeux de données sur data.gouv.fr
Cet article s'adresse aux producteurs de données français publiant leur données en open data sur une plateforme Opendatasoft, et qui souhaitent faire référencer leurs données sur https://www.data.gouv.fr afin d'en augmenter leur découvrabilité.
La méthode définie conjointement par les équipes Etalab et Opendatasoft s’appuie sur l’export DCAT Opendatasoft et le moissonneur DCAT côté data.gouv.fr.
Les étapes à suivre sont les suivantes :
Remplissage des métadonnées pour chaque jeu de données
Récupération de l’export DCAT pour sélectionner les jeux de données à publier
Paramétrage du moissonneur sur le profil de l’Organisation sur data.gouv.fr
Prérequis : – Avoir un portail Opendatasoft configuré pour un accès autorisé aux utilisateurs anonymes– Avoir un profil “Organisation” sur data.gouv.fr
Etape 1 : Remplir les métadonnées
Tableau des métadonnées
Les métadonnées à remplir sur vos jeux de données sur la plateforme Opendatasoft, et qui sont utilisées dans le calcul du score de qualité sur data.gouv.fr, sont listées ci-dessous :
Modèle de métadonnées ODS | Métadonnée ODS | Métadonnée data.gouv.fr | Règle de remplissage |
Standard | Description | Description | Aucune |
Standard | Licence | Licence | Pour une administration publique, Licence Ouverte version 2.0 ou ODC Open Database License (ODbL) version 1.0. Plus d'information ici. |
DCAT | Fréquence de mise à jour | Fréquence | Une valeur parmi :
|
DCAT | Début de couverture temporelle + Fin de couverture temporelle | Couverture temporelle | Remplir la date de début de couverture des données et la date de fin. |
DCAT | Emplacement | Couverture territoriale |
|
Etape 2 : Récupérer l'export DCAT
Option 1 : Publier toutes les données ouvertes du portail
Rendez-vous sur le catalogue de votre portail : [URL de votre portail]/explore.
Récupérer le lien d’export “RDF/XML (DCAT)” en bas des filtres à gauche de votre écran.
Faites un clic droit sur le lien et copiez-le.
Option 2 : Publier un sous-ensemble de données
Cette option est à privilégier si vous ne souhaitez pas remonter toutes les données de votre portail, notamment en excluant la base SIRENE ou toute autre donnée publiée par des organismes tiers. Cette étape peut être assez technique, ainsi n’hésitez pas à contacter le support Opendatasoft si vous avez besoin d’assistance.
Dans ce cas, il vous faudra créer l'URL d'export avec :
La racine : [URL de votre portail]/api/v2/catalog/exports/dcat
Plus les paramètres pour filtrer l'export, à partir de la syntaxe ODSQL (langage de requête de l'API Opendatasoft)
Des exemples de requête :
Voici un exemple de requête pour récupérer l’export DCAT du portail https://public.opendatasoft.com en excluant le producteur “Opendatasoft” :
https://public.opendatasoft.com/api/v2/catalog/exports/dcat?where=publisher!="Opendatasoft"Voici un exemple de requête pour récupérer l’export DCAT du portail https://public.opendatasoft.com en excluant le producteur “Opendatasoft” et en filtrant sur le mot-clé “Population” : https://public.opendatasoft.com/api/explore/v2.1/catalog/exports/dcat?where=publisher!="Opendatasoft" AND keyword="Population"&lang=fr
Vous pouvez faire le test avec l’export CSV pour voir si vous récupérez bien les jeux de données souhaités : https://public.opendatasoft.com/api/v2/catalog/exports/csv?where=publisher!="Opendatasoft
Créer le moissonneur sur data.gouv.fr
Pour cette étape, vous pouvez suivre la documentation disponible sur data.gouv.fr : https://guides.etalab.gouv.fr/data.gouv.fr/publier-jeu-de-donnees/#publier-un-catalogue-de-donnees-existant-par-moissonnage
NB : Assurez-vous de bien choisir l’option du moissonnage DCAT.
Fichiers récupérés sur data.gouv.fr
Exports des jeux de données
Pour tous les jeux de données, les exports CSV, XLSX et JSON seront disponibles comme ressources sur data.gouv.fr. Si le jeu de données contient des formes géographiques, l’export GeoJSON sera aussi disponible.
Vous pouvez également ajouter d'autres formats d'exports via la syntaxe en bleu ci-dessous :
https://public.opendatasoft.com/api/v2/catalog/exports/dcat?where=publisher!="Opendatasoft"&include_exports=csv,shp,geojson
La liste des formats disponibles est la suivante :
Autres ressources
Si vous souhaitez ajouter d’autres fichiers qui seront disponibles comme ressources sur data.gouv.fr, il y a deux options :
S'il s'agit de fichiers contenant des données (par exemple des formats non supportés par ODS, des fichiers respectant un certain schéma, ...) vous pouvez les ajouter dans les exports alternatifs de votre jeu de données (import de fichier ou via URL),
S'il s'agit de document de méthodologie, apportant du contexte au jeu de données, vous pouvez les importer en pièce jointe.