Référencer ses jeux de données sur data.gouv.fr
Cet article a été rédigé pour les producteurs de données ouvertes françaises qui les publient sur la plateforme Opendatasoft, mais qui souhaitent également que leurs données soient référencées sur https://www.data.gouv.fr afin d'augmenter leur découvrabilité.
La méthode définie conjointement par les équipes d'Etalab et d'Opendatasoft est basée sur l'export DCAT d'Opendatasoft et le moissonneur DCAT de data.gouv.fr.
Les étapes à suivre sont les suivantes :
Remplir les métadonnées pour chaque jeu de données
Copier le lien d'export DCAT, après avoir sélectionné les jeux de données à publier
Configurer le moissonneur dans le profil de votre organisation sur data.gouv.fr
Prérequis :
- Un portail Opendatasoft configuré pour permettre aux utilisateurs anonymes
- Un profil "Organisation" sur data.gouv.fr
Dans Opendatasoft, les métadonnées que vous devez remplir pour vos jeux de données — et qui sont utilisées pour calculer le score de qualité sur data.gouv.fr — sont listées ci-dessous :
Modèle de métadonnées ODS | Champ de métadonnées ODS | Champ de métadonnées correspondant sur data.gouv.fr | Comment le remplir |
Standard | Description | Description | |
Standard | Licence | Licence | Pour une administration publique, ces licences sont recommandées : Licence Ouverte version 2.0 ou Licence de base de données ouverte ODC (ODbL) version 1.0. Pour plus d'informations, voir ici (en français). |
DCAT | Périodicité d'accumulation | Fréquence | Une des valeurs suivantes :
|
DCAT | Date de début de couverture temporelle + Date de fin de couverture temporelle | Couverture temporelle | Remplissez les dates de début et de fin pour les données. |
DCAT | Spatial | Couverture territoriale |
|
Allez dans le catalogue de votre portail (<l'URL de votre portail>/explore).
Trouvez le lien d'export "RDF/XML (DCAT)" en bas à gauche de votre écran.
Cliquez avec le bouton droit sur le lien pour le copier. C'est ce que vous utiliserez lors de la configuration du moissonneur sur data.gouv.fr.
Cette option est préférable si vous ne souhaitez pas référencer tous les jeux de données de votre portail. Par exemple, vous pouvez souhaiter exclure la base de données SIRENE ou d'autres données publiées par des organisations tierces. Cette étape peut être assez technique, donc n'hésitez pas à contacter le support d'Opendatasoft si vous avez besoin d'aide.
Dans ce cas, vous devrez créer l'URL d'export avec :
La racine <l'URL de votre portail>/api/v2/catalog/exports/dcat
Plus les paramètres pour filtrer l'export, basés sur la syntaxe ODSQL (langage de requête API d'Opendatasoft)
Le lien résultant est ce que vous utiliserez lors de la configuration du moissonneur sur data.gouv.fr.
Exemples :
Voici un exemple de requête pour récupérer l'export DCAT du portail https://public.opendatasoft.com, en excluant le producteur "Opendatasoft" :
https://public.opendatasoft.com/api/v2/catalog/exports/dcat?where=publisher!="Opendatasoft"Voici un exemple de requête pour récupérer l'export DCAT du portail https://public.opendatasoft.com, en excluant le producteur "Opendatasoft" et en filtrant sur le mot-clé "Population" :
https://public.opendatasoft.com/api/explore/v2.1/catalog/exports/dcat?where=publisher!="Opendatasoft" AND keyword="Population"&lang=fr
Notez que vous pouvez effectuer le test avec un export CSV pour voir si vous récupérez bien les jeux de données souhaités : https://public.opendatasoft.com/api/v2/catalog/exports/csv?where=publisher!="Opendatasoft"
Pour cette dernière étape, suivez la documentation sur data.gouv.fr : https://guides.data.gouv.fr/guide-data.gouv.fr/jeux-de-donnees/publier-un-jeu-de-donnees#publier-un-catalogue-de-donnees-existant-par-moissonnage (en français).
N'oubliez pas de sélectionner l'option de moissonnage DCAT.
Les métadonnées des jeux de données que vous avez référencés.
Des fichiers d'export pour les jeux de données que vous avez référencés. Pour tous les jeux de données, des exports CSV, XLSX et JSON seront disponibles en tant que ressources sur data.gouv.fr. Si le jeu de données contient des formes géographiques, l'export GeoJSON sera également disponible.
D'autres ressources. Si vous souhaitez ajouter d'autres fichiers à être disponibles en tant que ressources sur data.gouv.fr, vous pouvez les ajouter aux exportations alternatives de votre jeu de données (sous forme de fichier ou via URL).