Référencer ses jeux de données sur data.gouv.fr

Modifié

Cet article s'adresse aux producteurs de données français publiant leur données en open data sur une plateforme Opendatasoft, et qui souhaitent faire référencer leurs données sur https://www.data.gouv.fr afin d'en augmenter leur découvrabilité.

La méthode définie conjointement par les équipes Etalab et Opendatasoft s’appuie sur l’export DCAT Opendatasoft et le moissonneur DCAT côté data.gouv.fr

Les étapes à suivre sont les suivantes : 

  1. Remplissage des métadonnées pour chaque jeu de données

  2. Récupération de l’export DCAT pour sélectionner les jeux de données à publier

  3. Paramétrage du moissonneur sur le profil de l’Organisation sur data.gouv.fr

Prérequis : – Avoir un portail Opendatasoft configuré pour un accès autorisé aux utilisateurs anonymes– Avoir un profil “Organisation” sur data.gouv.fr

Etape 1 : Remplir les métadonnées

Tableau des métadonnées 

Les métadonnées à remplir sur vos jeux de données sur la plateforme Opendatasoft, et qui sont utilisées dans le calcul du score de qualité sur data.gouv.fr, sont listées ci-dessous :

Modèle de métadonnées ODS

Métadonnée ODS

Métadonnée data.gouv.fr

Règle de remplissage

Standard

Description

Description

Aucune

Standard

Licence

Licence

Pour une administration publique, Licence Ouverte version 2.0 ou ODC Open Database License (ODbL) version 1.0. Plus d'information ici.

DCAT

Fréquence de mise à jour

Fréquence

Une valeur parmi :

  • Triennal

  • Biennal

  • Annuelle

  • Deux fois par an

  • Trois fois par an

  • Trimestrielle

  • Bimestrielle

  • Mensuelle

  • Deux fois par mois

  • Toutes les deux semaines

  • Trois fois par mois

  • Hebdomadaire

  • Deux fois par semaine

  • Trois fois par semaine

  • Quotidienne

  • Continue

  • Sans régularité

DCAT

Début de couverture temporelle + Fin de couverture temporelle

Couverture temporelle

Remplir la date de début de couverture des données et la date de fin.

DCAT

Emplacement

Couverture territoriale

Cette métadonnée n’est pas récupérée aujourd’hui côté data.gouv.fr, il faudra l'ajouter sur chaque jeu de données côté data.gouv.fr

Etape 2 : Récupérer l'export DCAT

Option 1 : Publier toutes les données ouvertes du portail

Rendez-vous sur le catalogue de votre portail : [URL de votre portail]/explore.

Récupérer le lien d’export “RDF/XML (DCAT)” en bas des filtres à gauche de votre écran.

Faites un clic droit sur le lien et copiez-le. 

Option 2 : Publier un sous-ensemble de données

Cette option est à privilégier si vous ne souhaitez pas remonter toutes les données de votre portail, notamment en excluant la base SIRENE ou toute autre donnée publiée par des organismes tiers. Cette étape peut être assez technique, ainsi n’hésitez pas à contacter le support Opendatasoft si vous avez besoin d’assistance. 

Dans ce cas, il vous faudra créer l'URL d'export avec :

Des exemples de requête :

  1. Voici un exemple de requête pour récupérer l’export DCAT du portail https://public.opendatasoft.com en excluant le producteur “Opendatasoft” :
    https://public.opendatasoft.com/api/v2/catalog/exports/dcat?where=publisher!="Opendatasoft"

  2. Voici un exemple de requête pour récupérer l’export DCAT du portail https://public.opendatasoft.com en excluant le producteur “Opendatasoft” et en filtrant sur le mot-clé “Population” : https://public.opendatasoft.com/api/explore/v2.1/catalog/exports/dcat?where=publisher!="Opendatasoft" AND keyword="Population"&lang=fr

Vous pouvez faire le test avec l’export CSV pour voir si vous récupérez bien les jeux de données souhaités : https://public.opendatasoft.com/api/v2/catalog/exports/csv?where=publisher!="Opendatasoft

Créer le moissonneur sur data.gouv.fr

Pour cette étape, vous pouvez suivre la documentation disponible sur data.gouv.fr : https://guides.etalab.gouv.fr/data.gouv.fr/publier-jeu-de-donnees/#publier-un-catalogue-de-donnees-existant-par-moissonnage 

NB : Assurez-vous de bien choisir l’option du moissonnage DCAT.

Fichiers récupérés sur data.gouv.fr

Exports des jeux de données

Pour tous les jeux de données, les exports CSV, XLSX et JSON seront disponibles comme ressources sur data.gouv.fr. Si le jeu de données contient des formes géographiques, l’export GeoJSON sera aussi disponible. 

Vous pouvez également ajouter d'autres formats d'exports via la syntaxe en bleu ci-dessous :

https://public.opendatasoft.com/api/v2/catalog/exports/dcat?where=publisher!="Opendatasoft"&include_exports=csv,shp,geojson

La liste des formats disponibles est la suivante :

Autres ressources

Si vous souhaitez ajouter d’autres fichiers qui seront disponibles comme ressources sur data.gouv.fr, il y a deux options :

  • S'il s'agit de fichiers contenant des données (par exemple des formats non supportés par ODS, des fichiers respectant un certain schéma, ...) vous pouvez les ajouter dans les exports alternatifs de votre jeu de données (import de fichier ou via URL),

  • S'il s'agit de document de méthodologie, apportant du contexte au jeu de données, vous pouvez les importer en pièce jointe.