Référencer ses jeux de données sur data.gouv.fr

Modifié le mois dernier

Cet article a été rédigé pour les producteurs de données ouvertes françaises qui les publient sur la plateforme Opendatasoft, mais qui souhaitent également que leurs données soient référencées sur https://www.data.gouv.fr afin d'augmenter leur découvrabilité.

La méthode définie conjointement par les équipes d'Etalab et d'Opendatasoft est basée sur l'export DCAT d'Opendatasoft et le moissonneur DCAT de data.gouv.fr.

Les étapes à suivre sont les suivantes :

  1. Remplir les métadonnées pour chaque jeu de données

  2. Copier le lien d'export DCAT, après avoir sélectionné les jeux de données à publier

  3. Configurer le moissonneur dans le profil de votre organisation sur data.gouv.fr

Prérequis :
- Un portail Opendatasoft configuré pour permettre aux utilisateurs anonymes
- Un profil "Organisation" sur data.gouv.fr

Étape 1 : Remplir les métadonnées

Métadonnées à remplir

Dans Opendatasoft, les métadonnées que vous devez remplir pour vos jeux de données — et qui sont utilisées pour calculer le score de qualité sur data.gouv.fr — sont listées ci-dessous :

Modèle de métadonnées ODS

Champ de métadonnées ODS

Champ de métadonnées correspondant sur data.gouv.fr

Comment le remplir

Standard

Description

Description

Standard

Licence

Licence

Pour une administration publique, ces licences sont recommandées : Licence Ouverte version 2.0 ou Licence de base de données ouverte ODC (ODbL) version 1.0. Pour plus d'informations, voir ici (en français).

DCAT

Périodicité d'accumulation

Fréquence

Une des valeurs suivantes :

  • Triennal

  • Biennal

  • Annuel

  • Deux fois par an

  • Trois fois par an

  • Trimestriel

  • Bimestriel

  • Mensuel

  • Deux fois par mois

  • Toutes les deux semaines

  • Trois fois par mois

  • Hebdomadaire

  • Deux fois par semaine

  • Trois fois par semaine

  • Quotidien

  • Continu

  • Sans régularité

DCAT

Date de début de couverture temporelle + Date de fin de couverture temporelle

Couverture temporelle

Remplissez les dates de début et de fin pour les données.

DCAT

Spatial

Couverture territoriale

Cette métadonnée n'est actuellement pas récupérée par data.gouv.fr, elle doit donc être ajoutée individuellement à chaque jeu de données sur le côté de data.gouv.fr.

Étape 2 : Créer le lien d'export DCAT

Option 1 : Référencer tous les jeux de données de votre portail

Allez dans le catalogue de votre portail (<l'URL de votre portail>/explore).

Trouvez le lien d'export "RDF/XML (DCAT)" en bas à gauche de votre écran.

Cliquez avec le bouton droit sur le lien pour le copier. C'est ce que vous utiliserez lors de la configuration du moissonneur sur data.gouv.fr.

Option 2 : Référencer un sous-ensemble de vos données

Cette option est préférable si vous ne souhaitez pas référencer tous les jeux de données de votre portail. Par exemple, vous pouvez souhaiter exclure la base de données SIRENE ou d'autres données publiées par des organisations tierces. Cette étape peut être assez technique, donc n'hésitez pas à contacter le support d'Opendatasoft si vous avez besoin d'aide.

Dans ce cas, vous devrez créer l'URL d'export avec :

  • La racine <l'URL de votre portail>/api/v2/catalog/exports/dcat

  • Plus les paramètres pour filtrer l'export, basés sur la syntaxe ODSQL (langage de requête API d'Opendatasoft)

Le lien résultant est ce que vous utiliserez lors de la configuration du moissonneur sur data.gouv.fr.

Exemples :

  1. Voici un exemple de requête pour récupérer l'export DCAT du portail https://public.opendatasoft.com, en excluant le producteur "Opendatasoft" :
    https://public.opendatasoft.com/api/v2/catalog/exports/dcat?where=publisher!="Opendatasoft"

  2. Voici un exemple de requête pour récupérer l'export DCAT du portail https://public.opendatasoft.com, en excluant le producteur "Opendatasoft" et en filtrant sur le mot-clé "Population" :
    https://public.opendatasoft.com/api/explore/v2.1/catalog/exports/dcat?where=publisher!="Opendatasoft" AND keyword="Population"&lang=fr

Notez que vous pouvez effectuer le test avec un export CSV pour voir si vous récupérez bien les jeux de données souhaités : https://public.opendatasoft.com/api/v2/catalog/exports/csv?where=publisher!="Opendatasoft"

Créer le moissonneur sur data.gouv.fr

Pour cette dernière étape, suivez la documentation sur data.gouv.fr : https://guides.data.gouv.fr/guide-data.gouv.fr/jeux-de-donnees/publier-un-jeu-de-donnees#publier-un-catalogue-de-donnees-existant-par-moissonnage (en français).

N'oubliez pas de sélectionner l'option de moissonnage DCAT.

Une fois terminé, que sera disponible sur data.gouv.fr ?

  • Les métadonnées des jeux de données que vous avez référencés.

  • Des fichiers d'export pour les jeux de données que vous avez référencés. Pour tous les jeux de données, des exports CSV, XLSX et JSON seront disponibles en tant que ressources sur data.gouv.fr. Si le jeu de données contient des formes géographiques, l'export GeoJSON sera également disponible.

  • D'autres ressources. Si vous souhaitez ajouter d'autres fichiers à être disponibles en tant que ressources sur data.gouv.fr, vous pouvez les ajouter aux exportations alternatives de votre jeu de données (sous forme de fichier ou via URL).