Créer un jeu de données avec plusieurs fichiers

Patrick Smith Mis à jour le par Patrick Smith

Vous pouvez ajouter plusieurs fichiers source à un jeu de données selon les méthodes suivantes :

  • Ajouter chaque fichier un par un
  • Ajouter plusieurs fichiers en même temps via un fichier d'archive
  • Ajouter plusieurs fichiers via un serveur FTP

Collecte des fichiers un par un

Cette méthode consiste à ajouter un à un des fichiers dans la plateforme, en créant autant de sources que de fichiers ajoutés. Dans ce cas, comme une nouvelle source est créée pour chaque fichier ajouté, ceux-ci peuvent avoir des formats différents.

Pour plus d'informations, consultez nos formats de fichiers pris en charge .

Lors du téléchargement de fichiers un par un, le premier fichier à ajouter détermine le schéma des données.

Si les fichiers suivants contiennent des champs qui ne correspondent pas à ceux du premier fichier, ils seront ignorés par la plateforme.
  1. Créer un jeu de données en utilisant votre premier fichier comme source
  2. Dans l'onglet Sources du jeu de données, cliquez sur le bouton Ajouter une source
  3. Ajouter le fichier suivant
Soyez prudent lorsque vous supprimez des fichiers d'un jeu de données créé avec plusieurs fichiers, en particulier ceux avec des schémas de données différents. Si le premier fichier est supprimé, tout le jeu de données apparaîtra comme vide.

Collecte de plusieurs fichiers dans une archive

Cette méthode consiste à ajouter plusieurs fichiers en même temps via un fichier d'archive, créant une source unique pour tous les fichiers ajoutés. Dans ce cas, comme une seule source est créée pour tous les fichiers, ceux-ci doivent avoir le même format.

Pour plus d'informations, voir Formats pris en charge .

Avec cette méthode, la plateforme choisit le fichier avec la date de modification la plus ancienne pour déterminer le schéma de données.
  1. Créez un fichier d'archive avec les fichiers à ajouter au même jeu de données.
  2. Dans Catalogue > Jeux de données , cliquez sur le bouton Nouveau jeu de données .
  3. Ajoutez le fichier d'archive en tant que source, en utilisant l'une des trois méthodes disponibles dans la section Récupérer un fichier . Pour plus d'informations, voir Récupérer un fichier de votre ordinateur, une URL ou un serveur FTP .
  4. À partir de l'aperçu des 20 premiers enregistrements, configurez la source.
  5. Configurez les informations du jeu de données ou utilisez les valeurs préremplies.

Collecte de plusieurs fichiers stockés sur un serveur FTP

Cette méthode consiste à connecter la plateforme au répertoire d'un serveur FTP afin de récupérer tous les fichiers contenus dans ce répertoire.

Tous les fichiers du répertoire doivent avoir le même format et le même schéma (par exemple, les fichiers CSV avec les mêmes titres de colonne). Notez également que si l'URL pointe vers un répertoire contenant un fichier compressé, ce dernier sera importé dans la plateforme tel quel et ne sera pas décompressé.
  1. Dans Catalogue > Jeux de données , cliquez sur le bouton Nouveau jeu de données .
  2. Dans l'assistant qui s'ouvre, sélectionnez À partir d'un serveur FTP dans la section Récupérer un fichier .
  3. Configurez votre connexion FTP.
    • Les serveurs FTPS sont pris en charge pour cette méthode (par exemple, ftps://login:password@example.org/my_directory/my_dataset ).
    • Lors de la synchronisation à partir d'un emplacement FTP distant, Opendatasoft conserve un cache persistant et ne supprime pas automatiquement les fichiers manquants dans le répertoire distant. Si vous avez besoin d'effectuer un nettoyage, à droite de la ressource, cliquez sur Nettoyer le cache .
  4. À partir de l'aperçu des 20 premiers enregistrements, configurez la source.
  5. Configurez les informations du jeu de données ou utilisez les valeurs préremplies.
Notez que lorsque vous téléchargez des fichiers dans ce dossier FTP, seules les données des nouveaux fichiers seront prises en compte et chargées.

Êtes-vous satisfait ?

Créer un jeu de données à partir d'un fichier local

Création d'un jeu de données à l'aide de connecteurs dédiés à des services distants spécifiques

Table des matières

Contactez-nous

Powered by HelpDocs (opens in a new tab)