Créer un jeu de données avec plusieurs fichiers
Vous pouvez ajouter plusieurs fichiers source à un jeu de données selon les méthodes suivantes :
Ajouter chaque fichier un par un
Ajouter plusieurs fichiers en même temps via un fichier d'archive
Ajouter plusieurs fichiers via un serveur FTP
Notez que la taille limite d'un fichier est de 240 Mo. Si vos fichiers sont trop volumineux, vous pouvez les compresser. Pour plus d'informations sur les formats de fichiers compressés ou non compressés, consultez Formats de fichiers pris en charge.
Collecte des fichiers un par un
Cette méthode consiste à ajouter un à un des fichiers dans la plateforme, en créant autant de sources que de fichiers ajoutés. Dans ce cas, comme une nouvelle source est créée pour chaque fichier ajouté, ceux-ci peuvent avoir des formats différents.
Pour plus d'informations, consultez nos formats de fichiers pris en charge.
Lors du téléchargement de fichiers un par un, le premier fichier à ajouter détermine le schéma des données.Si les fichiers suivants contiennent des champs qui ne correspondent pas à ceux du premier fichier, ils seront ignorés par la plateforme.
Créer un jeu de données en utilisant votre premier fichier comme source
Dans l'onglet Sources du jeu de données, cliquez sur le bouton Ajouter une source
Ajouter le fichier suivant
Soyez prudent lorsque vous supprimez des fichiers d'un jeu de données créé avec plusieurs fichiers, en particulier ceux avec des schémas de données différents. Si le premier fichier est supprimé, tout le jeu de données apparaîtra comme vide.
Collecte de plusieurs fichiers dans une archive
Cette méthode consiste à ajouter plusieurs fichiers en même temps via un fichier d'archive, créant une source unique pour tous les fichiers ajoutés. Dans ce cas, comme une seule source est créée pour tous les fichiers, ceux-ci doivent avoir le même format.
Pour plus d'informations, voir Formats pris en charge.
Avec cette méthode, la plateforme choisit le fichier avec la date de modification la plus ancienne pour déterminer le schéma de données.
Créez un fichier d'archive avec les fichiers à ajouter au même jeu de données.
Dans Catalogue > Jeux de données, cliquez sur le bouton Nouveau jeu de données.
Ajoutez le fichier d'archive en tant que source, en utilisant l'une des trois méthodes disponibles dans la section Récupérer un fichier. Pour plus d'informations, voir Récupérer un fichier de votre ordinateur, une URL ou un serveur FTP.
À partir de l'aperçu des 20 premiers enregistrements, configurez la source.
Configurez les informations du jeu de données ou utilisez les valeurs préremplies.
Collecte de plusieurs fichiers stockés sur un serveur FTP
Cette méthode consiste à connecter la plateforme au répertoire d'un serveur FTP afin de récupérer tous les fichiers contenus dans ce répertoire.
Tous les fichiers du répertoire doivent avoir le même format et le même schéma (par exemple, les fichiers CSV avec les mêmes titres de colonne). Notez également que si l'URL pointe vers un répertoire contenant un fichier compressé, ce dernier sera importé dans la plateforme tel quel et ne sera pas décompressé.
Dans Catalogue > Jeux de données, cliquez sur le bouton Nouveau jeu de données.
Dans l'assistant qui s'ouvre, sélectionnez À partir d'un serveur FTP dans la section Récupérer un fichier.
Configurez votre connexion FTP.
Les serveurs FTPS sont pris en charge pour cette méthode (par exemple, ftps://login:password@example.org/my_directory/my_dataset ).
Lors de la synchronisation à partir d'un emplacement FTP distant, Opendatasoft conserve un cache persistant et ne supprime pas automatiquement les fichiers manquants dans le répertoire distant. Si vous avez besoin d'effectuer un nettoyage, à droite de la ressource, cliquez sur Nettoyer le cache.
À partir de l'aperçu des 20 premiers enregistrements, configurez la source.
Configurez les informations du jeu de données ou utilisez les valeurs préremplies.
Notez que lorsque vous téléchargez des fichiers dans ce dossier FTP, seules les données des nouveaux fichiers seront prises en compte et chargées.