Fichiers CSV
Vous pouvez utiliser un fichier CSV (.csv) comme source. Un fichier CSV contient une liste de champs séparés soit par un caractère ,
(généralement pour les fichiers en anglais) soit par un ;
caractère (généralement pour les fichiers français).
Vous pouvez également utiliser des types de fichiers similaires :
Fichiers de valeurs séparées par des tabulations (TSV) (.tsv)
Fichiers texte (.txt)
Fichiers DAT (.dat)
Création
Pour plus d'informations sur l'ajout d'une source de fichier, voir Récupération d'un fichier .
Configuration
Nom | Description | Utilisation |
Encodage de fichier | Encodage du fichier L'encodage des caractères est la façon dont les caractères sont représentés dans un fichier enregistré. Unicode (ou UTF-8) est la norme universelle, mais certains fichiers peuvent être encodés dans un format hérité (par exemple, les anciennes versions d'Excel), ce qui nécessiterait de définir l'encodage manuellement. Sur les logiciels modernes, cela est généralement inutile. | Par défaut, la plateforme utilise une heuristique pour déterminer l'encodage. Si l'encodage déterminé n'est pas le bon, sélectionnez celui approprié dans la liste ou saisissez-le dans la zone de texte Autre. Vous pouvez utiliser n'importe quel alias de Python . |
Nom | Description | Utilisation |
Séparateur de champs | Caractère utilisé pour séparer des champs | Entrez le séparateur dans la zone de texte. La valeur par défaut dépend du format de fichier. Les valeurs correctes sont généralement |
Caractère d'échappement | Si un caractère d'échappement est trouvé juste avant un séparateur, ce dernier ne sera plus considéré comme un séparateur. L'option de configuration du caractère d'échappement évite cette situation. | Par défaut, la zone de texte est vide. Si le fichier contient un caractère d'échappement (par exemple, |
Champs entre guillemets | Pour les champs dont les valeurs sont encadrées par des guillemets doubles. | Par défaut, cette option est activée. Désactivez l'option si les valeurs de champ ne sont pas entre guillemets doubles. |
Nom | Description | Utilisation |
Numéro de la première ligne | Pour les fichiers qui ne commencent pas dès la première ligne, vous pouvez définir quelle ligne doit être considérée comme telle. Les lignes précédentes seront ignorées du jeu de données. | Par défaut, le jeu de données commence à la ligne 1. Entrez le numéro de la ligne où commence le jeu de données. |
En-tête | Pour les fichiers dont la première ligne contient des noms de champs | Par défaut, cette option est activée. Les valeurs de la première ligne deviennent des labels de champs. Désactivez cette option si la première ligne ne contient pas de noms de champs mais des données : les labels de champs seront vides par défaut. |
Nom | Description | Utilisation |
Extraire le nom du fichier | Crée une nouvelle colonne avec le nom du fichier source. | Par défaut, cette option est désactivée. Activez cette option pour extraire le nom du fichier dans une colonne supplémentaire. |