Premier pas avec Opendatasoft
Explorer et utiliser les données
Explorer le catalogue et les jeux de données
Explorer un catalogue de jeux de données
Contenu d'un jeu de données
Filtrer des données dans un jeu de données
Introduction à l'API Explore
Introduction à l'API Automation
Présentation de l'API WFS
Télécharger un jeu de données
Recherchez vos données avec l'IA (recherche vectorielle)
La fonctionnalité Explorer les données avec l'IA
Créer des cartes et des graphiques
Création de graphiques avancés avec l'outil Graphiques
Présentation de l'interface Cartes
Configurez votre carte
Gérez vos cartes
Réorganiser et regrouper les couches dans une carte
Création de cartes multicouches
Partagez votre carte
Navigation dans les cartes créées avec le créateur de Cartes
Renommer et enregistrer une carte
Créer des pages avec l'éditeur de code
Archivage d'une page
Gérer la sécurité d'une page
Créer une page avec l'éditeur de code
Pages de contenu : idées, conseils et ressources
Comment insérer des liens internes sur une page ou créer une table des matières
Partager et intégrer une page de contenu
Comment dépanner les cartes qui ne se chargent pas correctement
Créer des pages avec le Studio
Créer du contenu avec Studio
Ajouter une page
Publier une page
Modifier la mise en page
Configurer des blocs
Aperçu d'une page
Ajouter du texte
Ajout d'un graphique
Ajouter un bloc image à une page Studio
Ajouter un bloc de carte dans Studio
Ajouter un bloc de carte choroplèthe dans Studio
Ajout d'un bloc de carte de points d'intérêt dans Studio
Ajouter un indicateur clé de performance (KPI)
Configurer les informations d'une page
Utiliser des filtres pour améliorer vos pages
Affiner les données
Gérer l'accès aux pages
Comment modifier l'url d'une page Studio
Intégrer une page Studio dans un CMS
Les visualisations
Gérer les visualisations sauvegardées
Configurer la visualisation Calendrier
Explorer les différentes visualisations d'un jeu de données
Configurer la visualisation Images
Configurer la vue personnalisée
Configurer la visualisation Tableau
Configurer la visualisation Carte
Comprendre le regroupement automatique dans les cartes
Configurer la visualisation Analyse
Publier des données
Publier vos jeux de données
Créer un jeu de données
Créer un jeu de données à partir d'un fichier local
Créer un jeu de données avec plusieurs fichiers
Création d'un jeu de données à l'aide de connecteurs dédiés à des services distants spécifiques
Créer un jeu de données avec des fichiers multimédias
Fédérer un jeu de données Opendatasoft
Publier un jeu de données
Publication de données à partir d'un fichier CSV
Formats de fichiers pris en charge
Valorisez les données de mobilité grâce au GTFS et autres formats
Gérer les configurations de vos jeux de données
Suppression automatique des enregistrements
Configuration de l'export de jeux de données
Consulter l'historique du jeu de données
Configurer l'info-bulle
Actions et états des jeux de données
Limites des jeux de données
Définir un modèle de données
Comment Opendatasoft gère les dates
Comment et où Opendatasoft gère les fuseaux horaires
Comment trouver l'adresse IP de votre espace de travail
Maintenir les données à jour
Traiter des données
Traduire un jeu de données
Comment configurer une connexion HTTP à l'API de France Travail
Décider quelle licence convient le mieux à votre jeu de données
Formats de fichier source
Fichiers OpenStreetMap
Shapefiles
Fichiers JSON
Fichiers XML
Fichiers de feuille de calcul
Fichiers RDF
Fichiers CSV
Fichiers MapInfo
Fichiers GeoJSON
Fichiers KML
GeoPackage
Les connecteurs
Sauvegarde et partage de connexions
Connecteur Airtable
Connecteur Amazon S3
Connecteur ArcGIS
Connecteur Connecteur Azure Blob Storage
Connecteurs de base de données
Connecteur Jeu de données de jeux de données (espace de travail)
Connecteur Eco Counter
Connecteur Feed
Connecteur Google BigQuery
Connecteur Google Drive
Comment trouver la clé API Open Agenda et l'URL Open Agenda
Connecteur JCDecaux
Connecteur Netatmo
Connecteur OpenAgenda
Connecteur Realtime
Connecteur Salesforce
Connecteur SharePoint
Connecteur US Census
Connecteur WFS
Connecteur Databricks
Connecteur Waze
Les moissonneurs
Moissonner un catalogue
Moissonneur ArcGIS
Moissonneur ArcGis Hub Portals
Moissonneur CKAN
Moissonneur CSW
Moissonneur FTP avec CSV de métadonnées
Moissonneur Fédération Opendatasoft
Moissonneur Quandl
Moissonneur Socrata
Moissonneur data.gouv.fr
Moissonneur data.json
Les processeurs
Qu'est-ce qu'un processeur et comment l'utiliser ?
Processeur Ajouter un Champ
Processeur Calculer la distance géographique
Processeur Concaténer du texte
Processeur Convertir des degrés
Processeur Copier un Champ
Processeur Corriger les formes géographiques
Processeur Créer un point géo
Processeur Décoder les entités HTML
Processeur Décoder un polyline Google
Processeur Dédupliquer des champs multivalués
Processeur Supprimer un enregistrement
Processeur Déplier le tableau JSON
Processeur Déplier les champs à valeur multiples
Processeur Expression
Processeur Extraire du HTML
Processeur Extraire les URLs
Processeur Extraire la plage de bits
Processeur Extraire d'un objet JSON
Processeur Extraire du texte
Processeur Fichier
Processeur GeoHash en GeoJSON
Processeur de jointure géographique
Processeur Géocoder avec ArcGIS
Processeur Géocoder avec la BAN (France)
Processeur Géocoder avec PDOK
Processeur Géocoder avec le Census Bureau (États-Unis)
Processeur Masquage géographique
Processeur Récupérer les coordonnées d'une adresse 3 mots
Processeur Adresse IP vers Coordonnées Géo
Processeur Tableau JSON vers multivalué
Processeur Joindre des jeux de données
Processeur Méta-expression
Processeur Géocodeur Nominatim
Processeur Normaliser le Système de Projection
Processeur Normaliser une URL
Processeur Normaliser les valeurs Unicode
Processeur Normaliser une date
Processeur Filtrage du polygone
Processeur Remplacer le texte
Processeur Remplacer avec une expression régulière
Processeur Récupérer les divisions administratives
Processeur Définir le fuseau horaire
Processeur Simplifier les formes géo
Processeur Ignorer les enregistrements
Processeur Séparer le texte
Processeur Transformer des colonnes de booléens en champs multivalués
Processeur Transposer des colonnes en lignes
Processeur WKT et WKB en GeoJSON
Processeur what3words
La fonctionalité Formulaire de Collecte de Données
À propos de la fonctionnalité Formulaire de Collecte de Données
Formulaires de collecte de données associé à votre espace de travail Opendatasoft
Créez et gérez vos formulaires de collecte de données
Partager et modérer vos formulaires de collecte de données
Metadonnées des jeux de données
Analyser l'utilisation de mes données
S'impliquer : partager, réutiliser et réagir
Découvrir et soumettre des réutilisations de données
Partage via les réseaux sociaux
Commenter via Disqus
Suivre les mises à jour d'un jeu de données
Partage et intégration de visualisations de données
Statistiques d'utilisation
Introduction à l'utilisation des statistiques de vos espaces de travail
Analyser l'activité des utilisateurs
Analyser les actions
Détails sur les champs spécifiques du jeu de données ods-api-monitoring
Comment compter les téléchargements d'un jeu de données sur une période spécifique
Analyser l'utilisation des données
Analyser l'utilisation des jeux de données
Analyser l'activité du back office
Utilisation de la fonctionnalité de lignage des données
Gérer les groupes et utilisateurs
Gérer les limites
Gérer les utilisateurs
Gestion des utilisateurs
Définition de quotas pour des utilisateurs individuels
Gérer les demandes d'accès
Inviter des utilisateurs sur le portail
Gérer les espaces de travail
Gérer mon portail
Configurer mon portail
Configurer les pages du catalogue et du jeu de données
Configuration d'un catalogue partagé
Partager, réutiliser, communiquer
Personnaliser l'URL de votre espace de travail
Gestion des informations juridiques
Connecter Google Analytics (GA4)
Paramètres régionaux
Gérer le suivi
Bonnes pratiques pour l'optimisation des moteurs de recherche (SEO)
Navigabilité et apparence
Personnaliser votre portail
Personnalisation des thèmes du portail
Comment personnaliser mon portail selon la langue courante
Gérer les thèmes du jeu de données
Configurer les visualisations de données
Configurer la navigation
Ajouter des ressources
License et quotas
Monitoring de la licence et des quotas de votre espace de travail
Licences et quotas de votre espace de travail
Gérer la sécurité
Configurer la politique de sécurité générale de votre portail
L'onglet Sécurité d'un jeu de données
Mapping de vos groupes Opendatasoft avec votre annuaire (via SSO)
Authentification unique (SSO) avec OpenID Connect
Authentification unique (SSO) avec SAML
Paramètres
Langues prises en charge par Opendatasoft
Configuration des paramètres du compte
Gestion des identités
Comprendre les notifications reçues avec vos autorisations
Gestion des notifications
Gestion des clés API
Accessibilité chez Opendatasoft
Enregistrement des applications
Vérification du quota du compte
- Home
- Explorer et utiliser les données
- Explorer le catalogue et les jeux de données
- La fonctionnalité Explorer les données avec l'IA
La fonctionnalité Explorer les données avec l'IA
Mis à jour le par Patrick Smith
Opendatasoft a déjà commencé à exploiter la puissance de l'IA pour permettre aux utilisateurs d'effectuer de nouvelles tâches ou de rendre les tâches existantes plus faciles et plus rapides. Dans cet esprit, nous avons lancé une fonctionnalité appelée « Explorer les données avec l'IA ».
L'exploration des données avec l'IA est conçue pour vous permettre de poser des questions simples en langage naturel à n'importe quel jeu de données, et même d'obtenir des visualisations rapides en fonction des résultats. Vous pouvez l'utiliser pour interroger rapidement un jeu de données et pour vérifier que le jeu de données contient ce dont vous avez besoin.
Pour tirer le meilleur parti de cette fonctionnalité, il est utile de garder quelques éléments à l’esprit.
Quelques principes et bonnes pratiques
- Utilisez des requêtes en langage naturel, simples et sans ambiguïté. Si cela peut dérouter un humain, il est peu probable que le robot fasse mieux !
- Le bot est limité par ce qui se trouve réellement dans le jeu de données et par le schéma du jeu de données. Par exemple, cela signifie que le bot ne peut pas créer de carte sans données géographiques réelles. Mais cela signifie également que si votre requête utilise des termes rares ou absents de l'ensemble de données, le bot peut avoir du mal à répondre correctement à votre requête.
- Utilisez le bouton Afficher le raisonnement pour comprendre ou vérifier la réponse qui vous a été donnée.
- Le bot peut actuellement afficher des informations de quatre manières différentes : sous forme de nombre unique, de graphique à colonnes, de graphique linéaire ou de carte de points d'intérêt. Il peut être utile de spécifier celui que vous souhaitez.
- Le bot peut généralement exécuter les fonctions suivantes : compter le nombre total d'enregistrements, le nombre d'enregistrements distincts, renvoyer une valeur minimale ou maximale, effectuer des sommes ou renvoyer une valeur moyenne ou médiane.
Plus en détail
- Utilisez des requêtes en langage naturel et gardez-les simples et sans ambiguïté.
Dans une conversation, nous pouvons parfois deviner le sens d'une question ambiguë, mais il arrive parfois que la formulation soit tout simplement floue. Par exemple, si quelqu'un demande « Afficher les dépenses et les revenus par service lorsque les revenus sont supérieurs à 1 million de dollars », il se peut que l'on ne sache pas si « lorsque les revenus sont supérieurs à 1 million de dollars » se réfère uniquement aux revenus ou s'applique aux dépenses.
Il est probable que le robot suppose que vous souhaitez que cela s'applique aux deux. N'oubliez donc pas que vous aurez plus de succès si vos demandes sont simples et claires. - Le bot est limité par ce qui se trouve réellement dans le jeu de données et par le schéma du jeu de données.
Comme indiqué ci-dessus, cela signifie par exemple que le robot ne peut pas créer de carte sans données géographiques réelles. Il en va de même pour les nombres ou les dates. Les données doivent avoir le type approprié et être correctement formatées pour que le robot puisse réaliser la visualisation pertinente.Notez que certaines données peuvent sembler seulement cartographiables. Un jeu de données peut être organisé par ville, et donc avoir une colonne avec les noms des villes, mais ne pas fournir de données géographiques réelles. Imaginez que « Paris » soit l'une de ces villes. Paris, en France, n'est en fait pas le seul « Paris » au monde. Le Paris voulu peut sembler évident, mais le bot ne peut tout simplement pas inventer des détails que le jeu de données n'inclut pas déjà.Cela signifie également que si votre requête utilise des termes rares ou absents de l'ensemble de données, le robot peut avoir du mal à répondre de manière appropriée à votre requête. Il peut donc être utile d'examiner les données elles-mêmes et d'ajuster votre requête en conséquence. Il faudra peut-être plusieurs essais avant de trouver la formulation suffisamment précise pour que le robot la comprenne.Exemples :
Par exemple, le jeu de données All Vehicles Model, un ensemble de données collectées par l'Agence américaine de protection de l'environnement, répertorie plus de 47 000 véhicules avec des informations sur leur type de carburant et leur efficacité. Nous pourrions vouloir savoir combien de modèles sont hybrides, et donc demander « Combien de véhicules hybrides y a-t-il dans l'ensemble de données ? »Le bot échoue
Comme vous pouvez le voir ci-dessous, bien qu'il y ait en fait des hybrides dans l'ensemble de données, le robot a renvoyé 0. Lorsque nous examinons son raisonnement, nous pouvons comprendre pourquoi. Bien qu'après examen, la colonne « Type de carburant » soit effectivement l'endroit où se trouve la réponse, le robot cherchait apparemment la valeur « Hybrid » alors qu'en fait la valeur pertinente est « Electricity ».Dans les données, nous pouvons voir que « Electricity » est répertorié soit seul, pour les voitures entièrement électriques, soit avec un autre type de carburant, dans le cas des hybrides.Rester simple
Voyons si nous pouvons obtenir le nombre total de véhicules électriques, à la fois entièrement électriques et hybrides. Nous pourrions demander : « Combien de véhicules ont un type de carburant qui contient de l'électricité ? » Et la réponse est : 1,108.Et qu'en est-il des véhicules entièrement électriques ? Si nous demandons : « Combien de véhicules ont un type de carburant qui ne contient que de l'électricité ? », nous obtenons la réponse : 766.Une soustraction rapide, et nous concluons qu’il y a 342 hybrides.Une méthode plus directe
Nous risquons de confondre le robot, mais nous pouvons essayer d'obtenir la réponse directement en demandant quelque chose comme : « Combien de véhicules ont un type de carburant qui contient de l'électricité mais qui n'est pas égal à de l'électricité ? » Et ici nous obtenons également notre réponse : 342. - Assurez-vous de jeter un œil au bouton Afficher le raisonnement pour comprendre ou vérifier la réponse qui vous a été donnée.
Comme on peut le voir dans les exemples ci-dessus, les informations fournies ici peuvent être essentielles si vous souhaitez avoir un aperçu de ce que fait le bot ou potentiellement de ce qui manque à l'ensemble de données. - Le bot peut actuellement afficher des informations de quatre manières différentes : sous forme de nombre unique, de graphique à colonnes, de graphique linéaire ou de carte de points d'intérêt. Si vous pouvez nous aider à préciser lequel vous souhaitez.Notez que cela signifie que vous ne pouvez pas poser au robot une question par oui ou par non, du moins pas directement. Par exemple, imaginez que vous disposez d'un ensemble de données sur les parkings, leurs capacités et le nombre de places de parking actuellement occupées. Vous souhaitez savoir s'il existe actuellement des parkings à pleine capacité. Ainsi, au lieu de demander s'il y a des parkings pleins, vous pouvez demander combien il y en a. Si la réponse est « 12 », vous avez à la fois la réponse à votre question initiale (oui, il y en a), mais vous savez également combien !Notez que les cartes ne peuvent afficher qu'un seul type de point de données à la fois. Cependant, vous pouvez demander que chaque point de données inclue des informations spécifiques de l'ensemble de données. Par exemple, si vous souhaitez cartographier les parkings de l'astuce ci-dessus, vous ne pouvez pas demander que les parkings complets soient indiqués d'une manière différente. Cependant, vous pouvez demander que le nombre de places restantes (en supposant que cette colonne existe) soit inclus lorsque vous cliquez sur un point donné de la carte.
Il en va de même pour une réponse sous forme de mot ou de mots. Si vous souhaitez savoir quelle taille de chaussures est la plus populaire dans votre ensemble de données de magasin de chaussures, vous ne poserez pas cette question directement. Au lieu de cela, demandez-lui de représenter graphiquement les tailles par nombre vendu. Non seulement vous verrez quelle taille a la barre la plus grande, mais vous aurez également une idée de la distribution dans les données !
Un exemple de graphique à colonnes :Un exemple de carte : - Le bot peut généralement exécuter les fonctions suivantes : compter le nombre total d'enregistrements, le nombre d'enregistrements distincts, renvoyer une valeur minimale ou maximale, effectuer des sommes ou renvoyer une valeur moyenne ou médiane.
Notez que vous pouvez regrouper ou trier vos résultats, et qu'il est utile de spécifier la colonne à utiliser pour le faire.