ChatGPT 4.0 analyse un jeu de données

Dans cet article tutoriel, je vous montrais comment trouver et explorer votre premier jeu de données en open data jusqu’à faire un graphique avec les données choisies dans un tableur. Mais saviez-vous que ChatGPT peut aussi vous aider à analyser ce même jeu de données ?

Le prompt ChatGPT 4.0 pour analyser un csv de données

Franchement, autant il y a parfois des prompts un peu compliqués à faire, autant là il suffit de pas grand chose. Voici le prompt tout simple que je vous propose :

  • Cliquez sur le trombone pour uploader / charger votre fichier CSV
  • En-dessous, écrivez votre demande en langage naturel (c’est un peu le but), par exemple : « Voici un fichier csv. Lis-le et dis-moi combien d’auto-entrepreneurs il y a par secteur d’activité au 2nd trimestre 2023. »

Dans sa réponse, ChatGPT (que je vais finir par renommer « le fainéant ») me donne une analyse digne d’un stagiaire de 6ème et seulement quelques exemples qui ne me servent à rien :

Améliorer la réponse et l’analyse de ChatGPT

On va donc lui mettre les points sur les i avec le prompt suivant :

Ca y est, il me donne la liste complète et j’aimerais la comparer à mon tableur (cf. l’autre article) pour m’assurer qu’il a bien examiné les bonnes données. Pour me faciliter la tâche, je vais lui demander une dernière chose : de refaire une liste bien triée avec ce prompt :

Notez le « stp » à la fin. Oui je fais partie de ces gens qui, par habitude, sont polis même avec les algorithmes lol. N’empêche qu’il me fournit enfin la liste parfaite, facile à comparer :

Toujours vérifier les réponses de ChatGPT

Horreur et désespoir ! Un simple coup d’oeil suffit pour comprendre que ChatGPT m’a fourni une liste des secteurs d’activité avec pour chaque secteur le nombre d’auto-entrepreneurs immatriculés (nouveaux) au 2nd trimestre 2023. Alors que je voulais lui demander le nombre d’AE économiquement actifs (colonne jaune)…

Voyons si nous pouvons enfin obtenir ce que nous voulons avec ce nouveau prompt :

Notez que j’ai fait 2 erreurs, d’une en ne précisant pas quel type d’auto-entrepreneurs je voulais compter, et de deux en lui parlant de 2nd semestre alors que la colonne s’appelle « trimestre » (du coup, je ne comprend pas trop pourquoi le jeu de données n’avait pas les trimestres 3 et 4 mais passons). Je lui précise ma nouvelle demande bien plus précisément en n’oubliant pas de demander une liste complète pour éviter l’étape où il ne me donnerait que quelques exemples bien sûr.

Le résultat est enfin parfait et concorde avec mon tableur :

Alors l’analyse d’un dataset par ChatGPT 4.0 ?

Temps passé

Franchement ? Je ne suis pas sûre d’avoir pris moins de temps avec ChatGPT 4.0 qu’en allant télécharger le .csv, en l’important dans un Google Sheet et en faisant quelques tris simples (en fait, je suis sûre que non). Comme quoi !

Facilité

A la limite, si quelqu’un ne sait pas utiliser un tableur, pourquoi pas demander à ChatGPT ? J’ai cependant peur que la personne ne voit pas l’erreur dans sa réponse finale si elle n’a pas vu les données sous forme de tableau filtré avant pour pouvoir comparer… De plus, même si je suis maintenant habituée à écrire des prompts à peu près clairs, ça ne m’a pas empêchée de me tromper et de ne pas obtenir tout de suite le bon résultat.

D’autres outils IA pour l’analyse de données

J’ai testé récemment plusieurs outils comme Graphy ou Tomat.ai pour faire du traitement de jeux de données et un peu de datavisualisation. Certains proposent maintenant une fonction « Insights » qui va permettre d’avoir des éléments d’interprétation créés par une IA générative (souvent ChatGPT d’ailleurs). Ce n’est pas fou, loin de là (pour le moment !), et souvent ce ne sont que des banalités.

Si vous voulez tester gratuitement, l’outil Chartpixel vous montre quelques dataviz et insights générés par IA sur les statistiques des passagers du Titanic comme exemple :

Conclusion : pour l’instant, je ne suis pas convaincue par ChatGPT ni par ces outils mais il faut que j’explore un peu plus donc je vous en reparlerai certainement. L’analyse de data assistée par IA générative est à mon avis un marché porteur, à voir si les outils seront réellement utilisables ET utilisés ! 🙂

Qu’en pensez-vous ? Avez-vous testé ? Etes-vous plus convaincus que moi ? Dites-moi tout en commentaires !!! 😀

LEAVE A RESPONSE

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *