Données agrométéorologiques, la météo en open data

Bonne nouvelle ! Depuis le 1er janvier 2024, on accède gratuitement aux données publiques de Météo France sur meteo.data.gouv.fr. Bien sûr je n’ai pas pu m’empêcher d’aller y chercher un petit jeu de données météo récemment mis à jour et intéressant. J’ai choisi les données agrométéorologiques de la Vendée sur 2023-2024 (sachant qu’il y a aussi un jeu pour la période 1950-2022). J’avoue cependant que je ne m’attendais pas à ne rien comprendre aux intitulés des colonnes… alors je vous propose de décrypter ensemble et d’analyser un peu ces données pour percevoir leur utilité.

D’où viennent ces données météo en Vendée ?

Les données météo du 85 proviennent de la vingtaine de stations Météo France installées en Vendée. Il y a bien sûr un jeu de données sur ça aussi et des fiches de poste sur chaque station (liens sur l’ID ci-dessous). Elles sont très complètes : localisation, ancienneté, qualité du site, instruments et mesures possibles, photos, etc.

Cliquez sur la carte pour avoir la position de toutes les stations Météo France du pays
IDNom usuel
85004001ANGLES
85005001ANTIGNY
85051001CHANTONNAY
85060002CHATEAU-D’OLONNE
85092004FONTENAY
85097001LA-GAUBRETIERE_SAPC
85104001GRUES
85109001LES HERBIERS
85113001L ILE D YEU
85152001LA MOTHE ACHARD
85153002MOUCHAMPS_SAPC
85163001NOIRMOUTIER EN
85169002PALLUAU
85172001LE PERRIER
85182004POUZAUGES SA
85190001ROCHESERVIERE
85191003LA ROCHE SUR YON
85215002ST-FULGENT_SAPC
85216001SAINTE GEMME LA PLAINE_SAPC
85234001ST JEAN DE MONT

Quelles mesures météo sont réalisées ?

C’est l’occasion de s’interroger sur ce qu’on peut réaliser comme mesures météo avec quel instrument. Pour cela, je vais prendre la fiche de la station des Ajoncs à La Roche-sur-Yon qui contient :

  • Station automatique : c’est la station en elle-même avec tous ses capteurs mais je la cite car elle est automatique donc elle envoie toute seule les données aux serveurs de Météo France sans intervention humaine.
  • Capteur temps présent : c’est un capteur de visibilité qui, en gros, envoie un rayon à 45° vers l’avant et analyse le rayonnement pour détecter : pluie, pluie verglaçante, bruine, bruine verglaçante, mélange pluie/neige, neige, grésil, brouillard (brume), brume sèche (fumée, sable) ou dégagé (tous ces trucs s’appellent aussi des « hydrométéores précipitants », si avec ça vous ne brillez pas en société ce weekend héhé).
  • Télémètre : ce module va projeter un rayon laser à diode pulsée (LIDAR, dont on a déjà parlé ici) vers le haut pour détecter différentes couches nuages (ou d’autres obscurcissements) et mesurer leur distance au sol. D’ailleurs, si vous faites de l’astronomie, vous connaissez peut-être cette super application qui détaille la couche nuageuse pour préparer vos soirées d’observation : Clear Outside (ça vous donnera même la position de la station spatiale internationale ISS).
  • Capteur état du sol : comme son nom l’indique, ce module va permettre de voir si le sol est sec, humide, mouillé, enneigé, verglacé, etc. mais il va aussi mesurer la haute de la neige, la température, etc.
  • Barographe anéroïde à capsules : apparemment c’est un baromètre old school, du genre de ceux que vous pouvez voir sur un bateau ancien, qui utilise une capsule de Vidie (inventée en 1844 par Lucien Vidie) aussi appelée anéroïde. Il mesure bien sûr la pression atmosphérique (le poids de l’air et ses variations, pour faire simple) qui permet, non pas de dire quel temps il fait, mais quel temps il va faire : est-ce que l’aiguille va vers le beau temps (pression haute) ou la pluie (pression basse) ? rapidement ou lentement ? On va ainsi pouvoir prévoir pluie, orage, tempête, et retour du beau temps.
  • Baromètre Vaisala PTB220 : la version améliorée et moderne du barographe avec un capteur de pression absolue à base de silicium monocristallin.
  • Baromètre à mercure à échelle compensée type Tonnelot : franchement, je ne sais pas pourquoi il est là celui-là car il est encore plus vieux que le barographe (1830 du constructeur parisien Tonnelot), si quelqu’un sait je suis curieuse 😀
  • Capteur vent ultrasonique : celui-ci est un anémomètre à ultrason capable de mesurer la direction, la vitesse et la température virtuelle du vent. Oui, je vous vois venir, c’est quoi cette température virtuelle ? Et bien, l’explication n’a pas été facile à trouver sur Internet, bonne raison pour vous la fournir : en gros, l’air comprend toujours une certaine quantité de vapeur d’eau, ce que cet indicateur va corriger. La température virtuelle est donc la température que devrait avoir un air sec pour avoir la même densité à la même pression. Mais à quoi ça sert ? Aucune idée, je veux bien de l’aide si vous savez (un rapport avec le calcul de la température ressentie peut-être ?).
  • Sondes thermométriques à résistance de platine : c’est un bon vieux thermomètre (mais pas au mercure) inventé par W. Siemens en 1861 et largement amélioré et miniaturisé depuis 🙂
  • Pluviomètre à augets : ce module généralement en forme de cône collecte l’eau de pluie (ou la neige, la grêle…) et permet de mesurer les hauteurs de précipitations (volume) mais aussi d’estimer la durée et l’intensité des précipitations pluvieuses.
  • Sonde hygrométrique : cette sonde mesure la température de l’air et l’humidité relative pour calculer le point de rosée. Je vous sens dubitatifs, moi aussi à vrai dire. Alors l’humidité relative, c’est simplement une mesure de la vapeur d’eau dans l’air exprimée en pourcentage (% HR). Quant au point de rosée, c’est la température à laquelle on va avoir un début de condensation de la vapeur d’eau en goutte d’eau (la première goutte de rosée quoi).
  • Luminancemètre : a priori c’est parce que la station est sur un aérodrome car ce module permet de donner des informations sur la visibilité pour les avions en calculant la luminance (sensation visuelle de luminosité d’une surface) de fond du ciel.

Bon j’avoue, c’est plus complexe que je ne pensais et j’espère que ça m’aidera à comprendre le jeu de données météo dont il est temps d’étudier les intitulés de colonnes.

Détails du jeu de données agrométéorologiques vendéen

Les premières colonnes sont faciles :

  • NUM_POSTE : numéro Météo-France du poste sur 8 chiffres
  • NOM_USUEL : nom usuel du poste
  • LAT : latitude
  • LON : longitude
  • ALTI : altitude du pied de l’abri ou du pluviomètre si pas d’abri (en m)
  • DAT : date (année mois)
  • NUM_DECADE : numéro de la décade (période de 10 jours donc il y en a 3 dans le mois)

A partir de là, ça se corse :

  • RR : cumul mensuel des hauteurs de précipitations en millimètres
  • TN : moyenne température minimale sur la décade / les 10 jours
  • CTN : code calcul de TN pour la décade (en gros, le code calcul est un code de contrôle : 0 = OK, pas de données manquantes ; 1 = au moins une donnée manquante qui a été estimée pour le calcul)
  • TX : moyenne température maximale sur la décade
  • CTX : idem code calcul TN (c’est toujours le même)
  • FFM : moyenne décadaire de la force du vent moyenné sur 10 minutes
  • CFFM : code calcul
  • TSVM : moyenne décadaire de la tension de vapeur (en hPa), la pression atmosphérique quoi.
  • CTSVM : code calcul
  • INST : durée totale d’insolation sur la décade (total de minutes de soleil sur les 10 jours)
  • CINST : code calcul
  • GLOT : cumul de rayonnement global (en J/cm2), un peu plus compliqué : le rayonnement global du soleil en France est d’environ 1100 kWh/m² (alors qu’à l’équateur, il est de 2200 kWh/m²). Ici, il est exprimé en joules par cm² (à multiplier par 10 000 pour avoir les Watts par m²).
  • CGLOT : code calcul
  • ETP Penman décadaire (en mm et 1/10), également compliqué mais dédié à agriculture et aux hydrologues pour le coup : L’ETP, c’est l’EvapoTranspiration Potentielle d’un couvert végétal bas, continu et homogène, bien alimenté en eau et sans limitation nutritionnelle, physiologique ou pathologique (genre une prairie en pleine croissance bien humide mais sans excès d’eau). Elle est calculée grâce à la formule de Penman à partir des paramètres déjà calculés (température minimale, température maximale, vitesse moyenne du vent à 10m, tension de vapeur moyenne, insolation, rayonnement global…). Plus clairement, ça mesure les pertes d’eau par évaporation du sol et transpiration des plantes. Avec d’autres indicateurs comme le coefficient de la culture concernée (Kc), ça va permettre de prévoir l’impact de la météo sur cette culture (voire l’impact du réchauffement climatique).

C’est vraiment un métier, météorologue :D, chapeau !

Analyse des données agrométéorologiques de la Vendée sur 2023-2024

Préparation du jeu de données

J’importe le jeu de données météo en CSV dans un Google Sheet et je commence par nettoyer un peu en ajoutant un filtre sur chaque colonne pour enlever les infos peu sûres (celles où le code contrôle n’est pas 0). Les colonnes contrôle qui ne comportent que des zéros sont supprimées pour plus de lisibilité. Je renomme ensuite les entêtes de colonne pour plus de clarté. Je m’aperçois aussi que Google Sheets m’a mis les valeurs à l’américaine avec un point au lieu d’une virgule pour les décimales, je fais donc un « chercher et remplacer » pour changer les points en virgules, comme ça j’ai bien un format nombre pour faire mes calculs et formules.

Premier coup d’œil rapide pour repérer des incohérences

On s’aperçoit vite que toutes les stations ne sont pas équipées des mêmes modules. Elles mesurent toutes les températures mini et maxi ainsi que le volume de précipitations. En revanche, seules les stations de Château d’Olonne, Fontenay-le-Comte, Grues, L’Ile d’Yeu, Noirmoutier, Le Perrier, Pouzauges et La Roche-sur-Yon mesurent la force du vent et la pression atmosphérique. De plus, seules les stations de Château d’Olonne et La Roche mesurent la durée d’insolation, le rayonnement global et l’évapotranspiration. Bref, il va être difficile de mener une analyse globale sur tous les paramètres donc commençons par les températures et les précipitations pour comparer.

Tableau croisé dynamique

Rien de tel qu’un TCD pour appréhender une grande masse d’infos. Je commence par faire un TCD avec le nom des postes en lignes, la date + décade en colonnes et j’affiche en valeurs les températures minimales (dans la capture ci-dessous, je n’ai laissé déplié que le 1er mois).

Astuce Google Sheets TCD (parce que je ne savais pas) : Quand, dans les colonnes, vous cochez « afficher les totaux », ce total est en fait lié à votre choix « Synthétiser via » dans les valeurs. Ici, j’ai mis les valeurs synthétisées par moyenne (ce qui n’est pas dérangeant vu qu’il n’y a qu’une valeur par décade) afin que le total du mois soit bien une moyenne des 3 décades 😀

Création de graphique

Je re-prépare mes données et le tableau croisé dynamique pour créer un graphique barres avec des noms de villes bien écrits, des moyennes de température plus courtes (00,0), et je décide de ne prendre que les moyennes mensuelles de 2023. Je crée mon graphique et je choisis une couleur par mois pour qu’on puisse identifier les 12 mois (bleu = hiver, vert = printemps, orange = été, marron = automne, logique) sans avoir à les nommer. Bon forcément, 20 stations ça prend un peu de place mais voici le résultat :

Si on zoome sur 3 stations, ça donne :

On peut également dresser 2 courbes des températures vendéennes mini et maxi en 2023 :

Tirer une analyse d’un graphique plus complexe

Les graphiques, c’est sympa et toujours intéressant mais en regardant le dernier, il me donne très envie de le comparer à une autre année genre 1950, 1975 et 2000 pour voir la différence (voir si le réchauffement climatique est percevable chez nous). Je vais chercher le jeu de données et je refais tout, c’est parti ! En arrivant à mon TCD de 1950 à 2022, je m’aperçois qu’en 1950 nous n’avons les mesures que de 2 stations : L’île d’Yeu, La Mothe Achard. Alors pour faire une comparaison valable, nous allons comparer les températures minimale et maximale sur ces 2 stations en 1950, 1975, 2000 et 2022.

Voici la comparaison sur le front de mer à L’île d’Yeu :

Et la comparaison à La Mothe Achard plus dans les terres :

Conclusion et observations

De ce travail (d’environ 7 heures en tout), je retiens 2 éléments importants sur l’open data de Météo France et l’open data en général.

Premièrement, ouvrir les jeux de données à tous et toutes c’est bien, les enrichir avec des explications c’est mieux (ne serait-ce que la signification des entêtes de colonnes !!!) ! Il me semble absolument essentiel que le mouvement open data ne se contente pas de mettre à disposition des données mais s’assure qu’elles sont compréhensibles par divers publics (et non uniquement les experts comme ici). Pour que la data soit UTILE, il faut d’une part acculturer les citoyens à son exploitation et fournir une data accessible / explicite / à jour / cohérente (bref, une data FAIR).

Deuxièmement, vous avez pu voir toutes les difficultés auxquelles j’ai fait face dans cette expérience mais à la fin, j’arrive quand même à 2 graphiques sur lesquels il semble bien que le réchauffement climatique soit visible, même dans notre Vendée tempérée (et son micro-climat bien sûr héhé). Ainsi, alors qu’il existe encore des climato-sceptiques en France, l’open data météorologique a un rôle immense à jouer dans la démonstration et surtout l’appréhension du réchauffement climatique. Entre guillemets, s’il y a un type de data à soigner en ce moment, c’est bien la data scientifique liée au climat !

BONUS : Voici le Google Sheet complet des données météo Vendée avec les droits d’édition (donc faites-en votre propre copie et ne modifiez pas l’original s’il vous plaît) si vous voulez vérifier, vous entraîner, etc.

LEAVE A RESPONSE

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *