L’IA générative, un recours pour les études scientifiques ?

Objectifs

L’utilisation de l’intelligence artificielle par les élèves est devenue une pratique courante, voire banale, pour beaucoup d’entre eux. Dans le groupe de première spécialité concerné par ces travaux, composé de 22 élèves, tous avaient déjà utilisé ChatGPT, principalement pour des recherches d’informations. Ainsi, l’IA générative a remplacé, pour ces élèves, l’utilisation traditionnelle des moteurs de recherche.

Le but de l’enseignant est d’amener les élèves à questionner la fiabilité des informations fournies par les « perroquets stochastiques »(1) que sont les IA génératives.

L’objectif de cette activité est de tester l’utilisation d’une IA pour obtenir des données scientifiques sur la subduction. Pour introduire la partie sur l’origine du magma dans une zone de subduction, il s’agit de rechercher s’il existe un lien entre la distance arc volcanique-fosse océanique et le pendage de la plaque plongeante. Le recours à l’IA concerne l’obtention de données chiffrées dans le but de construire un graphique permettant d’obtenir une courbe de tendance.

Afin de vérifier la validité des données, il est ensuite nécessaire de confirmer les valeurs proposées par l’IA générative à l’aide de Tectoglob3D : cet outil permet de mesurer des distances ainsi que le pendage par l’exploitation des plans de Wadati-Benioff.

Compétences travaillées

L’enseignement des SVT vise à plusieurs objectifs majeurs dont celui de participer à la formation de l’esprit critique.

Le numérique et les SVT

D’après le programme officiel, les SVT requièrent l’usage des outils numériques généralistes (Internet, tableurs,…)[…]. Elles doivent aussi développer de nouvelles compétences numériques chez les élèves : l’usage des bases de données scientifiques, la modélisation.

Cadre de Référence des Compétences Numériques (CRCN) :

Information et données Mener une recherche, Traiter des données
Environnement Numérique Retrouver des ressources dans un environnement numérique

Contexte

Niveau

Première spécialité

Place dans les programmes

La dynamique interne de la Terre > La dynamique de la lithosphère > La dynamique des zones de convergence > Les zones de subduction

Acquis des élèves

A ce stade, les élèves savent que les zones de subduction sont marquées par un volcanisme explosif. Il s’agit alors de rechercher l’origine du magma.

Durée de l’activité

2 heures

Matériel à prévoir

Ordinateur / Accès à internet

IA utilisée

DuckDuckGo AI Chat avec le modèle laissé au choix des élèves (le plus souvent ils utilisent ChatGPT).

Déroulé de la séance

1re étape : interroger une IA

Exemple de requêtes (prompts) utilisés par les élèves  :

élève1 - Trouve moi le lien entre le pendage et la distance entre la fosse et l’arc volcanique (ici l’élève ne demande pas de valeurs chiffrées).

élève2 - Je veux des nombres concernant la relation entre la distance arc-fosse et le pendage d’une plaque en subduction ( la plupart du temps , les élèves ont obtenu des tableaux de données avec des fourchettes de valeurs, donc inutilisables pour construire le graphique)

élève3 - Donne moi un tableau avec de vraies valeurs scientifiques (plusieurs prompts ont permis d’obtenir des valeurs … fictives, ce qui était bien précisé par l’IA)

élève4 - Salut, je veux de vraies valeurs scientifiques et tu me dis en plus où tu les as trouvées.(L’IA cite alors ses sources).

La plupart des prompts des élèves manquaient de précision, et il a fallu modifier la demande jusqu’à obtenir un tableau de données exploitables.

Exemple de données obtenues grâce à l’IA

2e étape : vérifier les données

Dans un second temps, les élèves ont obtenu leurs propres valeurs à l’aide du logiciel Tectoglob3D en mesurant pendage et distance arc-fosse dans les mêmes zones que celles proposées par l’IA.

Exemple de données obtenues avec Tectogob3D

La comparaison des tableaux de données montre parfois des valeurs proches de celles proposées par l’IA ou très différentes pour une même zone de subduction. Il est difficile pour les élèves de trouver des valeurs « exactes » puisque d’un groupe à l’autre les valeurs sont proches mais toujours différentes. Alors que l’IA propose des valeurs uniques et semble-t-il indiscutables. Qui croire ?

3e étape : déterminer une tendance

Il ne reste plus qu’à construire une courbe en nuages de points (dispersion) et d’établir une courbe de tendance pour estimer le lien entre pendage et distance arc volcanique -fosse océanique.

Afin d’estimer la validité des courbes de tendance, on peut comparer le coefficient de détermination R2 . Cet indice mesure la qualité de l’ajustement du modèle de régression aux données : plus la valeur est proche de 1, et plus le modèle s’ajuste sur les données. Selon les groupes, la courbe de tendance construite à partir des données de l’IA montre parfois un meilleur R2… L’IA générative a donc parfois donné des résultats jugés plus fiables que ceux obtenus par les élèves…Reste la question de la généralisation. Peut-on se fier à l’IA ?

Les élèves ont fait émerger plusieurs difficultés pour expliquer la différence :

  1. « L’IA générative trouve directement les bonnes données scientifiques. »
  2. « Nous ne sommes pas des géologues. » : la dispersion des foyers sismiques rend l’exercice difficile pour savoir quels points prendre pour mesurer le pendage.
  3. « Tectoglob3D manque de précision. » (?!)

Un groupe a choisi rapidement d’utiliser un moteur de recherche pour obtenir un tableau de données finalement assez semblables aux valeurs générées par l’IA.

Mais cela a soulevé une nouvelle question : comment font les scientifiques pour établir des valeurs de pendage faisant consensus dans la communauté scientifique alors que cela semble si aléatoire par l’étude du plan de Bénioff  ?

4e étape : le recours à une base de données scientifiques

L’enseignant a alors proposé d’utiliser une base de données scientifiques axées sur l’étude des zones de subduction : il s’agit de la base de données Sub-map, outil de cartographie et d’étude des zones de subduction conçu par le laboratoire de Géosciences de Montpellier. Cet outil dispose de plusieurs modules, dont le module Sub-DATA qui rassemble des données issues de campagnes d’exploration.

Page d’accueil du site Sub-DATA

Le module présente une carte avec des transects réalisés dans toutes les zones de subduction du Monde : en cliquant sur un transect, on obtient une quantité impressionnante de données, et en particulier la distance arc volcanique-fosse (XArc).

Paramètres structuraux

Les élèves découvrent alors que la base de données dispose de deux mesures de pendage :

  • αs pour le pendage jusqu’à 125 km de profondeur,
  • αd pour le pendage au-delà de 125 km de profondeur.
Paramètres du « slab »

Remarque : Avec un angle de pendage et la distance séparant la fosse de l’arc volcanique, il est possible de connaître la profondeur du toit de la plaque plongeante sous les volcans en considérant un triangle rectangle. Ce calcul devient inutile, puisque la base de données contient cette valeur : c’est la profondeur du toit du plan de Bénioff sous l’arc vocanique (Harc). C’est finalement la ressource la plus précieuse puisqu’elle suggère que le toit du plan de Wadatti-Benioff est souvent situé autour de 100 km de profondeur. On pourra ainsi rechercher les caractéristiques de cette zone pour rechercher l’origine du magma.

Exemple de données issues de Sub-DATA

On peut donc recommencer le travail précédent en construisant un nouveau graphique avec les valeurs glânées dans la base de données.

Production finale

Les élèves disposent à présent de trois graphiques avec trois courbes de tendance (et le R2)

  • graphique construit avec les données IA
  • graphique construit avec les données obtenues par les élèves avec Tectoglob3D
  • graphique obtenu à partir d’une base de données (donc des scientifiques).

Il est temps de répondre à la problématique pour établir le lien entre le pendage d’une plaque plongeante et la distance qui sépare l’arc volcanique de la fosse.

Selon les tests réalisés en classe, le meilleur R2 a été obtenu par l’IA ou pas…Le contenu du prompt change complètement les valeurs obtenues .

Analyse

Cette activité visait à adopter une approche critique envers les réponses fournies par une intelligence artificielle générative. Il est observé que les réponses produites par l’IA peuvent parfois être fictives, comme l’indique explicitement l’IA elle-même en signalant le caractère inventé des données. Alternativement, l’IA peut fournir des réponses qui correspondent précisément aux attentes de l’utilisateur, indépendamment de leur validité scientifique. Par conséquent, un travail d’optimisation des prompts s’avère nécessaire pour améliorer la précision des réponses de l’IA.

Le prompt peut aussi introduire des biais : par exemple, écrire "je veux montrer qu’il existe un lien entre pendage et distance à la fosse" (biais de confirmation) donnera un graphique très conforme aux attendus alors qu’un prompt plus vague donnera des valeurs numériques inexploitables.

De plus, il est recommandé de recourir à plusieurs systèmes d’IA afin de comparer les résultats. L’utilisation de comparateurs d’IA permet d’obtenir diverses variantes de réponses, facilitant ainsi l’affinement des résultats.

Comparaison des réponses de 2 IA avec l’outil ComparIa

Les élèves ont aussi soulevé la question de la validité de leurs données lorsqu’ils utilisaient Tectoglob3D : comment mesurer efficacement un pendage ? Et surtout, comment font les scientifiques pour résoudre cette question qui semble faire intervenir de l’aléatoire ? L’enseignant a donc proposé de contacter le scientifique à l’origine de la création de la base de données :

La détermination du pendage d’un slab se base donc sur l’enveloppe supérieure des séismes « intraslab » également appelée plan de Wadati-Benioff mais en profondeur (>250 km), le slab peut devenir asismique s’il est chaud (jeune slab avec faible vitesse d’enfoncement) et dans ce cas, seule la tomographie sismique peut révéler son existence (anomalies de vitesses de propagation des ondes plus rapides dans le slab).
 
On peut dire aujourd’hui que dans 90% des cas la géométrie du toit du slab est bien connue à moins de 10 km près même si on peut toujours améliorer la résolution. Ensuite, le calcul du pendage moyen va dépendre de la méthode utilisée (tangente, moyenne glissante, régression linéaire) et de la tranche de profondeur considérée. Dans l’étude que nous avions réalisé il y a une vingtaine d’années, nous avions constaté que le pendage moyen changeait « significativement » suivant qu’on le mesurait au-dessus ou au-dessous de 125 km, c’est pourquoi nous avions défini un pendage superficiel et un pendage profond mais c’est arbitraire.
 
J’espère avoir répondu à vos questions.
 
Bien à vous
Serge Lallemand

Finalement, le lien entre pendage et distance fosse-arc volcanique n’est sans doute pas le critère le plus pertinent. Dans sa thèse Arnauld HEURET précise que la position de l’arc volcanique par rapport à la fosse dépend davantage du rayon de courbure de la plaque plongeante que de ses pendages. Cette valeur est donc plus pertinente aux yeux des chercheurs que le pendage de la plaque plongeante.

Le recours à l'IAgénérative permet donc d'obtenir des données (peut-être) scientifiques mais cela ne suffit pas. La confrontation aux données réelles (obtenues par des mesures réalisées par les élèves ou directement à partir de bases de données scientifiques) est une étape indispensable pour valider les données et se confronter au moyen mis en oeuvre pour collecter ces données. On mesure donc l'intérêt de former les élèves à l'art du prompt pour obtenir des réponses les plus fiables possibles et de favoriser le recours à l'utilisation de bases de données scientifiques.

(1) https://en.wikipedia.org/wiki/Stochastic_parrot https://affordance.framasoft.org/2021/04/perroquets-stochastiques-attaque-typographique/

Je remercie vivement M. Lallemand (Géosciences Montpellier )pour l’échange que nous avons eu à propos de l’obtention des données disponibles dans sub-DATA.

https://doi.org/10.1016/B978-0-12-409548-9.09495-1

Documents à télécharger

Dans la même rubrique…

Mots-clés

Articles liés

Revenir en haut