L’Intelligence Artificielle est déjà très importante en imagerie médicale. Des études montrent qu’elle peut être aussi efficace que les médecins pour détecter des maladies comme le cancer du sein par exemple. Le but de cet article est de montrer qu’il est possible d’initier les élèves à la reconnaissance d’images en leur proposant de créer leur propre modèle.
Objectif
Cette activité consiste à entraîner une intelligence artificielle dans le but de reconnaître des images (ici les phases de la mitose).

Compétences travaillées
Le numérique et les SVT :
D’après le programme officiel les SVT doivent développer de nouvelles compétences numériques chez les élèves : l’usage des bases de données scientifiques, de systèmes d’informations géoscientifiques, de la modélisation numérique, de la programmation, des calculs quantitatifs, voire de la réalité virtuelle et de la réalité augmentée.
Il s’agit donc ici d’utiliser des logiciels d’acquisition, de simulation et de traitement de données.
Cadre de Référence des Compétences Numériques (CRCN) :
Traiter des données | Traiter des données pour analyser une problématique |
---|---|
S’insérer dans un monde numérique | Prendre conscience des enjeux économiques, sociaux, juridiques et politiques du numérique |
Développer des documents visuels et sonores | Créer un objet multimédia |
Évoluer dans un monde numérique | Utiliser des ressources pour mettre à jour et améliorer ses compétences numériques, notamment pour de nouveaux outils et de nouvelles aptitudes |
Contexte
Niveau
Classe de Première Spécialité
Place dans les programmes
La Terre, la vie et l’organisation du vivant >Transmission, variation et expression du patrimoine génétique > Les divisions cellulaires des eucaryotes
Il s’agit ici de recenser, extraire et exploiter des informations permettant de caractériser les phases d’un cycle cellulaire eucaryote.
Matériel
Un ordinateur avec connexion internet par binôme
Dossier contenant les images à utiliser pour l’entraînement de l’IA
Durée
1 heure
Objectif de la séance : apprendre les différentes phases de la mitose
Classiquement, on demande aux élèves d’observer au microscope des cellules en mitose pour repérer et classer les différentes phases de la mitose.
Ici, on va changer le processus. Les élèves vont disposer d’un ensemble d’images qu’ils vont devoir classer dans des dossiers. Chaque dossier sera ensuite nommé en utilisant le nom de la phase de la mitose représentée sur les images. Une Intelligence Artificielle (IA) est ensuite entraînée à partir de ces images. Une fois l’entraînement réalisé, on pourra tester la qualité du modèle, en proposant une nouvelle image (gardée par l’enseignant) ou en utilisant directement une image diffusée par la webcam.

Si le test est validé (l’IA reconnaît l’image sans erreurs), on pourra alors proposer de nouvelles images (images de méiose, image de cellules en interphase, …) pour cerner les limites du modèle.
Pratiquement, l’enseignant met à disposition des élèves des images de cellules en mitose (ou en interphase). Ces images sont issues du web, de banques d’images (comme Mesurim2 par exemple) ou de photographies réalisées avec un microscope au lycée. On peut également obtenir des images en utilisant directement la webcam.
Entraîner une IA avec Teachable Machine
Teachable Machine est une web application libre développée par Google et permettant de créer des modèles de classifications d’images.
Rappel théorique
L’apprentissage supervisé (supervised learning en anglais) est une tâche d’apprentissage automatique consistant à apprendre une fonction de prédiction à partir d’exemples annotés. On distingue les problèmes de régression des problèmes de classement. Ainsi, on considère que les problèmes de prédiction d’une variable quantitative sont des problèmes de régression tandis que les problèmes de prédiction d’une variable qualitative sont des problèmes de classification. Les exemples annotés constituent une base d’apprentissage, et la fonction de prédiction apprise peut aussi être appelée « hypothèse » ou « modèle ». On suppose cette base d’apprentissage représentative d’une population d’échantillons plus large et le but des méthodes d’apprentissage supervisé est de bien généraliser, c’est-à-dire d’apprendre une fonction qui fasse des prédictions correctes sur des données non présentes dans l’ensemble d’apprentissage.
source : Wikipedia
Les étapes sont les suivantes :

- Collecter des données locales ou dans le cloud (Google Drive) à classifier.
- Entrainer les données
- Tester depuis l’interface la qualité du modèle
- Exporter celui-ci selon la plateforme de son choix.
Teachable Machine utilise TensorFlow.js, une bibliothèque de machine learning en JavaScript, pour entraîner et exécuter les modèles créés.
Lors de l’entraînement, le modèle a mis moins de 30 secondes pour se construire. Le logiciel fonctionne en local et pas sur un serveur distant.
Déroulement de l’entraînement : les phases de la mitose
- La première partie de l’activité consiste à classer les images se ressemblant.
- Quand toutes les images sont rassemblées dans des dossiers, il est temps de nommer ces dossiers (le nom de la phase de la mitose).
- Il faut ensuite nourrir le modèle en créant des classes (autant de classes que de dossiers). Pour chaque classe, on télécharge les images d’apprentissage. L’IA s’entraîne…

Lorsqu’elle est prête, on peut tester ses prédictions avec une image sortie de l’un des dossiers, puis avec de nouvelles images (formes différentes, couleurs différentes,…).

Si le modèle prédictif est fiable, on peut ensuite utiliser le modèle avec des images hors contexte (méiose, cellule quelconque, …).
Si peu d’images pour entraîner une IA ?
Il est étonnant qu’avec si peu d’images, on puisse entraîner une IA à reconnaître d’autres images. Ce n’est pourtant pas ce qui est affirmé habituellement : on connaît le coût énergétique et la nécessité d’absorber des quantités astronomiques de données pour entraîner des IA génératives… Ici le processus est différent. On utilise une autre technique d’apprentissage supervisé qui est le « Transfer Learning ».
Le Transfer Learning repose sur un concept simple, celui de ré-exploiter les connaissances acquises dans d’autres configurations pour la résolution d’un problème particulier : l’idée est d’utiliser un réseau de neurones pré-entaîné sur une base d’images (le plus souvent la base ImageNet) et d’utiliser la dernière couche de neurones avec notre jeu de données afin d’extraire les motifs utiles à la reconnaissance de nos propres images. C’est la technique utilisée dans cette activité. Il faut donc bien recourir à plusieurs millions d’images pour entraîner notre modèle …
Pour aller plus loin dans l’analyse
Utilisation de l’IA de Vittasciences

L’utilisation de la reconnaissance d’images par l’IA de Vittascience repose sur la même procédure qu’avec Teachable Machine.
Mais cette plateforme apporte une plus-value. On peut en effet :
- affiner les réglages ;
- visualiser le réseau de neurones ;
- visualiser la zone d’influence, c’est-à-dire les pixels pris en compte par l’IA pour « justifier » son choix de classification. Dans notre exemple, les élèves sont sensibles à la position de chromosomes pour reconnaître les phases de la mitose. Ce n’est pas du tout le cas pour l’IA qui utilise d’autres zones parfois très éloignées de la zone pertinente à nos yeux,
Analyse
Du côté de l’élève
L’élève devient donc un expert : il entraîne l’IA à partir d’images validées puis il vérifie la validité des résultats. C’est l’élève qui nourrit le modèle… Il apprend la mitose en faisant apprendre une machine…et il valide les résultats.
Du côté de l’enseignant
Il est d’ailleurs intéressant de constater la surprise des élèves devant les erreurs de l’IA : "Mais elle est nulle« , »elle se trompe souvent !". C’est une preuve pour l’enseignant que les élèves connaissent les phases de la mitose puisqu’ils peuvent corriger l’IA, tout en montrant aux élèves la nécessité de nourrir l’IA avec assez de données pour rendre les prédictions plus fiables.
Projet similaire
D’autres projets ont été menés avec les mêmes outils pour entraîner une IA à reconnaître des minéraux usuels sur une lame mince, la collecte des données se faisant directement en utilisant l’acquisition d’images par la webcam.
Tutoriels vidéos
Vous pouvez retrouver des vidéos détaillant l’utilisation des deux logiciels présentés dans cet article.
Introduction : https://podeduc.apps.education.fr/video/37684-1-utilisation-dune-ia-en-svt-introduction/
Étiquetage des données : https://podeduc.apps.education.fr/video/37687-2-etiquetage-des-donnees-dans-lapprentissage-supervise/
Utilisation de Teachable Machine : https://podeduc.apps.education.fr/video/37688-3-utilisation-de-teachable-machine/
Utilisation de Vittascience : https://podeduc.apps.education.fr/video/37690-4-utilisation-vittascience/
Que voit l’IA ? : [https://podeduc.apps.education.fr/video/38495-6-les-zones-utilisees-par-lia/]
Enregistrer un projet avec Vittascience :https://podeduc.apps.education.fr/video/38486-5-sauvegarder-un-projet-vittascience/