Auteur/autrice : Julien Durand

IA, données « anonymes »… vraiment ?

Par blank

Nouvelle activité autour de l’IA, mais sans utiliser l’IA.

L’idée est simple : faire vivre aux élèves une expérience concrète pour comprendre ce que signifie vraiment donnée anonyme… et surtout pourquoi ce terme est souvent trompeur.

Chaque élève remplit d’abord un questionnaire anonyme (sur pronote, moui par facilité 😉 ) : lieu de naissance, ancien professeur, centre d’intérêt, information personnelle non sensible. Pris séparément, ces éléments semblent anodins. Inexploitables. Inoffensifs.

Ensuite, par groupes, les élèves reçoivent plusieurs fiches « données » et doivent répondre à une question très précise :
Peut-on retrouver l’auteur de la fiche uniquement en recoupant les informations ?
Et surtout : expliquer le raisonnement.

Et là, sans magie ni technologie, les identifications apparaissent. Non pas parce qu’une information est sensible, mais parce que leur accumulation réduit drastiquement le nombre de possibilités. Les élèves ne devinent pas : ils raisonnent, éliminent, croisent.

C’est exactement le mécanisme utilisé par les intelligences artificielles :
elles ne « connaissent » personne, mais exploitent des volumes massifs de données pour établir des liens.

La conclusion s’impose d’elle-même : ce n’est pas la donnée isolée qui pose problème, mais le recoupement.

Et c’est précisément ce que vise le RGPD : limiter les croisements non maîtrisés, pas empêcher toute donnée.

Une activité simple, sans écran, mais qui permet aux élèves de ressentir ce qu’ils entendent souvent de manière abstraite : « anonymisé » ne veut pas dire « non identifiable » et qui met du sens dans la réglementation de protection des données.(RGPD)

Cette activité sera testée la semaine prochaine avec ma collègue de Français en soutien (on se fait une semaine pleine avec les 3e sur l’IA et la sécurité.
Voici l’activité :

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Licence Creative Commons

Mettre des élèves de 5e dans la peau de chercheurs pour préparer l’usage de l’IA en 4e.

Par blank

VOici la 5e activité sur l’IA sans IA pour les élèves de 5e.

En fin de 5e, une question finira par émerger :
« En 4e, on pourra utiliser l’IA ? » question directement liée au cadre posé par la lettre de cadrage.

Pour cette 5e activité IA, j’ai fait un choix volontairement différent :
Ne pas commencer par des règles, mais par une expérience de recherche.

L’activité s’inspire d’une étude récente de Bastani et al. (2024) sur l’impact des assistants IA sur l’apprentissage.

Le protocole est évidemment adapté au cadre scolaire : 90 élèves au lieu de 1000, répartis en trois groupes :

  • sans IA,
  • avec IA utilisée comme « béquille »,
  • avec IA utilisée comme guide explicatif.

Les élèves analysent ensuite les résultats comme de vrais statistiens :
moyennes, pourcentages, écarts entre entraînement et évaluation finale.

Une fois les résultats établis, ils pourront les analyser comme de vrais chercheurs en herbe

C’est l’occasion d’introduire, à hauteur d’élèves de 5e :

  • le biais de confiance,
  • et l’endettement cognitif : déléguer trop tôt à l’IA et perdre la maîtrise.

L’activité se termine par une consigne simple, mais exigeante :

Quel conseil donneriez-vous aux futurs élèves de 4e sur l’usage de l’IA ?

Les réponses doivent s’appuyer sur leurs calculs et leurs analyses, pas sur un discours tout fait.

Objectif : ne pas interdire l’IA, mais former avant d’autoriser.

Vous trouverez les deux ressources : le tableau des résultats des 90 élèves (les données statistiques) ainsi que la fiche d’activité sur 2 pages.

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Licence Creative Commons

Peut-on parler de l’impact écologique de l’IA autrement qu’avec des slogans ?

Par blank

Activité 4 – La pollution silencieuse

Après trois activités mathématiques sans utiliser l’IA mais autour de l’IA, voici la quatrième.
Son titre : « La pollution silencieuse ».

L’objectif n’est pas d’asséner une vérité du type « les LLM polluent beaucoup ».
L’objectif est plus modeste :
Permettre aux élèves de manipuler des ordres de grandeur, afin qu’ils se construisent une représentation chiffrée, raisonnée et discutable de l’impact écologique des usages des LLM.

Le point de départ est volontairement leur propre usage : leur nombre de requêtes.
Cela permet de sortir d’un débat abstrait et lointain. L’impact n’est plus “celui des autres”, “des entreprises”, ou “des data centers aux États-Unis” : ils en sont parties prenantes, à leur échelle bien sûr.

Il ne s’agit ni de culpabiliser, ni de moraliser. Il s’agit de faire réfléchir, avec des mathématiques.

Une hypothèse essentielle (et assumée)

Un point est posé explicitement dès le départ : À l’heure actuelle, personne ne connaît précisément la consommation réelle des LLM.

Les modèles évoluent très vite. Les usages aussi. Les méthodes d’estimation diffèrent.

Tout indique que les volumes augmentent, même si les modèles deviennent plus efficaces, avec, en toile de fond, le paradoxe de Jevons : améliorer l’efficacité peut conduire… à consommer davantage.

Résultat : les études disponibles aboutissent à des résultats très contrastés.

Deux hypothèses, deux mondes

J’ai donc fait un choix volontairement didactique :

  • une estimation issue des entreprises concernées, plutôt optimiste ;
  • une estimation issue de travaux universitaires, nettement plus alarmante.

Les élèves effectuent alors les calculs dans les deux cas.
Et ils constatent que les ordres de grandeur varient fortement.

C’est précisément là que se situe l’enjeu mathématique :
– comprendre que l’on ne travaille pas avec une valeur, mais avec une fourchette,
– les hypothèses conditionnent les résultats.

Faire des mathématiques pour penser le réel

Cette activité ne cherche pas à produire une conclusion définitive.
Elle cherche à produire du raisonnement, et même du débat mais éclairé. Apprendre à raisonner dans l’incertitude, plutôt qu’à répéter des slogans, qu’ils soient catastrophistes ou rassurants, sans les avoir interrogés mathématiquement.

WARNING : Afin de rendre l’exercice accessible, j’ai supposé que :

le ratio d’utilisateurs par pays est identique au ratio de requêtes par pays.

C’est une hypothèse simplificatrice, et elle est discutable. Elle peut d’ailleurs servir de point d’appui pour prolonger la réflexion avec les élèves : un utilisateur américain formule-t-il plus de requêtes qu’un utilisateur français ? Les usages sont-ils comparables selon les contextes culturels, scolaires ou professionnels ?

Là encore, les mathématiques ne tranchent pas tout.
Mais elles permettent de poser les bonnes questions, et de comprendre ce que valent et ce que ne valent pas, les nombres que l’on manipule.

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Licence Creative Commons