IA de confiance

IA et Explicabilité : Mon LLM fait-il vraiment ce que j'imagine ?

On parle partout des avancées fulgurantes de l'intelligence artificielle et des fameux LLM (les grands modèles de langage). Mais savez-vous vraiment ce qui se cache derrière nos assistants du quotidien ?

On parle partout des avancées fulgurantes de l'intelligence artificielle et des fameux LLM (les grands modèles de langage). Mais savez-vous vraiment ce qui se cache derrière nos assistants du quotidien ? 

Pour répondre à cette question : Matteo Dora, CTO de Giskard, Amaia Cardiel, PhD candidate chez Valeo et Yann Eric CHOHO, PhD Candidate in Machine Learning chez Ekimetrics se sont réunis autour d’une table ronde lors de notre dernier Petit Dej’ de l’IA.

Quand les métriques sont limitées : une bonne réponse pour de mauvaises raisons

Amaia, applique ses recherches à un domaine où l'erreur est interdite : la voiture autonome. Pour auditer ses modèles de conduite, elle utilise un outil appelé ”explication contre-factuelle.”

Le principe ? Trouver la modification minimale à faire sur une image ou un texte pour que l'IA change radicalement de décision. (Exemple : Si la voiture va tout droit, quel micro-détail l'aurait poussée à tourner à droite ?).

Dans son cas, le modèle de voiture autonome avait amalgamé accélérer et dépasser : passé une certaine vitesse, celle-ci se déportait systématiquement sur la voie de gauche. 

Pourquoi ? Parce qu'elle avait bêtement appris par cœur ses données d'entraînement : dans la réalité, quand on double, on accélère et on se déporte à gauche. Sur le papier, les scores de l'IA étaient parfaits. En pratique, elle fonctionnait pour de mauvaises raisons. Sans cette analyse, le biais serait resté invisible.

L’explicabilité à permis de relier la situation à la prise de décision et cela à permis de la rendre actionnable et de résoudre ce comportement problématique.

L’IA boîte noire, attention aux pièges

Pour comprendre comment pense une IA, Matteo utilise une méthode plutôt originale : il s'inspire des neurosciences.

« Dans les neurosciences, on ne peut pas observer le comportement directement à l'intérieur du cerveau. On propose des tâches et on mesure la réaction. On fait à peu près la même chose avec les modèles. »

C'est ce qu'on appelle l'approche "boîte noire". On ne sait pas exactement ce qui se passe à l'intérieur, alors on teste le modèle pour construire son profil.

Par exemple, évaluer la théorie de la musique s’avère beaucoup plus compliqué en raison de sa singularité. 

Les capacités des LLM sur ce sujet sont aussi limitées pour les mêmes raisons. 

Cependant, attention au piège : mieux vaut aucune explication qu’une explication fallacieuse. Une fausse justification donne une confiance aveugle à l'utilisateur…

De plus, cette approche “boîte noire” rencontre très vite ses limites, notamment dans le cadre juridique (comme l’AI act par exemple) qui requiert une transparence irréprochable du modèle. 

La RGPD, elle demande de l’explicabilité dans le cadre d’une décision automatisée, l’utilisateur est en droit de l’obtenir....

De la boîte noire à la "boîte de verre"

Yann Eric, doctorant en IA, préfère d'ailleurs parler de "boîte de verre" (Glass Box). On peut voir tous les chiffres et les paramètres à l'intérieur, mais on ne sait tout simplement pas lire ce langage codé.

Pour décrypter le fonctionnement d’une IA, il travaille sur les concepts.

Pour qu'une IA reconnaisse un oiseau, elle va chercher des concepts intermédiaires : un bec, des ailes, des pattes. Le but de ses recherches est de forcer l'IA à valider ces concepts humains avant de donner sa réponse. En modifiant ces concepts, on peut corriger la trajectoire du modèle en temps réel.

Car l'IA ne pense pas comme nous : elle adore les co-occurrences. Associez trop souvent un joueur de foot à un pays dans ses données, et elle se trompera de nationalité dès que vous changerez le contexte.

Vous aussi profitez du regard de l’expert !

Vous avez sûrement remarqué que les nouveaux modèles (comme ceux typés Reasoning) affichent leur "chaîne de pensée" (Chain of Thought) avant de donner la réponse finale. On a l'impression d'assister à une vraie réflexion.

Grosse erreur ! Les chercheurs sont unanimes : ce texte n'est qu'une justification construite après coup (post-hoc). Ce n'est pas le reflet fidèle de ce qui a poussé la machine à choisir sa réponse. Une IA peut dérouler un raisonnement parfait... et donner un résultat complètement faux (ou l'inverse).

De plus, ces modèles ont des angles morts hallucinants. Un LLM capable de résoudre de la mécanique quantique ou des maths ultra-complexes peut se tromper sur des notions de base.

Les bonnes pratiques de nos intervenants : 3 astuces pour dompter l'IA

Puisque l'IA reste une immense machine statistique, c'est à nous, humains, de garder le contrôle. Voici les 3 conseils des experts pour vos prompts quotidiens :

  1. Multipliez les cerveaux : Posez la même question à deux ou trois IA différentes et regardez si les réponses convergent.
  2. N’oubliez pas votre regard critique : Ne prenez jamais la première réponse pour acquise. Demandez-vous : « Es-tu sûr ? » ou donnez-lui un contre-exemple pour voir si elle campe sur ses positions ou si elle panique.
  3. Exigez des preuves : Demandez-lui systématiquement de citer ses sources, et allez vérifier vous-même.

Envie de déployer des IA fiables et explicables plutôt que des “boites noires” opaques ? Contactez nos experts !