IA de confiance

IA et Explicabilité : Mon LLM fait-il vraiment ce que j'imagine ?

On parle partout des avancées fulgurantes de l'intelligence artificielle et des fameux LLM (les grands modèles de langage). Mais savez-vous vraiment ce qui se cache derrière nos assistants du quotidien ?

Bastien ZIMMERMANN

Jun 16, 2026

⚡️ TLDR

Biais cachés & métriques trompeuses : Une IA peut donner une bonne réponse pour de mauvaises raisons (ex. un modèle de voiture autonome assimilant "accélérer" et "doubler"). L'analyse par explications contre-factuelles permet de déceler ces corrélations erronées.
De la « boîte noire » à la « boîte de verre » : Tester uniquement les entrées/sorties d'une IA ne suffit plus. L'approche « boîte de verre » force le modèle à valider des concepts humains compréhensibles, garantissant la transparence exigée par la loi.
Le piège de la « chaîne de pensée » (Chain of Thought) : Le raisonnement affiché par les nouveaux modèles d'IA n'est qu'une justification construite a posteriori (post-hoc). Il ne reflète pas le calcul réel et peut afficher une logique parfaite pour un résultat totalement faux.
3 réflexes pour fiabiliser l'usage au quotidien : Comparer les réponses de plusieurs IA (cross-checking), remettre en question les résultats générés et exiger (puis vérifier) des sources systématiques.

‍

Pour répondre à cette question : Matteo Dora, CTO de Giskard, Amaia Cardiel, PhD candidate chez Valeo et Yann Eric CHOHO, PhD Candidate in Machine Learning chez Ekimetrics se sont réunis autour d’une table ronde lors de notre dernier Petit Dej’ de l’IA.

‍

Quand les métriques sont limitées : une bonne réponse pour de mauvaises raisons

Amaia, applique ses recherches à un domaine où l'erreur est interdite : la voiture autonome. Pour auditer ses modèles de conduite, elle utilise un outil appelé ”explication contre-factuelle.”

Le principe ? Trouver la modification minimale à faire sur une image ou un texte pour que l'IA change radicalement de décision. (Exemple : Si la voiture va tout droit, quel micro-détail l'aurait poussée à tourner à droite ?).

Dans son cas, le modèle de voiture autonome avait amalgamé accélérer et dépasser : passé une certaine vitesse, celle-ci se déportait systématiquement sur la voie de gauche.

Pourquoi ? Parce qu'elle avait bêtement appris par cœur ses données d'entraînement : dans la réalité, quand on double, on accélère et on se déporte à gauche. Sur le papier, les scores de l'IA étaient parfaits. En pratique, elle fonctionnait pour de mauvaises raisons. Sans cette analyse, le biais serait resté invisible.

L’explicabilité à permis de relier la situation à la prise de décision et cela à permis de la rendre actionnable et de résoudre ce comportement problématique.

L’IA boîte noire, attention aux pièges

Pour comprendre comment pense une IA, Matteo utilise une méthode plutôt originale : il s'inspire des neurosciences.

« Dans les neurosciences, on ne peut pas observer le comportement directement à l'intérieur du cerveau. On propose des tâches et on mesure la réaction. On fait à peu près la même chose avec les modèles. »

C'est ce qu'on appelle l'approche "boîte noire". On ne sait pas exactement ce qui se passe à l'intérieur, alors on teste le modèle pour construire son profil.

Par exemple, évaluer la théorie de la musique s’avère beaucoup plus compliqué en raison de sa singularité.

Les capacités des LLM sur ce sujet sont aussi limitées pour les mêmes raisons.

Cependant, attention au piège : mieux vaut aucune explication qu’une explication fallacieuse. Une fausse justification donne une confiance aveugle à l'utilisateur…

De plus, cette approche “boîte noire” rencontre très vite ses limites, notamment dans le cadre juridique (comme l’AI act par exemple) qui requiert une transparence irréprochable du modèle.

La RGPD, elle demande de l’explicabilité dans le cadre d’une décision automatisée, l’utilisateur est en droit de l’obtenir....

De la boîte noire à la "boîte de verre"

Yann Eric, doctorant en IA, préfère d'ailleurs parler de "boîte de verre" (Glass Box). On peut voir tous les chiffres et les paramètres à l'intérieur, mais on ne sait tout simplement pas lire ce langage codé.

Pour décrypter le fonctionnement d’une IA, il travaille sur les concepts.

Pour qu'une IA reconnaisse un oiseau, elle va chercher des concepts intermédiaires : un bec, des ailes, des pattes. Le but de ses recherches est de forcer l'IA à valider ces concepts humains avant de donner sa réponse. En modifiant ces concepts, on peut corriger la trajectoire du modèle en temps réel.

Car l'IA ne pense pas comme nous : elle adore les co-occurrences. Associez trop souvent un joueur de foot à un pays dans ses données, et elle se trompera de nationalité dès que vous changerez le contexte.

Vous aussi profitez du regard de l’expert !

Vous avez sûrement remarqué que les nouveaux modèles (comme ceux typés Reasoning) affichent leur "chaîne de pensée" (Chain of Thought) avant de donner la réponse finale. On a l'impression d'assister à une vraie réflexion.

Grosse erreur ! Les chercheurs sont unanimes : ce texte n'est qu'une justification construite après coup (post-hoc). Ce n'est pas le reflet fidèle de ce qui a poussé la machine à choisir sa réponse. Une IA peut dérouler un raisonnement parfait... et donner un résultat complètement faux (ou l'inverse).

De plus, ces modèles ont des angles morts hallucinants. Un LLM capable de résoudre de la mécanique quantique ou des maths ultra-complexes peut se tromper sur des notions de base.

Les bonnes pratiques de nos intervenants : 3 astuces pour dompter l'IA

Puisque l'IA reste une immense machine statistique, c'est à nous, humains, de garder le contrôle. Voici les 3 conseils des experts pour vos prompts quotidiens :

Multipliez les cerveaux : Posez la même question à deux ou trois IA différentes et regardez si les réponses convergent.
N’oubliez pas votre regard critique : Ne prenez jamais la première réponse pour acquise. Demandez-vous : « Es-tu sûr ? » ou donnez-lui un contre-exemple pour voir si elle campe sur ses positions ou si elle panique.
Exigez des preuves : Demandez-lui systématiquement de citer ses sources, et allez vérifier vous-même.

‍

Envie de déployer des IA fiables et explicables plutôt que des “boites noires” opaques ? Contactez nos experts !

‍

S'inscrire à notre Newletter

Tenez-vous au courant des dernières actualités, articles et mises à jour. Inscrivez-vous !

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

Nos derniers articles

IA de confiance

July 22, 2026

La gouvernance des données au cœur du déploiement de l’IA

Découvrez dans ce livre blanc comment structurer vos données et lancer des projets d'IA maîtrisés et durables.

Pascal CONDAMINE

IA de confiance

July 29, 2026

Alternatives Européennes à ChatGPT en Entreprise (2026) : Guide & Comparatif Souverain

Découvrez les meilleures alternatives européennes à ChatGPT pour votre entreprise en 2026. Comparatif des solutions souveraines compatibles RGPD, AI Act et exemptes du Cloud Act.

Pascal CONDAMINE

IA de confiance

July 16, 2026

AI act : les clés pour mettre votre entreprise en conformité

l'AI Act entrera dans sa phase d'adoption finale de ce mois d'août, êtes-vous prêts ?

Xavier TRIGANO

Voir tous les articles

Craft AI est un pionnier français de l’IA de confiance, dédié à l'industrialisation de l’intelligence artificielle pour toutes les entreprises. Nous facilitons la mise en production rapide d'assistants IA performants, sûrs, explicables et économes en ressources, tout en assurant la maîtrise complète des données et des infrastructures.

PRODUITS

SECTEURS

CRAFT AI

Politique de Confidentialité

Mentions Légales

CGU