Écrit par



Vous avez déjà reçu d’une IA une réponse parfaitement formulée, assortie d’une citation précise et d’une référence d’apparence sérieuse, avant de découvrir que la source n’existait pas ? C’est une hallucination de l’IA : une affirmation fausse produite avec un aplomb total. Le phénomène n’est pas un défaut passager qu’une mise à jour viendra effacer, c’est une propriété de fond des modèles de langage. La bonne nouvelle, c’est qu’on peut le réduire fortement par la façon de formuler ses demandes, et le rattraper par une méthode de vérification simple. Ce guide vous donne les deux.
Cet article fait partie de notre série sur le prompt engineering. Il complète notre guide sur les risques de sécurité des prompts : après la manipulation volontaire, voici l’erreur involontaire.
En bref
- Une hallucination est une affirmation fausse formulée avec assurance. Un modèle prédit des suites de mots plausibles, il n’a pas de notion de vérité.
- La cause de fond, démontrée par OpenAI : les modèles sont entraînés et évalués pour deviner plutôt que pour dire « je ne sais pas ». Avouer son ignorance est pénalisé comme une erreur, donc le modèle préfère parier.
- Les zones rouges : chiffres précis, citations et références, événements récents, sujets pointus, droit, médecine, finance. Sur les requêtes juridiques, les taux d’erreur mesurés vont de 69 % à 88 % selon les modèles.
- Paradoxe 2026 : certains modèles qui « raisonnent » hallucinent davantage sur les questions factuelles. Une réponse plus longue et plus assurée n’est pas plus fiable.
- Le levier de prompt le plus efficace et le plus négligé : autoriser explicitement le modèle à répondre « je ne sais pas ».
- On ne supprime pas les hallucinations, on les réduit et on les vérifie. Aucun chiffre ni aucune citation ne devrait sortir sans contrôle humain.
- Pour outiller vos équipes, découvrez notre parcours de formation à l’IA générative.
Le terme prête à confusion, car il évoque une expérience perceptive humaine. Pour un modèle de langage, le mécanisme est tout autre. Un grand modèle ne consulte pas une base de faits avant de répondre : il prédit, mot après mot, la suite la plus probable compte tenu de votre demande et de ce qu’il a appris. Quand la suite plausible se trouve être vraie, la réponse est juste. Quand elle est plausible mais fausse, c’est une hallucination. Le modèle ne fait pas la différence entre les deux : dans les deux cas, il produit du texte cohérent.
Cette mécanique explique pourquoi une IA peut inventer une référence bibliographique au format impeccable, avec un nom d’auteur crédible, un titre vraisemblable et une année. Le format d’une citation est très régulier, donc facile à imiter. Le contenu réel de la citation, lui, n’est pas vérifié.
Reste une question : pourquoi un modèle préfère-t-il inventer plutôt que reconnaître qu’il ne sait pas ? La réponse est éclairante. Dans son article de recherche « Why language models hallucinate », OpenAI démontre que les hallucinations persistent à cause de la façon dont on évalue les modèles : la plupart des classements récompensent la justesse et traitent une abstention (« je ne sais pas ») exactement comme une erreur. Dans ces conditions, deviner devient une stratégie gagnante, comme un candidat qui répond au hasard à un QCM plutôt que de laisser une case vide. Les chercheurs en tirent une conclusion opérationnelle pour nous : un modèle peut s’abstenir quand on l’y autorise, et c’est l’un des leviers les plus efficaces pour réduire les erreurs.
Toutes les hallucinations ne se ressemblent pas. Les distinguer aide à savoir où porter votre vigilance.
L’hallucination factuelle est la plus connue : le modèle affirme un fait faux (une date, un chiffre, un événement). L’hallucination de source est la plus dangereuse en contexte professionnel : le modèle invente une référence, une étude, un article de loi ou une jurisprudence qui n’existe pas. L’hallucination de raisonnement se produit quand la chaîne logique semble cohérente mais aboutit à une conclusion fausse, l’erreur étant d’autant plus difficile à repérer que le raisonnement « tient debout ». L’hallucination de fidélité, ou contextuelle, survient quand vous fournissez un document et que le modèle s’en écarte : il ajoute des éléments absents de la source, souvent en croyant bien faire. Enfin, l’hallucination sycophantique apparaît quand le modèle vous dit ce que vous semblez vouloir entendre plutôt que la réalité, par exemple en confirmant une prémisse fausse contenue dans votre question.
Un réflexe utile découle de cette typologie : une question qui contient déjà une hypothèse (« Pourquoi tel produit est-il interdit en France ? ») pousse le modèle à valider l’hypothèse, même si elle est fausse. Mieux vaut demander d’abord si l’hypothèse est vraie.
Le taux d’hallucination n’est pas uniforme. Il grimpe sur certaines familles de tâches, et c’est là que la vigilance doit être maximale.
Les chiffres précis, les dates et les statistiques figurent en tête, surtout quand ils sont récents ou pointus. Les citations et références sont la famille la plus risquée : produire une bibliographie ou citer un texte de loi expose directement à la source inventée. Les événements postérieurs à la date d’entraînement du modèle sont un piège classique, le modèle comblant le vide par de la plausibilité. Les sujets de niche, mal couverts par les données d’entraînement, donnent des réponses fragiles. Et trois domaines concentrent les enjeux : le droit, la médecine et la finance, où une erreur engage des responsabilités.
Les mesures disponibles donnent le vertige. Une étude du Stanford RegLab et de Stanford HAI sur les hallucinations juridiques a relevé des taux d’erreur allant de 69 % à 88 % sur des requêtes juridiques spécifiques selon les modèles, et même les outils juridiques spécialisés, censés être ancrés sur des bases fiables, dépassaient 34 % d’erreur. La justesse des citations reste, toutes mesures confondues, la tâche la moins fiable. Côté coût, les pertes financières mondiales attribuées aux hallucinations de l’IA ont été estimées à plusieurs dizaines de milliards de dollars pour la seule année 2024 selon les compilations sectorielles. Des bases de données recensent désormais en continu les décisions de justice impliquant des citations inventées par une IA, signe que le phénomène a quitté le laboratoire pour le prétoire.
Voici le point que peu de gens ont en tête, et qui devrait changer votre rapport aux réponses longues et assurées.
On pourrait croire qu’un modèle plus récent, conçu pour raisonner, hallucine moins. C’est l’inverse sur certaines tâches. La fiche technique d’OpenAI pour ses modèles o3 et o4-mini montre que o3 a halluciné sur 33 % des questions d’un test portant sur des personnes réelles, soit le double de son prédécesseur o1 (16 %), et le plus petit o4-mini grimpait à 48 %. L’explication d’OpenAI est limpide : un modèle qui raisonne davantage produit plus d’affirmations au total, donc plus de réponses justes, mais aussi plus de réponses fausses. Chaque affirmation supplémentaire est une occasion d’erreur de plus.
La leçon est contre-intuitive mais centrale : une réponse plus longue, plus détaillée, plus « raisonnée » et plus assurée n’est pas automatiquement plus fiable. L’assurance d’un modèle ne dit rien de son exactitude.
Le tableau n’est pas tout noir. Sur d’autres tâches, en particulier la synthèse fidèle d’un document fourni, le mode de réflexion étendue réduit les erreurs, car le modèle se corrige pendant son raisonnement. Tout dépend donc de la tâche : la réflexion approfondie aide à fiabiliser une analyse ancrée sur une source, mais peut au contraire multiplier les affirmations hasardeuses sur une question de mémoire pure. Le bon réflexe consiste à fournir la matière plutôt qu’à compter sur la mémoire du modèle, point que nous traitons juste après.
La façon dont vous formulez votre demande change radicalement le taux d’erreur. Voici les six leviers à connaître, du plus efficace au plus fin, avec des formulations directement réutilisables.
Levier 1, ancrer la réponse sur une source fournie. Plutôt que de compter sur la mémoire du modèle, donnez-lui la matière et contraignez-le à n’utiliser qu’elle. C’est le principe des outils ancrés sur vos documents. Formulation type : « Réponds à la question suivante en t’appuyant uniquement sur le document ci-dessous. N’utilise aucune connaissance extérieure. »
Levier 2, autoriser explicitement le « je ne sais pas ». C’est le levier le plus efficace et le plus négligé, et il découle directement du mécanisme expliqué plus haut : par défaut, le modèle préfère deviner. Désamorcez ce réflexe. Formulation type : « Si l’information ne figure pas dans le document fourni, ou si tu n’es pas certain, réponds explicitement « je ne sais pas » plutôt que d’inventer. »
Levier 3, exiger des sources vérifiables. Demandez une référence pour chaque affirmation, et précisez qu’une source inventée est pire qu’une absence de source. Formulation type : « Pour chaque affirmation factuelle, indique la source précise. Si tu ne peux pas citer de source fiable, signale-le au lieu d’en inventer une. »
Levier 4, demander le niveau de confiance. Faire expliciter l’incertitude révèle les points fragiles. Formulation type : « Pour chaque point, indique ton niveau de confiance (élevé, moyen, faible) et signale ce qui mériterait vérification. »
Levier 5, faire vérifier le modèle par lui-même. La technique dite de vérification en chaîne consiste à demander au modèle de générer des questions de contrôle sur sa propre réponse, puis d’y répondre, avant de produire une version corrigée. Formulation type : « Rédige une première réponse. Puis liste les affirmations qui pourraient être fausses, vérifie-les une par une, et propose une version corrigée. »
Levier 6, montrer un exemple d’abstention. Un ou deux exemples qui montrent le comportement attendu, dont un cas où la bonne réponse est « je ne sais pas », cadrent le modèle mieux qu’une longue consigne. C’est l’application du few-shot à la fiabilité.
Ces leviers se combinent. Sur une tâche à enjeu, l’ancrage sur une source plus l’autorisation d’abstention plus l’exigence de citations forment un trio qui réduit fortement le risque, sans jamais l’annuler.
Aucune technique de prompt ne remplace la vérification. Elle doit devenir un réflexe, surtout sur les sorties destinées à être diffusées ou à fonder une décision. Voici un déroulé simple, applicable à toute réponse d’IA.
La première étape consiste à repérer ce qui mérite vérification : tout chiffre, toute date, toute citation, toute référence et toute affirmation que vous ne pourriez pas confirmer vous-même. Les passages d’analyse ou de reformulation sont moins risqués que les faits bruts. Vient ensuite le recoupement avec une source primaire fiable, pas une autre IA ni un agrégateur. Le point souvent négligé : ouvrez réellement chaque lien et chaque référence citée par le modèle, car c’est exactement là que se logent les sources inventées. Sur les sujets sensibles, triangulez avec deux sources indépendantes. Enfin, gardez une trace de ce que vous avez vérifié, ce qui protège votre organisation en cas de contestation. La règle à diffuser dans une équipe tient en une phrase : aucun chiffre ni aucune citation ne sort sans être passé par cette boucle.
Ce qui relève du réflexe individuel doit devenir une pratique partagée pour tenir à l’échelle. Plusieurs leviers se cumulent.
Une charte d’usage clarifie les usages à risque et impose la vérification sur les sorties à enjeu, en distinguant ce qu’on peut diffuser tel quel de ce qui exige un contrôle. L’ancrage documentaire interne, c’est-à-dire brancher l’IA sur votre base de connaissances vérifiée plutôt que sur sa seule mémoire, réduit fortement les erreurs sur vos sujets métier. Le choix du modèle et de sa configuration se pense selon la criticité de la tâche : sur un travail où la fidélité prime, un mode de réflexion étendue ancré sur une source aide ; sur de la mémoire factuelle pure, la prudence reste de mise quel que soit le modèle. Enfin, et c’est le plus déterminant, formez les équipes au doute méthodique, car la technologie ne remplacera jamais le jugement de la personne qui valide.
💡 Frontière agents IA : quand une IA enchaîne des étapes en autonomie, la vérification doit être automatisée dans la boucle de l’agent, par exemple en confrontant chaque citation à sa source avant de poursuivre. C’est un enjeu central des métiers réglementés, que nous traitons dans notre analyse de l’agent IA juridique et de la crise des hallucinations et dans notre checklist avant de créer un agent IA.
C’est la question qui revient toujours, et la réponse honnête est non. Des travaux de 2025 ont avancé une démonstration de l’impossibilité d’atteindre un taux d’erreur strictement nul avec les architectures actuelles. OpenAI nuance le propos : les hallucinations ne sont pas une fatalité, puisqu’un modèle peut s’abstenir quand il est incertain, mais la justesse n’atteindra jamais 100 %, car certaines questions sont tout simplement sans réponse vérifiable.
La conclusion pratique est donc claire. L’objectif n’est pas le zéro hallucination, qui n’existe pas, mais un système bien calibré, qui sait quand affirmer, quand citer et quand se taire, encadré par une vérification humaine. C’est cette combinaison, et non l’attente d’un modèle parfait, qui rend l’IA fiable au quotidien.
C’est une affirmation fausse produite avec assurance par un modèle de langage, parce qu’il génère la suite de mots la plus plausible sans vérifier sa véracité.
Parce que le format d’une citation est très régulier, donc facile à imiter, alors que son contenu réel n’est pas vérifié. Le modèle produit une référence vraisemblable sans s’assurer qu’elle existe.
arce qu’il est entraîné et évalué dans des conditions où l’abstention est notée comme une erreur. Deviner devient alors une stratégie gagnante. C’est pourquoi l’autoriser explicitement à répondre « je ne sais pas » réduit fortement les hallucinations.
Pas toujours. Sur les questions factuelles, certains modèles conçus pour raisonner hallucinent davantage que leurs prédécesseurs, car ils produisent plus d’affirmations. Une réponse plus longue et plus assurée n’est pas plus fiable.
Fournir la matière au modèle (lui donner le document) et l’autoriser explicitement à répondre « je ne sais pas » si l’information n’y figure pas. Ce duo fait l’essentiel du travail.
Non. Ancrer l’IA sur des documents ou une recherche web réduit fortement le risque, mais ne l’élimine pas, surtout sur des tâches complexes nécessitant des citations exactes. La vérification humaine reste nécessaire.
Sur les chiffres, les dates, les citations et références, les événements récents, les sujets pointus, et tout ce qui touche au droit, à la médecine ou à la finance. Ce sont les zones où les taux d’erreur mesurés sont les plus élevés.
Repérez les faits à risque, recoupez avec une source primaire fiable, et surtout ouvrez chaque lien et chaque référence citée : c’est là que se trouvent les sources inventées. Sur un sujet sensible, croisez deux sources indépendantes.
Oui, à condition de l’encadrer : fournir la matière, autoriser l’abstention, exiger des sources, et vérifier les sorties à enjeu. L’IA devient fiable non pas quand le modèle est parfait, mais quand le processus autour de lui l’est.
Les hallucinations ne sont ni un bug ni une fatalité : ce sont des erreurs statistiques prévisibles, accentuées par des modèles entraînés à deviner plutôt qu’à douter. Vous n’y échapperez jamais totalement, mais vous pouvez en faire un risque maîtrisé. La recette tient en deux gestes : côté prompt, fournir la matière et autoriser le « je ne sais pas » ; côté humain, ne jamais laisser sortir un chiffre ou une citation sans l’avoir vérifié. Une IA bien encadrée n’est pas une IA en qui on a une confiance aveugle, c’est une IA dont on connaît les limites et qu’on utilise en conséquence.
Pour ancrer ces réflexes dans vos équipes et bâtir une charte adaptée à vos métiers, notre parcours de formation à la fiabilité de l’IA générative part de vos cas réels et des outils que vous utilisez déjà.

29 juin 2026
Intelligence Artificielle – IA


17 juin 2026
agentsia


17 juin 2026
agentsia

Laisser un commentaire