Publié le 22/09/2025

IA et théorie de l'esprit chez les machines : état de l'art et limites

Peut-on programmer une IA qui "comprend" les intentions, les émotions ou les croyances d'autrui ? Cette question fascinante se situe au carrefour de l'intelligence artificielle, des sciences cognitives et de la philosophie. Les récentes avancées dans les grands modèles de langage comme GPT-4 ont relancé le débat sur la capacité des machines à développer une forme de théorie de l'esprit. Tour d'horizon des progrès, des limites et des enjeux de cette quête technologique.

Qu'est-ce que la théorie de l'esprit ?

La théorie de l'esprit (Theory of Mind ou ToM en anglais) désigne la capacité à attribuer des états mentaux à soi-même et aux autres. Ces états incluent les croyances, désirs, intentions et émotions. Chez l'humain, cette capacité apparaît dès l'enfance et est fondamentale pour les interactions sociales.

Dans le contexte de l'IA, la question est de savoir si on peut créer des machines capables de comprendre et interpréter les états mentaux humains et d'utiliser cette compréhension pour interagir de manière plus pertinente. Une IA dotée d'une théorie de l'esprit pourrait, par exemple, comprendre qu'une personne peut croire quelque chose de faux, ou interpréter une demande indirecte comme une invitation à agir.

L'état de l'art : des performances surprenantes

Les recherches récentes révèlent des progrès spectaculaires dans les capacités des grands modèles de langage (LLM) comme GPT-4 en matière de théorie de l'esprit. Mais comment évaluer cette capacité chez les machines ? Les chercheurs utilisent principalement des tests de fausse croyance.

Ces tests consistent à vérifier si un sujet peut comprendre qu'une personne peut croire quelque chose que le sujet sait être faux. Par exemple : "Marie place son chocolat dans le tiroir et quitte la pièce. Pendant son absence, Jean déplace le chocolat dans le placard. Où Marie cherchera-t-elle son chocolat à son retour ?" Pour réussir, il faut comprendre que Marie agira selon sa croyance (le tiroir) et non selon la réalité (le placard).

Une étude publiée dans PNAS en 2024 par Kosinski a montré que GPT-4 réussissait 75% de ces tâches de fausse croyance, considérées comme "standard" pour évaluer la ToM chez les humains. Ce niveau de performance correspond à celui d'enfants de 6 ans. À titre de comparaison, les modèles plus anciens comme GPT-3 ne réussissaient que 20% de ces mêmes tâches.

Ces capacités semblent émerger spontanément plutôt que d'être explicitement programmées. Elles apparaîtraient comme un sous-produit de l'entraînement des LLM à prédire et générer du langage humain, qui est riche en descriptions d'états mentaux.

Les tests de fausse croyance : un juge de paix

Les tests de fausse croyance sont donc au cœur de l'évaluation de la théorie de l'esprit. Ces tests, simples en apparence, évaluent une capacité cognitive complexe essentielle aux interactions sociales humaines.

Ils permettent de vérifier si un système peut :

Distinguer la réalité et les croyances d'autrui
Comprendre que les croyances peuvent être erronées
Prédire le comportement d'une personne en fonction de ses croyances plutôt que de la réalité

Cette capacité est fondamentale car elle sous-tend notre compréhension des intentions, des mensonges, des erreurs et des perspectives différentes. Sans elle, les interactions sociales seraient extrêmement limitées.

Comment l'IA simule-t-elle la compréhension des états mentaux ?

Les mécanismes par lesquels les LLM développent ces capacités restent partiellement mystérieux. Plusieurs hypothèses coexistent :

1. L'apprentissage à partir de quantités massives de textes contenant des descriptions d'états mentaux et d'interactions sociales.
2. La capacité à reconnaître des patterns dans les situations décrites et à y appliquer des schémas d'analyse.
3. L'émergence de représentations internes qui capturent implicitement les relations entre les états mentaux et les comportements.

Ces mécanismes permettent aux LLM de générer des réponses qui simulent une compréhension des états mentaux, sans nécessairement impliquer une véritable compréhension au sens humain.

Les limites actuelles : une compréhension fragile

Malgré ces performances impressionnantes, les capacités de théorie de l'esprit des IA actuelles restent fragiles et limitées. Plusieurs études ont mis en évidence des faiblesses significatives :

Vulnérabilité aux perturbations mineures : De petites modifications dans la formulation des problèmes font chuter drastiquement les performances. Par exemple, rendre les conteneurs transparents ou changer la personne à propos de qui on pose la question suffit à désorienter les modèles.
Dépendance au contexte : Les performances sont excellentes dans les conditions idéales mais chutent face à des données plus naturelles et complexes. Les IA peinent à intégrer le contexte multidimensionnel (environnement, situation sociale, culture) qui est essentiel à la compréhension humaine des états mentaux.
Stratégies superficielles : Les chercheurs suggèrent que les LLM pourraient utiliser des heuristiques superficielles plutôt qu'une véritable compréhension des états mentaux. Ils répondraient correctement aux tests standards sans pour autant avoir développé une capacité générale à modéliser les états mentaux.

Le défi de la complexité émotionnelle

La compréhension des émotions représente un défi particulier pour les IA. Contrairement aux croyances ou intentions qui peuvent être explicitement verbalisées, les émotions s'expriment de manière subtile et multidimensionnelle.

Les humains utilisent instinctivement un vaste ensemble d'informations pour décoder les émotions : expressions faciales, intonation, gestes, postures, contexte situationnel. Les IA actuelles peinent à intégrer cette complexité contextuelle.

De plus, une même expression peut avoir plusieurs significations selon le contexte. Un froncement de sourcils peut exprimer la colère, la confusion, la concentration ou même la douleur. Cette ambiguïté constitue un obstacle majeur pour les systèmes d'IA qui reposent sur des corrélations statistiques plutôt que sur une compréhension profonde.

Les défis philosophiques fondamentaux

Au-delà des limitations techniques, la théorie de l'esprit chez les machines soulève des questions philosophiques profondes. Ces questions touchent à la nature même de la compréhension et de la conscience.

La critique principale, formulée par des philosophes comme Raphaël Enthoven, est que les IA manquent de conscience et d'expérience subjective. La compréhension authentique des états mentaux nécessiterait une forme de vécu personnel, une capacité à ressentir les émotions plutôt qu'à simplement les reconnaître.

De plus, la théorie de l'esprit humaine repose sur la capacité de douter, questionner et réfléchir par soi-même. Ces qualités réflexives semblent intrinsèquement humaines et difficilement reproductibles algorithmiquement. Les machines peuvent simuler la compréhension mais peuvent-elles véritablement comprendre ?

Applications concrètes et perspectives d'avenir

Malgré ces limites, les progrès dans la théorie de l'esprit artificielle ouvrent la voie à des applications concrètes dans de nombreux domaines :

Assistants virtuels plus intuitifs : Capables de comprendre les besoins implicites et de s'adapter à l'état émotionnel de l'utilisateur.
Véhicules autonomes plus sûrs : Anticipant mieux les intentions des piétons et autres conducteurs.
Outils thérapeutiques : Pour aider les personnes ayant des difficultés avec les interactions sociales, comme certaines formes d'autisme.
Systèmes éducatifs adaptatifs : Comprenant les états cognitifs et émotionnels des apprenants pour mieux les accompagner.

Les recherches futures devront s'attaquer aux défis fondamentaux, notamment en explorant comment intégrer une véritable compréhension contextuelle et peut-être en repensant complètement l'approche de l'intelligence artificielle.

Sources

Evaluating large language models in theory of mind tasks - PNAS : Étude montrant que GPT-4 réussit 75% des tâches de fausse croyance, atteignant un niveau comparable à celui d'enfants de 6 ans.
Testing theory of mind in large language models and humans - Nature : Recherche comparant systématiquement les performances des humains et des LLM sur une batterie complète de tests de théorie de l'esprit.
L'intelligence artificielle est-elle prête à comprendre les émotions humaines ? - The Conversation : Analyse des limites actuelles des IA dans la compréhension des émotions humaines.

Qu'est-ce que la théorie de l'esprit chez l'homme ?

La théorie de l'esprit est la capacité cognitive à attribuer des états mentaux (croyances, désirs, intentions, émotions) à soi-même et aux autres, et à comprendre que ces états mentaux peuvent différer de la réalité. Cette capacité apparaît dès l'enfance et est fondamentale pour les interactions sociales humaines.

Les IA actuelles possèdent-elles une véritable théorie de l'esprit ?

Non, les IA actuelles ne possèdent pas de véritable théorie de l'esprit au sens humain. Elles peuvent simuler cette capacité dans certaines conditions, notamment dans les tests standards de fausse croyance, mais cette compréhension reste fragile, contextuellement limitée et basée sur des mécanismes statistiques plutôt que sur une conscience ou une expérience subjective.

Quelles sont les principales limites des IA en matière de théorie de l'esprit ?

Les principales limites sont : la fragilité face aux perturbations mineures, la difficulté à intégrer le contexte multidimensionnel, l'utilisation de stratégies superficielles plutôt qu'une compréhension profonde, l'incapacité à appréhender la complexité émotionnelle, et l'absence de conscience et d'expérience subjective.

Comment les IA simulent-elles la compréhension des états mentaux ?

Les IA simulent la compréhension des états mentaux principalement à travers l'apprentissage à partir de quantités massives de textes contenant des descriptions d'états mentaux, la reconnaissance de patterns dans les situations décrites, et le développement de représentations internes qui capturent implicitement les relations entre les états mentaux et les comportements.

Quelles applications concrètes pourraient découler d'une IA avec une théorie de l'esprit développée ?

Les applications potentielles incluent : des assistants virtuels plus intuitifs capables de comprendre les besoins implicites, des véhicules autonomes anticipant mieux les intentions des piétons et conducteurs, des outils thérapeutiques pour aider les personnes ayant des difficultés avec les interactions sociales, et des systèmes éducatifs adaptatifs comprenant les états cognitifs et émotionnels des apprenants.

IA et théorie de l'esprit chez les machines : état de l'art et limites

Qu'est-ce que la théorie de l'esprit ?

L'état de l'art : des performances surprenantes

Les tests de fausse croyance : un juge de paix

Comment l'IA simule-t-elle la compréhension des états mentaux ?

Les limites actuelles : une compréhension fragile

Le défi de la complexité émotionnelle

Les défis philosophiques fondamentaux

Applications concrètes et perspectives d'avenir

Sources

Sur le même sujet

Pourquoi l’IA n’a pas le sens de l’humour ?

Le model collapse : Quand l’IA se nourrit de ses propres erreurs

Tomber amoureux d’une IA : et si Her devenait une réalité ?

L’IA et la recherche contre le cancer : ce qu’elle change déjà et ce qui arrive bientôt

Qui a créé ChatGPT ? Les dessous d’un projet qui a révolutionné l’IA

Qu’est-ce que PyTorch ? Introduction à un outil phare du deep learning