Corps de l’article

Traduit de l’anglais par Nicolas Payette

Modularité, autisme, cognition sociale, psychologie évolutionniste, théorie de l’esprit

Une thèse centrale de la psychologie évolutionniste (PE), c’est que le développement de la lecture de pensée [mindreading : l’attribution d’états psychologiques] dépend de la maturation, guidée génétiquement, de la circuiterie neurale spécialisée dans la métareprésentation de concepts psychologiques : le module de la théorie de l’esprit. Ce module permet au sujet de figurer la relation représentationnelle entre des états mentaux et leurs objets et, conséquemment, de comprendre qu’un autre sujet peut se représenter le monde de façon incorrecte. Un grand nombre de recherches en psychologie du développement ont montré que la capacité de l’enfant à métareprésenter de cette façon apparaît généralement entre trois et quatre ans. Les sujets au QI normal, atteints d’autisme ou du syndrome d’Asperger, montrent des résultats réellement inférieur dans les tâches testant la capacité de lecture de pensée alors que les sujets atteints du syndrome de Down réussissent aussi bien que les enfants normaux d’âge mental comparable (Baron-Cohen, Leslie et al., 1985 ; Baron-Cohen, 2000 ; Wellman, 2000). Cette dissociation entre la lecture de pensée et l’intelligence de portée générale engendre l’hypothèse que la lecture de pensée est un module inné dont l’altération expliquerait l’autisme (Leslie et Thaiss, 1992 ; Leslie, 1994).

La présence d’un module de lecture de pensée dans le phénotype cognitif humain est un élément de preuve crucial pour la partie nativiste de la thèse de la PE selon laquelle certaines formes de raisonnement sont des « instincts de raisonnement » spécifiés génétiquement qui s’inscrivent dans une architecture cognitive modulaire universelle. C’est pour cette raison que des troubles du développement comme la forme grammaticale de la déficience spécifique du langage (DSL) et l’autisme jouent un rôle crucial en PE : ce sont des cas où la cognition de haut niveau — le traitement syntaxique, d’une part, et la psychologie intentionnelle, d’autre part — ne réussit pas à se développer normalement. Ainsi, en ce qui concerne la DSL, Steven Pinker a déclaré que « le syndrome montre qu’il doit y avoir dans le développement du cerveau quelque schème d’événements guidés génétiquement spécialisés dans le «câblage» du traitement linguistique » (Pinker, 1989, p. 324). La thèse analogue, dans le cas de l’autisme, serait que cette dernière constitue un élément de preuve que l’activité cérébrale complexe nécessaire à la lecture de pensée est à la fois modularisée (« De telles inférences semblent être produites par un système cognitif spécialisé, parfois appelé module de «théorie de l’esprit» » [Cosmides et Tooby, 1994, p. 102]) et d’ordre génétique.

Dans cet article, j’argumente contre deux aspects reliés de la thèse de la PE selon laquelle la lecture de pensée est spécifiée de façon innée. J’argumenterai premièrement contre une thèse conceptuelle selon laquelle la lecture de pensée requiert un module de lecture de pensée spécifié de façon innée et, deuxièmement, contre l’idée que les données neuropsychologiques confirment cette hypothèse de modularité innée. Je ne contesterai pas que, au cours du développement normal, la lecture de pensée devient modularisée, que les caractéristiques essentielles de l’autisme résultent d’une rupture de ce processus et qu’il y a une composante génétique dans la construction de la circuiterie neurale dont la dysfonction cause l’autisme. Il semble que d’en concéder autant à mes adversaires ne laisse pas grand-chose à disputer, mais en fait, la thèse cruciale selon laquelle la lecture de pensée, comprise comme une procédure inférentielle spécifique à un domaine, est spécifiée génétiquement n’est pas confirmée par ces faits. Les raisons en sont que :

  1. même si les structures neurales cruciales sont spécifiées génétiquement, il est toujours possible qu’elles soient en cause dans le développement de structures cognitives de bas niveau préalables au développement de la lecture de pensée, plutôt que dans la lecture de pensée elle-même, et que celle-ci soit le résultat de l’interaction développementale de ces mécanismes de bas niveau avec des formes de cognition de portée générale, supérieures et plus centralisées, dont le langage est l’expression ;

  2. plusieurs habiletés qui ne sont pas innées peuvent être modularisées durant le développement (par exemple, jouer du piano et lire).

L’essentiel, ici, c’est que la présence de compétences cognitives spécialisées dans le phénotype développemental ne nous oblige pas à inférer que celles-ci doivent être préspécifiées. Cette forme de constructivisme ne requiert pas une conception de l’esprit du genre table rase, mais elle restreint l’étendue du nativisme aux capacités et aux routines comportementales strictement nécessaires pour forcer le développement de la compétence plutôt que de modéliser la compétence à l’état final (en s’appuyant sur les troubles du développement), puis d’affirmer que cette compétence est ainsi codée dans le génome, comme le fait la PE.

La relation entre ces deux points peut être clarifiée en faisant des analogies avec deux autres troubles du développement : la dyslexie et la déficience spécifique du langage (DSL). La dyslexie, autant dans sa forme acquise que développementale, se présente comme une dissociation d’une forme modularisée de la cognition : la lecture. Des études sur les jumeaux ont montré qu’elle a une composante génétique, et il semble que certaines formes de dyslexie de surface (laquelle n’est pas un monolithe cognitif) résultent de déficiences dans les voies magnocellulaires qui réagissent de façon préférentielle aux contrastes de luminosité (Bednarak, 2002 ; Omzigt, 2002). Dans certains cas, la dyslexie de surface (l’incapacité à lire des mots irréguliers tels que les mots anglais yacht et laughed) peut être traitée en remplaçant la combinaison normale de texte noir sur fond blanc par une combinaison rouge-vert. Cela permet de contourner le système de traitement de la luminosité et d’utiliser plutôt la voie parvocellulaire spécialisée dans la détection de l’information spectrale (Bouldoukian et Evans, 2002).

Cette explication de la dyslexie en tant que problème de traitement visuel de bas niveau contraste avec une explication qui la traite comme un trouble de la cognition de haut niveau basée sur des règles, comme la morphosyntaxe. Dans cette dernière, le déficit est essentiellement linguistique et ne relève pas du traitement visuel.

Ces faits sont pertinents pour le problème de l’innéité parce que, bien qu’il soit possible de penser que certains aspects du traitement linguistique sont contrôlés génétiquement (Enard, 2002), cela ne peut pas être vrai pour la lecture. Les humains ne lisent que depuis deux millénaires, et la plupart des humains qui ont vécu étaient illettrés ; il semble donc que l’évolution d’un système de lecture spécialisé soit une impossibilité. La plupart des gens développeront néanmoins, au cours de leur développement normal, un module de lecture qui mobilise pour cette tâche les ressources cognitives appropriées. Ce module peut être altéré de façon sélective, produisant alors des cas de dyslexie acquise autant que développementale. Le débat sur le fait qu’il s’agit de ressources linguistiques de haut niveau ou de ressources de traitement visuel de bas niveau est encore en cours.

La question de savoir dans quelle mesure les troubles sélectifs du développement peuvent être utilisés comme éléments de preuve quant à la modularité innée d’un système syntaxique est aussi soulevée par la DSL et le syndrome de William (SW). Les neuroconstructivistes ont soutenu qu’une double dissociation syntaxique (module altéré dans la DSL, intact dans le SW) n’est qu’apparente, et que la différence s’explique par le traitement phonologique plutôt que par le traitement syntaxique de haut niveau (Thomas, sous presse). Ainsi, l’hypothèse magnocellulaire de la dyslexie est analogue à cette explication neuroconstructiviste de la DSL (Joanisse, 1998).

Notez qu’il pourrait être possible d’admettre la thèse neuroconstructiviste selon laquelle un traitement phonologique altéré est la cause distale de la DSL tout en retenant l’idée que l’essence du déficit est syntaxique. Les troubles phonologiques de bas niveau privent peut-être le module de syntaxe de données cruciales pour son développement (Gerrans, 2002). Il existe un argument analogue dans le cas de la dyslexie. Néanmoins, la capacité cognitive qui ne se développe pas dans la dyslexie à cause de déficits dans les processus de bas niveau de traitement de la luminosité ne peut pas être un module de lecture inné puisque la lecture (contrairement aux processus magnocellulaires dont elle dépend) n’est pas innée. La thèse selon laquelle le module de syntaxe ne se développe pas dans la DSL à cause des processus de traitement phonologique de bas niveau ne peut pas être écartée directement parce qu’il est plausible que la syntaxe soit une capacité cognitive innée.

Adoptons une position modérée qui nous servira de cadre pour la discussion sur l’autisme et la lecture de pensée. Les neuroconstructivistes ont raison au sujet de certaines dyslexies de surface : elles sont une conséquence de déficits magnocellulaires de bas niveau. Les nativistes ont raison quant à la DSL : elle constitue un élément de preuve en faveur d’une capacité innée de traitement syntaxique qui va bien au-delà d’une capacité de traitement phonologique (des règles grammaticales et non pas de simples régularités statistiques entre associations phonologiques sont en jeu dans le processus de traitement ; Gopnik, 1997 ; van der Lely, 1997).

L’autisme est-il comme la dyslexie ou comme la DSL ? Selon la PE, il est plutôt comme la DSL telle que je l’ai décrite. Une façon d’argumenter contre cette thèse serait d’argumenter contre le nativisme en général, à la manière neuroconstructiviste habituelle (Elman, 1996 ; Quartz et Sejnowsky, 1997), mais j’ai choisi la position modérée pour montrer que, même en admettant la possibilité du nativisme pour certains aspects de la cognition supérieure, les arguments de la PE ne sont pas convaincants en ce qui concerne la lecture de pensée. L’argument conceptuel pour la modularité de la lecture de pensée ne fonctionne pas et, en conséquence, il ne peut pas être confirmé par des études neuropsychologiques de la lecture de pensée chez les autistes. Les circuits neuraux cruciaux identifiés dans ces études sont reliés à la lecture de pensée mature comme les voies magnocellulaires sont reliées à la lecture. Conséquemment, les dommages spécifiques à ces circuits sont à l’autisme ce que les anomalies magnocellulaires sont à la dyslexie. La majeure partie de la circuiterie identifiée dans les études neuropsychologiques de la lecture de pensée participe de façon précoce au traitement de bas niveau. « Précoce » se rapporte ici autant à l’ontogénie qu’à la cognition. Ontogénétiquement, les habiletés périphériques, telles que la reconnaissance des mouvements intentionnels du corps ou des mains et des expressions émotionnelles, se développent avant les habiletés d’ordre supérieur telles que l’attribution d’attitudes propositionnelles. De plus, puisque ces processus de bas niveau précoces fournissent des données au traitement d’ordre supérieur, ils constituent une étape antérieure du traitement cognitif social, de la même façon que le traitement magnocellulaire est une étape antérieure de la reconnaissance des mots dans la lecture, ou que la reconnaissance de l’orientation est une étape antérieure du traitement des visages. Ainsi, je soutiens que la lecture est la meilleure analogie développementale de la lecture de pensée.

Par exemple, la formation de l’attitude propositionnelle « Michel est fâché contre Justin » dépend typiquement de réponses modularisées à des mouvements corporels expressifs, au regard ou à la vocalisation, qui lui sont antérieures (dans les deux sens). Dans l’autisme, c’est l’absence de certaines ou de toutes ces habilités précoces qui prive les sujets de ressources de développement cruciales et donne l’impression trompeuse que la différence essentielle entre les sujets autistes et les sujets normaux se situe à un niveau plus élevé, c.-à-d. dans un module dédié à la lecture de pensée, spécifié de façon innée. Plutôt que de décrire toutes les composantes possibles du développement précoce de la lecture de pensée, je vais fournir deux exemples de sous-systèmes périphériques dont le développement est contraint génétiquement et qui, lorsqu’ils fonctionnent normalement, peuvent aider à expliquer la convergence développementale vers la lecture de pensée. Tout aussi important est le fait que, lorsqu’ils fonctionnent mal ou qu’ils sont absents, ces sous-systèmes peuvent être tenus responsables de composantes significatives du profil de l’autisme, particulièrement quand le développement est vu, correctement, comme une cascade de sous-systèmes interagissant de façon neurale et cognitive.

L’argument conceptuel pour la modularité innée

L’archétype de la théorie de la modularité soutenue par la PE est sans aucun doute la théorie de l’acquisition du langage proposée par Chomsky à ses débuts : chacun de nous est génétiquement doté d’une connaissance innée des règles de base de la syntaxe et utilise cette connaissance pour restreindre les hypothèses possibles concernant les structures syntaxiques enchâssées dans les données linguistiques primaires auxquelles nous sommes confrontés dans la petite enfance. La PE décrit ces modules de connaissance comme des théories naïves portant sur des domaines spécifiques : un ensemble d’hypothèses d’arrière-plan qui contraignent les inférences, évitant ainsi le problème du cadre [the frame problem]. Cette forme de nativisme est correctement décrite comme sélectionniste parce que le rôle de l’environnement est d’effectuer une sélection à partir d’un ensemble d’états finaux alternatifs préspécifiés (par exemple, faire un choix entre des grammaires d’ordre progressif ou régressif). Le résultat est une architecture mentale modulaire, avec des composantes spécialisées dans des domaines particuliers.

Les troubles du développement sont invoqués comme éléments de preuve en faveur de cette forme de nativisme parce qu’ils se présentent comme des défaillances sélectives de la cognition supérieure, et donc de l’échec du système à se développer selon une trajectoire prédéfinie. Par exemple, Pinker (1999, p. 262) a soutenu que la DSL et le syndrome de William sont une double dissociation développementale d’un module de syntaxe, et la PE suit les psychologues du développement qui invoquent l’autisme comme une dissociation développementale de la lecture de pensée. Si cette version forte du nativisme est correcte, les algorithmes nécessaires à la lecture de pensée sont « câblés » par les gènes et exprimés automatiquement lors du développement normal, la fonction de ce dernier étant essentiellement de déclencher certains aspects du processus de maturation guidé de façon endogène. Les déficits de l’autisme, en ce qui a trait à la lecture de pensée, sont une conséquence de l’échec de ce module à se développer normalement.

La description que fait Alison Gopnik de la situation fâcheuse dans laquelle se trouve un enfant autiste peut servir de point de départ pour l’examen de cette thèse.

Selon Gopnik, voici à quoi le monde social pourrait ressembler pour un enfant auquel il manque l’aptitude à lire la pensée :

Autour de moi, des sacs de peau sont affaissés sur des chaises et enveloppés dans des morceaux de tissu ; ils se meuvent et s’étirent de façons inattendues... deux taches sombres près de leur sommet tourbillonnent en allers-retours incessants. Un trou sous ces taches se remplit de nourriture et laisse sortir un flot de bruits...

Gopnik, 1997

Bien sûr, ce que veut faire ressortir Gopnik, c’est que si nous voyons des gens qui paressent, qui parlent et qui mangent, c’est précisément parce que nous savons que ces sacs de peau ont un esprit. De la même façon, nous n’entendons pas que des bruits vides de sens quand les gens parlent, nous entendons du langage. Dans ces cas, nous pouvons inférer les causes mentales non observées à partir des données primaires. Nous entendons les paroles comme du langage et voyons le comportement comme de l’action parce que nous appliquons automatiquement et sans effort les concepts grammaticaux et intentionnels requis. L’explication de la PE est que les données appropriées (langage ou comportement intentionnel) activent un module inné. Parce que nous faisons déjà l’hypothèse que les autres sont animés par des états mentaux, nous traitons simplement leurs comportements comme des données qui confirment ou infirment celle-ci.

Les théoriciens des modules de la PE, se laissent prendre par le problème posé par le fait que les attitudes propositionnelles ne sont pas directement perceptibles, un fait dont Gopnik fait une description romancée. « Pour permettre aux humains de représenter au moins certains des états mentaux qui engendrent le comportement des autres, des systèmes d’inférence spéciaux doivent exister afin de faire le pont entre l’observable et l’inobservable » (Cosmides et Tooby, 1994, p. 102)

En fait, le problème pour l’enfant n’est pas de passer de la situation décrite par Gopnik à une situation où il est un lecteur de pensée compétent qui utilise un module unique chargé de représenter toute l’information nécessaire (et seulement celle-ci) pour comprendre que le comportement des autres est motivé intentionnellement (ce qui pourrait en effet nécessiter un module de théorie de l’esprit conceptuellement élaboré). L’enfant construit plutôt sur la base d’un répertoire de mécanismes précoces de reconnaissance et de réponse sociale, spécifiés de façon innée, pour passer par inférence du comportement observé aux esprits inobservés. Ces mécanismes précoces comportent des choses comme la détection de l’expression des émotions, la reconnaissance des mouvements orientés vers un but et des attitudes corporelles animées, le suivi du regard et l’attention conjointe, et les réponses émotionnelles automatiques.

Ces mécanismes cognitifs précoces sont spécifiés de façon innée et peuvent dépendre de structures neurobiologiques spécifiées génétiquement. Je ne donnerai ici que deux exemples de tels sous-systèmes. Dans une très célèbre expérience, Heider et Simmel (1944) ont construit un montage dynamique de formes géométriques délibérément choisies en fonction de leur dissimilitude avec des formes organiques. Heberlein et ses collaborateurs ont recréé l’expérience et en ont reproduit les résultats, qui montrent que les observateurs ne pouvaient s’empêcher d’attribuer aux formes des états psychologiques (peur, inquiétude) des rôles (intimider) et des intrigues (pourchasser). Par exemple, la fin de la séquence de Heider et Simmel mettait en scène un triangle en train de « briser » ou de « détruire » un rectangle (comme l’ont expliqué de façon caractéristique des sujets normaux et des sujets de contrôle avec des lésions cérébrales, qui utilisent aussi des termes tels qu’« intimider » pour décrire l’interaction entre les formes). L’explication standard est que le montage active une capacité modulaire à répondre aux mouvements expressifs du corps. Les récits d’intimidation, et autres, sont les interprétations en termes de lecture de pensée, engendrées par les habilités précoces de la théorie de l’esprit. Il est intéressant de remarquer que SM, une patiente avec des dommages bilatéraux à l’amygdale, a décrit ainsi la fin de la séquence : « [...] les deux parties du rectangle ont fait comme un V inversé, et puis c’était tout » (Heberlein, 2001 ; Heberlein, en préparation). Les sujets autistes échouent de la même façon à interpréter les séquences de mouvements, ainsi que les comportements humains, en termes intentionnels (Castelli, 2002). La plupart des études signalent le rôle du STS (sillon temporal supérieur) dans la détection du mouvement biologique, et des études d’imagerie ont montré qu’il est activé par des présentations comme celles de Heider. Ce qui est intéressant, par contre, c’est que tout changement inattendu dans un mouvement provoque de l’activité dans cette région (peut-être parce que, dans les environnements ancestraux, de tels changements étaient pour la plupart le résultat de mouvements animaux). Frith et Frith spéculent sur la possibilité que l’activité du STS engendre les précurseurs développementaux de la lecture de pensée tels que l’attention conjointe et le suivi du regard, et ajoutent que « le système de mentalisation franchit une étape supplémentaire et utilise le schème de comportement observé pour percevoir les états mentaux qui sous-tendent ces comportements » (Frith et Frith, 2003, p. 466). La question cruciale est bien sûr de savoir si ce système de mentalisation est spécifié de façon innée, c’est-à-dire, de savoir s’il est aux systèmes antérieurs ce que la syntaxe est à la phonologie dans l’interprétation nativiste de la DSL.

Mon deuxième exemple est le phénomène des neurones miroirs, découvert entre autres par Giacomo Rizzolati, Vittorio Gallese et Lorenzo Fadiga. Rizzolati et ses collaborateurs ont montré que, autant chez les singes que chez les humains, observer l’action d’un congénère entraîne automatiquement l’activation de la partie du système moteur (spécifiquement, l’imagerie moteur produite par un système de contrôle du modèle d’anticipation [forward model]) en jeu dans les actions déclenchées spontanément. Dans les cas où le congénère observé fait le même mouvement, mais que sa cible est cachée ou absente, les neurones miroirs restent inactifs (Gallese, Fadiga et al., 1996 ; Rizzolati, 2001). En effet, les neurones miroirs sont actifs dans les cas où le mouvement est soit observé, soit amorcé spontanément, et fonctionnent ainsi comme un signal que le mouvement est une action intentionnelle. Que ce signal soit disponible sous forme propositionnelle ne fait bien sûr pas partie de cette théorie. Il joue plutôt son rôle de concert avec d’autres mécanismes subpersonnels tels que l’attention sélective. L’activation des neurones miroirs possède néanmoins un subtil corrélat phénoménologique, un sentiment d’agir [a sense of agency] démontré par une variété de troubles qui ont leur source dans le mauvais fonctionnement du système neurocognitif au sein duquel les neurones miroirs sont enchâssés.

De tels mécanismes sont périphériques, fondamentaux et innés. (Notez que l’inférence selon laquelle ces systèmes sont innés ne dépend pas de l’argument de la faiblesse du stimulus mais de résultats empiriques, dont le moindre n’est pas que les mécanismes en cause sont phylogénétiquement conservés chez les primates.) On peut comprendre comment ceux à qui il manque plusieurs de ces mécanismes peuvent faire l’expérience du monde social de la façon imaginée par Gopnik. Lorsqu’une telle personne se développe, elle n’est pas automatiquement et naturellement intégrée dans un monde social, mais elle se retrouve plutôt dans un environnement intentionnellement inerte, lequel n’offre aucun indice quant au fait que l’activité, du regard à la parole et de celle-ci à l’action, est orientée vers un but et exprime une émotion. Dans ce type de développement chez l’enfant, l’hypothèse que les autres agissent sur la base d’états mentaux est en fait un saut abductif non forcé. Cosmides, Tooby et d’autres soutiennent qu’une telle inférence n’est possible que si l’hypothèse est encodée génétiquement. Pourtant, le fait est que l’enfant est déjà intégré dans un monde social par un assortiment de mécanismes périphériques qui deviennent disponibles précocement et sans effort, et que son développement progresse dans un environnement social constitué d’un ensemble inexorable d’indices d’explication du comportement en termes intentionnels. Les éléments de preuve selon laquelle les autres personnes ont des esprits sautent aux yeux des enfants. Bien sûr, ces éléments de preuve ne rendent pas l’hypothèse nécessaire, mais ils contraignent celle-ci.

C’est pourquoi les enfants aveugles de naissance montrent certains symptômes de l’autisme mais ne sont pas autistes pour autant. Plusieurs mécanismes de la reconnaissance et de la réponse sociale sont désactivés, toutefois l’enfant aveugle n’est pas autiste puisque le reste de ses capacités de lecture de pensée est intact et, avec l’intelligence générale qui se développe rapidement, il compense et parvient à assurer une trajectoire de développement normale.

De plus, pour les enfants qui utilisent le langage, l’environnement social est saturé de références à de telles entités inobservables. Petersen et Siegal ont montré, dans une brillante étude sur des enfants sourds utilisant ou non la langue des signes, que le langage accélère le développement de la lecture de pensée (Peterson et Siegal, 1999). Pour Petersen et Siegal, le rôle du langage dans le développement de la lecture de pensée est essentiellement sémantique. Les enfants apprennent les termes qui se rapportent aux états mentaux parce qu’on y fait constamment référence lors de la conversation. Dans d’autres explications, le rôle du langage est syntaxique. La syntaxe récursive fournit un schéma pour enchâsser les termes d’états mentaux (Croit[Croit(Jill, a, F)]) (De Villiers, 2000). Pour ce qui est des structures d’argument, la théorie syntaxique éprouve la même difficulté que les explications précédentes de la lecture de pensée. Il semblerait que les concepts de la psychologie intentionnelle doivent être acquis avant qu’ils puissent être récursivement enchâssés dans un schéma de compléments. Après tout, dans de nombreux cas, des enfants ont maîtrisé les schémas de compléments (Sally voit que Jenny voit l’ours en peluche) avant l’acquisition de la lecture de pensée (Gerrans, 1998). De toute façon, le fait que le langage joue un rôle nécessaire dans le développement normal est montré par de Villiers et par des études supplémentaires de l’auteur sur les créoles et les pidgins en ce qui concerne la langue des signes. Comme pour les langues parlées, les créoles sont des langues avec une grammaire universelle et une structure de compléments, alors que les pidgins sont appauvris sur le plan de la syntaxe. Les utilisateurs d’une langue des signes créole passent le test des croyances contraires aux faits à un taux normal, alors que les utilisateurs de pidgin montrent de sérieux retards et échouent parfois à ce test même à l’âge adulte.

Si la lecture de pensée est une conséquence de l’interaction développementale entre quelques sous-systèmes précoces mis ensemble à contribution lors du développement de l’enfant et certaines fonctions linguistiques centrales pour naviguer dans le monde social, alors certains faits ne semblent pas surprenants. La variation, autant dans les symptômes de l’autisme qu’au moment où commence la lecture de pensée, sera le résultat d’une histoire développementale idiosyncratique et du degré de dommage aux différents sous-systèmes périphériques. Et, en fait, une fois qu’on s’écarte des tests non verbaux standards de la lecture de pensée, il apparaît que ni l’autisme ni la lecture de pensée ne sont monolithiques. En fait, selon la façon dont la tâche est présentée et selon la présence d’appuis au développement tels que des frères et soeurs ou une interaction sociale intensive, la lecture de pensée peut être obtenue entre deux et six ans (Wellman, 1990, Ruffman, 2003).

Quant à la structure de l’argument conceptuel, il reste un point à souligner, qui est particulièrement pertinent à la lecture de pensée. Comme nous l’avons vu plus haut, la conception nativiste de la lecture de pensée est essentiellement une conception sélectionniste. La solution neuroconstructiviste diffère de la solution nativiste quant à deux dimensions cruciales.

Premièrement, le constructiviste soutient que le développement est un processus « d’élaboration progressive plutôt que d’élimination sélective » (Quartz, 1999, p. 50). Le développement de la cognition supérieure complexe est le produit du câblage de structures corticales, initialement non contraintes, pour résoudre des problèmes environnementaux en utilisant des données fournies par les structures corticales inférieures et par des stratégies comportementales initialement contraintes (parce qu’elles le sont de façon innée). Ainsi, à mesure que l’organisme essaie de raffiner son comportement, il construit des modèles du monde et des structures de représentation appropriées à sa niche écologique.

En conséquence, et c’est là le deuxième point, l’état cortical final d’un système cognitif constructiviste est un ensemble de véhicules représentationnels dont la structure reflète les contingences développementales et environnementales. La présence quasi universelle d’un phénotype cognitif n’a pas à dépendre de la préspécification génétique de cet état final, dans la mesure où il y a suffisamment de ressources, à l’échelle de l’espèce, pour ce qui est des structures sous-corticales spécifiées de façon innée et des niches environnementales. Ces deux conditions sont satisfaites pour la lecture de pensée.

Mon objection contre l’argument conceptuel quant à la modularité innée de la lecture de pensée tient essentiellement au fait que les arguments sur la faiblesse du stimulus, qui ont leur place dans les arguments pour la modularité de l’acquisition du langage, ne s’appliquent pas à la lecture de pensée. Dans le cas de la grammaire, les données disponibles sous-déterminent les grammaires possibles d’une façon qui suggère qu’une version minimale de la grammaire universelle doit être « intrinsèque » pour pouvoir expliquer la convergence des trajectoires de développement. Dans le cas de la lecture de pensée, une analogie avec le problème consistant à chercher dans un espace infini de solutions possibles la réponse à la question « quelle structure grammaticale sous-tend les données linguistiques primaires ? » n’est pas évidente. Les données psychologiques primaires forcent déjà l’abduction nécessaire.

Si on pense le développement (plus exactement : si on le reconstruit à des fins théoriques) comme le problème consistant à développer un système de traitement qui représente une hypothèse cible, on peut approcher la question dans un sens ou dans l’autre. De façon descendante [top-down], on pourrait débuter avec l’hypothèse en place ou avec des mécanismes cognitifs de très haut niveau capables de représenter des hypothèses au même niveau d’abstraction et de portée théorique que l’hypothèse cible (le langage naturel ou les compétences mathématiques pourraient y prétendre). Le problème serait alors de montrer comment le développement des mécanismes préalables de bas niveau est modelé, dans le phénotype, par la présence de l’état cible. Par exemple, comment les mécanismes phonologiques de bas niveau qui en viennent à être organisés par la grammaire universelle jouent leur rôle nécessaire dans le traitement linguistique.

Le problème pour un neuroconstructiviste est de montrer comment les mécanismes de bas niveau peuvent jouer un rôle dans l’assemblage d’un mécanisme cognitif de haut niveau en l’absence d’états finaux préspécifiés. Ma réponse, en ce qui concerne la lecture de la pensée, c’est que les mécanismes de haut niveau, tels que le langage, réduisent le fossé entre la cognition de bas et de haut niveau au point de permettre qu’il soit franchi par un saut abductif forcé. Le jeune enfant vit dans un monde animé par le comportement intentionnel, le jeu et l’interaction sociale vécue de façon émotionnelle, et où il résulte du développement ascendant [bottom-up] que l’engagement intentionnel est récompensé. En même temps, le langage naturel fournit à la fois un flux constant de références aux états mentaux et un moyen de représentation doté de la complexité structurelle nécessaire pour les traiter cognitivement. Reste à l’enfant à construire le sens de son monde social grâce à l’hypothèse que les états mentaux sont des représentations. Cette hypothèse jette un pont par-dessus l’étroit fossé entre les représentations engendrées de façon ascendante, dont le rôle est limité à des comportements et des domaines cognitifs particuliers, et une façon de penser les états mentaux qui est entièrement générale et appropriée à n’importe quel contexte.

Le problème pourrait être analogue à celui du développement du concept de nombres entiers. L’enfant entend le comptage des séries (« 1, 2, 3, ... »), il entend les gens compter et quantifier, mais il doit réaliser que les références de ces expressions sont des entités abstraites inobservables : les nombres. Il est possible que l’hypothèse soit préspécifiée de façon nativiste, et que lorsque la cognition numérique parvient à maturité, l’enfant associe la représentation des nombres au comptage des séries, auquel cas le rôle du comptage est essentiellement de servir de déclencheur. Il ne joue aucun rôle dans la construction des représentations.

Il est aussi possible que l’enfant ait déjà certaines ressources numériques. Des fichiers unitaires pour garder la trace d’un, deux ou trois objets, et des concepts de magnitude relative (plus gros que). Ceux-ci réduisent l’écart entre l’état final et l’état cognitif initial de l’enfant. Le rôle de l’énumération des séries est de suggérer l’hypothèse selon laquelle « chaque membre de la série est relié à ses voisins de la même façon que 2 est relié à 1 et à 3 ». Susan Carey appelle cela une analogie hasardeuse [a wild analogy]. Les points importants pour notre discussion sont que cette analogie est soumise à des contraintes ascendantes (rendue prudente ?) et qu’elle contraste avec les théories qui nécessitent que l’hypothèse soit préspécifiée (Carey, 2000).

Je soupçonne que le fossé entre les ressources de représentation précoces et matures qui est comblé par l’hypothèse cible est plus étroit dans le cas de la lecture de pensée que dans le cas des nombres.

Lecture de pensée et neuropsychologie

Les investigations psychologiques sur la lecture de pensée ont souligné le rôle des circuits distribués qui relient les aires limbiques aux substrats des systèmes périphériques précoces tels que ceux décrits plus haut (Frith et Frith, 2003 et Saxe et al., sous presse, constituent des revues exhaustives ; voir aussi Gallagher, 2003). Tager-Flusberg et Sullivan attribuent à ces circuits l’aspect socioaffectif de la lecture de pensée (Tager-Flusberg, 2000). L’hypothèse d’un module inné de lecture de pensée ne peut toutefois en rester là puisque ces découvertes correspondent entièrement avec l’hypothèse défendue plus haut : que la lecture de pensée est une conséquence développementale de l’interaction entre de nombreux sous-systèmes précoces et des processus centraux et affectifs, plutôt qu’un sous-système cognitif distinct spécifié de façon innée.

Des études supplémentaires ont tenté de trouver des circuits neuraux spécialisés dans la lecture de pensée, distincts à la fois du traitement socioaffectif précoce et des processus d’ordre supérieur qui la précèdent et en indiquent la présence, tels que le langage et les fonctions exécutives. De telles études confrontent habituellement le sujet à deux tâches (une dont on fait l’hypothèse qu’elle requiert la lecture de pensée et une autre qui ne requiert pas cette capacité), et examinent la différence dans l’activation neuronale. Par exemple, interpréter deux histoires ou compléter deux séquences d’images, l’une d’entre elles n’étant intelligible qu’en termes d’intentionnalité. D’autres tâches sont conçues pour solliciter l’interprétation pragmatique du langage (où des aspects non littéraux du contexte requièrent une inférence quant à l’intention du locuteur, par exemple : « ta chambre est une porcherie »), la récupération de souvenirs autobiographiques et la métareprésentation de l’émotion. Une autre expérience astucieuse consiste à demander aux sujets de jouer à un jeu présenté sur un écran d’ordinateur, sous deux conditions différentes : dans la première on leur dit qu’ils jouent contre un ordinateur, et dans la seconde, qu’ils jouent contre une autre personne. Une analyse récente concluait que le cortex médial préfrontal (CMPF) est activé de façon sélective pour les tâches qui nécessitent des représentations de plus haut niveau des états mentaux, autant les siens que de ceux des autres (Frith et Frith, 2003). Ces tâches activent aussi bilatéralement le STS et les pôles temporaux mais, par soustraction, les Frith ont conclu que le CMPF semblait être l’aire concernée par la métareprésentation des états mentaux en tant que tels. Il est important de noter qu’il s’agit là d’une conclusion de moins grande portée que celle avancée par d’autres études récentes des données d’imagerie. Saxe et al. ont trouvé que le CMPF, les pôles temporaux et le STS jouent un rôle dans les tâches conçues pour isoler la lecture de pensée. Dans ce qui suit, je discuterai du rôle du CMPF puisqu’il est évoqué dans les deux études.

L’aspect le plus intéressant des conclusions des Frith est peut-être la distinction que les auteurs font entre se préoccuper d’un état mental et inférer son contenu. Il y a une analogie instructive avec les trois conditions différentes consistant à faire l’expérience d’un état douloureux ou émotionnel, s’en occuper et lui attribuer une cause. Un stimulus douloureux entraîne l’activation d’une aire distincte de l’aire activée par le fait de se préoccuper de la douleur (lorsque, par exemple, les sujets doivent évaluer son intensité). Chris et Utah Frith suggèrent que le CMPF est relié de la même façon avec les états mentaux de premier ordre que la préoccupation envers la douleur avec la douleur elle-même : « Le CMPF est activé lorsqu’on se préoccupe de nos propres états mentaux, de même que des états mentaux des autres. »

Apparemment, par cette formulation, ils suggèrent que le CMPF accomplit un sous-ensemble des tâches exécutives (à savoir, l’attention) dédiées aux états mentaux. Mais, bien sûr, se préoccuper d’un état mental ne consiste pas à dire quoi que ce soit à propos de la relation entre cet état et son objet. Pour cela, nous avons besoin de figurer les relations de représentation entre l’état et son objet, et les Frith font remarquer que des connaissances supplémentaires pourraient ici être requises : « Certes, d’autres composantes du système de mentalisation doivent fournir le contenu de ces pensées, sentiments, croyances et leurs actions » (p. 469). Ils attirent notre attention sur le fait que le STS et les pôles temporaux, auxquels le CMPF est connecté, sont en jeu dans des tâches telles que la récupération de scénarios sociaux stéréotypiques et la signalisation du comportement orienté vers un but, qui aident à fournir un contexte plus large pour l’interprétation des états mentaux qui nous préoccupent. Mais, comme ils le font remarquer, le cas de la pragmatique (« Ta chambre est une porcherie », « Bonjour ! Il y a quelqu’un à la maison ? ») requiert parfois l’assimilation de connaissances plus larges. Par exemple, l’activation du CMPF pourrait alors signaler à l’adolescent que sa mère essaie de communiquer quelque chose de non littéral, mais l’inférence exactement communiquée met en jeu d’autres processus corticaux et sous-corticaux.

Tager-Flusberg et Sullivan proposent, sur la base d’études comme celles-ci, que la lecture de pensée se sépare au moins en deux sous-systèmes cognitifs. L’un d’eux, situé dans le cortex orbitofrontal, concerne ce qu’ils appellent la cognition socioperceptuelle, qui se rapporte aux aspects affectivement ajustés de la cognition sociale précoce. L’autre est l’aspect sociocognitif ou métareprésentationnel de la lecture de pensée. Son substrat neural est le cortex médial préfrontal (Tager-Flusberg and Sullivan, 2000)[1] :

Ces systèmes sont intégrés par des circuits neuraux, de façon à constituer ensemble ce que Brother (1990) désigne comme le « cerveau social ».

L’amygdale, le cortex médial temporal et le cortex préfrontal forment un complexe neural unifié qui sert d’intermédiaire dans le traitement d’une gamme d’informations sociales, de la reconnaissance des visages, des émotions et du mouvement intentionnel, jusqu’à l’inférence des contenus de l’esprit d’une autre personne.

Italique ajouté

Tager-Flusberg, 2000, p. 63

Une interprétation naturelle de ces remarques, combinées avec celles des Frith, est que l’activation du CMPF est une condition nécessaire à la lecture de pensée. Quelques auteurs se sont opposés à cette thèse :

En général, les données neuropsychologiques ne sont pas encore assez spécifiques ou assez consistantes pour fournir une explication des causes neurologiques de l’autisme. Qui plus est, il n’y a pas, à notre connaissance, d’éléments de preuve directs que la maturation de la matière blanche de l’hémisphère droit ou de l’aire de Brodmann numéro 8 (le CMPF) rend compte de l’amélioration simultanée dans les tâches spécifiques à la théorie de l’esprit et dans les tâches de FE (fonctions exécutives) qui est observée vers l’âge de 4 ans.

Perner, 1999, p. 343

Une partie du scepticisme de Perner et de Lang provient du fait que le CMPF s’activait aussi durant les tâches exécutives. Puisque les fonctions exécutives se rapportent à un ensemble de compétences telles qu’inhiber les réponses primordiales, maintenir les éléments pertinents en mémoire de travail et diriger l’attention de façon appropriée, il est fort plausible que les tâches de mentalisation entraînent une activité exécutive. Mais la compétence exécutive est un processus central non modulaire ; Perner et Lang suggèrent en conséquence que la lecture de pensée ne serait pas, après tout, un module cognitif mais plutôt un aspect du traitement central.

Ce débat n’est pas résolu de manière définitive, bien que certaines études suggèrent que le CMPF, lequel est en jeu dans la lecture de pensée, est antérieur aux régions qui sont en jeu dans les fonctions exécutives indépendantes de la tâche (Gallagher, 2000), ainsi qu’à d’autres régions qui montrent certaines dissociations apparentes entre les fonctions exécutives et la lecture de pensée (Saxe, sous presse).

Néanmoins, même si on peut démontrer de manière définitive que l’activation sélective du CMPF est un substrat neural nécessaire à la lecture de pensée qui se dissocie des autres fonctions cognitives, cela ne règle pas le cas de l’innéité.

Comme le montre le cas de la lecture, les compétences cognitives qui ne sont pas innées peuvent être modularisées durant le développement, s’installer dans des substrats neuraux distincts et vulnérables aux déficits acquis ou spécifiques. En fait, une explication naturelle pour le câblage du CMPF est suggérée par les théories neuroconstructivistes selon lesquelles l’architecture innée est en grande partie restreinte aux structures sous-corticales. Le cortex, qui fait preuve d’une plus grande plasticité développementale, acquiert néanmoins sa structure d’une façon non aléatoire, compte tenu des structures sous-corticales innées et des données obtenues lors de confrontations avec l’environnement, dont le déroulement est contraint par des structures perceptuelles et des routines comportementales innées de bas niveau. Le module de reconnaissance des visages qu’on croit la plupart du temps être réellement inné, mais qui est plus probablement une aire de reconnaissance des objets possédant juste assez de structures innées pour être sensibilisée aux objets en forme de visages — suffisamment pour leur assurer une attention préférentielle —, pourrait être un exemple. Le reste de la structure cognitive se développe grâce à l’expérience : l’exposition émotionnellement gratifiante aux aspects caractéristiques et configuratifs des visages humains qui, pour ainsi dire, « remplissent » le gabarit. Étant donné qu’il y a une période de la vie où l’enfant est préoccupé par les visages à l’exclusion de tout autre chose, même un esprit plastique développerait des structures de reconnaissance des visages. Néanmoins, les contraintes innées qui structurent l’expérience de l’enfant garantissent presque l’uniformité dans le développement, à un point tel que le module de reconnaissance des visages semble avoir été câblé de façon endogène.

Dans le cas du CMPF, les contraintes innées analogues sont données par la présence des structures dédiées à la cognition socio-affective ; celles-ci s’assurent que la plasticité représentationnelle du CMPF, quelle qu’elle soit, est limitée par le fait que les ressources cognitives de l’enfant en cours de développement sont consacrées à son monde social juste au moment où le CMPF est en cours de câblage. Ainsi, s’il manque à la personne autiste les fonctions du CMPF, c’est probablement le résultat du manque de données cruciales durant une période critique plutôt que du manque de ressources génétiques consacrées au CMPF. En particulier, il n’est pas nécessaire de postuler l’encodage génétique de la base neurocognitive de la lecture de pensée. Celle-ci se développera de toute façon puisque, dans un environnement social standard, les précurseurs spécifiés de façon innée fonctionnent normalement.

Appendice méthodologique

Je n’ai pas essayé de soutenir que la lecture de pensée n’est pas une habileté spécifique qui peut se dissocier des autres formes de cognition lors du développement, mais j’ai tenté d’utiliser les données neuropsychologiques pour soutenir l’idée que la réalisation d’une telle chose exige la possibilité que la psychologie ordinaire soit un module cognitif spécifié de façon innée.

Si on pense à la science cognitive comme à une forme de rétro-ingénierie [reverse engineering] des sous-systèmes cognitifs, on peut voir que les déficits développementaux ou acquis nous donnent un indice de départ concernant les phénotypes cognitifs possibles, mais, étant donné que n’importe quel phénotype cognitif est aussi cognitivement et neurobiologiquement réalisable de multiples façons, du moins au niveau d’abstraction dont traitent les psychologues cognitifs, n’importe quelle inférence allant du comportement au génotype est incertaine. Malgré tout, la PE procède en comparant des sujets qui montrent un syndrome de comportement anormal (l’autisme) avec la performance moyenne de sujets normaux et en postulant un dispositif unique pour expliquer la différence. En effet, l’hypothèse de la modularité innée de la lecture de pensée nécessite que tous les symptômes soient unifiés par le même phénotype cognitif et que ce phénotype soit un élément de preuve pour un génotype cognitif modulaire.

Ce point peut sembler trivial. Les tenants de la PE et moi-même sommes d’accord sur le fait que la lecture de pensée montre les caractéristiques de la modularité, mais je soutiens que le caractère automatisé du processus cognitif s’apparente plutôt à la lecture : la production automatique d’une hypothèse acquise lors du développement plutôt qu’au fil de l’histoire évolutionniste. Par conséquent, cette question n’est pas triviale puisqu’elle affecte la façon dont on comprend l’esprit. Si la science cognitive concerne la rétro-ingénierie de l’esprit, elle ne devrait pas postuler l’architecture cognitive à un niveau d’abstraction trop élevé simplement pour unifier un phénotype comportemental. Dans un autre contexte, Marshall et Halligan ont exprimé élégamment mon point de vue en disant que :

La soi-disant « psychiatrie biologique » a souvent tenté de passer d’un libellé clinique à un déficit biochimique sans porter attention au niveau d’analyse systémique qui pourrait servir d’intermédiaire entre le comportement et le substrat matériel (Marshall et Halligang, 1995). Le danger est bien sûr que cette approche mène à de vastes (et coûteuses) recherches du substrat biologique d’entités non existantes.

Marshall et Halligang, 1996, p. 5

Mon désaccord avec les tenants de la PE concerne le niveau systémique correct pour l’analyse. S’ils ont raison, il existe donc de nombreux modules cognitifs de haut niveau dotés de substrats biologiques dont le développement est soumis à de fortes contraintes génétiques. Si j’ai raison, plusieurs modules périphériques sont donc mis ensemble à contribution lors du développement pour accomplir ces tâches quasi centrales. S’ils ont raison, alors les variations significatives dans les phénotypes normaux de lecture de pensée doivent être explicables en tant que problèmes de performance à l’intérieur d’un même module spécifié génétiquement ; tandis que, de mon point de vue, nous devrions nous attendre à des variations individuelles significatives en fonction de la contribution différentielle des composantes de ces architectures construites de façon idiosyncratique.

Plusieurs problèmes empiriques et théoriques doivent être clarifiés pour résoudre ces questions, mais il semble néanmoins que l’argument selon lequel la lecture de pensée doit être un module cognitif spécifié de façon innée pour contraindre les inférences à propos du comportement observable est moins convaincant quand on comprend que l’enfant n’observe pas de soi-disant comportements « à l’état brut » [«bare» behavior], mais bien des actions chargées intentionnellement dès le tout début.

Appendice philosophique

Quine est célèbre pour avoir soutenu que l’épistémologie se trouve en continuité avec la science naturelle : c’est-à-dire que la connaissance, dans n’importe quel domaine, doit être conçue comme la construction d’une théorie sur la base des données probantes :

L’épistémologie, ou quelque chose d’approchant, tombe simplement en place en tant que chapitre de la psychologie, et donc de la science naturelle. Elle étudie un phénomène naturel, à savoir, un sujet humain physique. On accorde à ce sujet humain un certain input contrôlé expérimentalement — certains motifs d’irradiation à des fréquences assorties, par exemple — et, avec le temps, le sujet accouche comme output d’une description du monde extérieur tridimensionnel et de son histoire. La relation entre l’input, ténu, et l’output, torrentiel, est une relation que nous sommes appelés à étudier sensiblement pour les mêmes raisons qui ont toujours interpellé l’épistémologie : i.d., afin de voir comment les données sont reliées à la théorie et de quelle façon une théorie de la nature transcende les données disponibles. [...] Mais la différence manifeste entre l’ancienne épistémologie et l’entreprise épistémologique dans ce nouveau cadre psychologique, c’est que nous pouvons maintenant faire libre usage de la psychologie empirique.

Quine, 1969, 82-83

Dans le cas des autres esprits, les données observables sont constituées par le comportement manifeste de ceux que Quine, en tant que béhavioriste, identifiait aux états mentaux eux-mêmes. Les cognitivistes, par contre, considèrent le comportement pertinent comme un élément de preuve de la présence d’états mentaux dont les opérations voilées produisent le comportement observable qui forme l’explanandum de l’explication mentaliste. Néanmoins, le cognitivisme reste à l’intérieur des paramètres méthodologiques quiniens, considérant les états mentaux comme des intermédiaires inobservables entre l’input ténu et l’output torrentiel.

La psychologie du développement contemporaine et la PE sont cognitivistes d’un bout à l’autre, traitant la psychologie intentionnelle comme une inférence du comportement observé aux états mentaux inobservés, ce que les citations précédentes de Cosmides, Tooby et Gopnik mettent en lumière. Les raisons pour lesquelles les données (le comportement intentionnel) doivent être entièrement caractérisées en termes non intentionnels ne sont pas aussi claires. Assurément, pour des béhavioristes réductivistes comme Quine ou Dummett, une telle caractérisation est obligatoire puisqu’ils ont besoin d’identifier les états intentionnels à des séquences de comportement qui ne sont pas interprétées à l’aide de notions intentionnelles.

Toutefois, un cognitiviste ne fait pas tout à fait face à la même restriction, dans la mesure où il pourrait exister une explication cognitiviste dotée de fondations plus riches. J’ai suggéré qu’une telle explication existe : l’enfant normal n’est pas confronté à un monde intentionnellement inerte d’objets en mouvement, mais à des corps animés, des expressions, des gestes, des vocalisations et des émotions. Afin de traiter le monde de cette façon sur le plan cognitif, l’enfant n’a pas besoin de posséder une psychologie intentionnelle tout entière. Il possède plutôt un ensemble de mécanismes cognitifs dont la fonction propre est de le sensibiliser aux possibilités d’engagement intentionnel avec son environnement. Il résultera de cet engagement que l’enfant développera les concepts de la psychologie intentionnelle.

Philosophiquement, une affirmation similaire a été faite pour contrer les tentatives de naturaliser l’épistémologie dans le champ béhavioriste. En fait, les objections de McDowell aux explications antiréalistes de la compréhension du langage (qui présupposent une explication de la compréhension intentionnelle puisque les deux ne peuvent être dissociés, selon l’auteur) ridiculisent la tentative de reconstruire la compréhension des états intentionnels comme une théorie utilisable par un extra-terrestre pour prédire la trajectoire du comportement humain. Comme il le dit : « Du point de vue d’un extra-terrestre, il n’y a pas de raison de supposer que les intentions des activités humaines puissent être discernées dans quoi que ce soit. » Il est frappant que Temple Grandin, une autiste hautement fonctionnelle, se soit décrite dans ses rencontres sociales précoces comme « une anthropologue sur Mars » pour qui l’intention de la majeure partie du comportement humain reste opaque.

La PE résout ce problème en supposant que nous avons un module inné pour lire les intentions dans le comportement humain, mais cette solution est trop dépendante d’une analyse du problème qui prend l’injonction quinnienne trop au sérieux. La solution de McDowell est de faire remarquer que (à moins d’être autiste) le fait que le comportement soit signifiant se manifeste déjà dans ce comportement. Ultérieurement, après une période de développement, l’enfant acquiert la maîtrise des concepts nécessaires pour expliquer la signification des comportements et peut déployer explicitement ceux-ci. McDowell décrit ce processus en utilisant l’expression de Wittgenstein : « La lumière se fait graduellement sur le tout. » Il comprend que certains pourraient trouver cela purement métaphorique mais fait remarquer que sa tâche consiste à expliquer la phénoménologie de la compréhension et que « la difficulté à dire quoi que ce soit de satisfaisant à propos de la phénoménologie de la compréhension réside donc dans le fait que progresser dans le langage — ou mieux, être séduit par celui-ci — consiste simultanément à progresser dans une conception du monde qui inclut une conception de soi-même parmi les autres (Wallace, 1971, McDowell, 1981).

McDowell, comme plusieurs phénoménologues, est hostile au cognitivisme pour plusieurs raisons, mais il semble néanmoins qu’un rapprochement soit de mise pour atteindre une pleine compréhension du développement cognitif. Que l’expérience du monde faite par l’enfant ne soit pas intentionnellement inerte est une intuition phénoménologique importante, que le développement du langage et celui de la compréhension intentionnelle se soutiennent mutuellement en est une autre. Le cognitivisme sert de base à ces intuitions phénoménologiques et augmente par là même notre compréhension de la façon dont le développement dépend du fait d’être situé, non pas dans le monde inanimé de Dummett et de Quine, mais dans un monde animé par de l’agentativité [alive with agency].