Article body

Introduction

L’intention du présent texte est de saisir l’intérêt, mais aussi les limites de l’usage du terme « diagnostic » lorsqu’il est utilisé pour qualifier l’évaluation des compétences scolaires. Lorsqu’on parle d’évaluation diagnostique, que cela implique-t-il comme démarche dans le processus évaluatif ? En quoi cela présente-t-il des avantages ou des inconvénients ? Cette question prend des sens différents selon la finalité de l’évaluation (Marcoux, Fagnant, Loye & Ndinga, 2014). Par exemple, en quoi une évaluation « diagnostique » peut-elle être utile pour améliorer les apprentissages des élèves ? En quoi peut-elle l’être pour l’organisation d’un système éducatif ?

Ces questions sont importantes en elles-mêmes. Or, elles le sont d’autant plus que le mot « diagnostic » peut prendre, selon les contextes, une pluralité de sens. Il semble que ces sens s’organisent comme des degrés entre deux pôles. Le premier de ces pôles réfère à l’usage initialement médical du terme : le diagnostic est le raisonnement par lequel on cherche à identifier la nature de l’affection dont un patient est atteint à partir des symptômes constatés. Ce sens peut s’étendre à d’autres domaines que la médecine : on pourra parler, par exemple, du diagnostic qui permet d’identifier ce qui est à l’origine d’une panne de voiture. Dans le cadre du second pôle, le diagnostic est plutôt envisagé comme un constat, sans qu’il y ait besoin de remonter de ce constat à des causes de ce qui est constaté. Ainsi, dans certains pays, le vendeur d’un bien immobilier doit fournir à l’acheteur un « diagnostic immobilier » indiquant si le bâtiment contient de l’amiante ou du plomb ou précisant sa « performance énergétique». Il y a donc, à une extrémité du spectre, le diagnostic avec inférence qui, partant de symptômes ou de signes visibles, infère une origine non visible, et ce raisonnement inférentiel est indispensable à la prise de décision. À l’autre extrémité se trouve une forme de diagnostic qui n’a rien d’autre à établir que ce qu’il constate directement, car le constat suffit à la prise de décision.

Il nous faudra voir comment se situent, entre ces deux pôles que sont le « diagnostic-constat » et le « diagnostic-recherche des causes», les différents types d’évaluation diagnostique des compétences dans le monde scolaire. Mais, auparavant, nous devrons rappeler quelques caractéristiques de la notion de compétence. Nous ne le ferons pas à partir d’une définition a priori de ce qu’est une compétence, mais à partir de son usage dans les référentiels scolaires, car c’est par rapport à ces spécificités qu’il sera possible de juger de l’intérêt d’une démarche évaluative à caractère diagnostique.

Préliminaires : les spécificités de l’évaluation de compétences

Chacun sait comment sont formulées ordinairement les compétences dans les référentiels scolaires. En voici quelques exemples : « Formuler des hypothèses, les tester et les éprouver » (Socle commun de connaissances, de compétences et de culture, Ministère de l’Éducation nationale, de l’Enseignement supérieur et de la Recherche, 2015, France) ; « Écrire des textes de genres différents adaptés aux situations d’énonciation » (Plan d’études romand, Conférence intercantonale de l’instruction publique de la Suisse romande et du Tessin, 2010, Suisse) ; « Effectuer à la main un calcul isolé sur des nombres en écriture décimale de taille raisonnable » (Socle commun des connaissances et des compétences, Ministère de l’Éducation nationale, 2006, France) ; et « Résoudre des problèmes simples de proportionnalité directe » (Socles de compétences, Ministère de la Communauté française, 2000, Belgique).

Ce type de formulation consiste à indiquer l’action à laquelle la compétence peut donner lieu (résoudre des problèmes, écrire des textes, effectuer des opérations, etc.), parfois en la faisant précéder des expressions telles que « être capable de » ou « savoir ». Mais, en toute rigueur, l’action ainsi formulée ne constitue pas la compétence ; elle n’en constitue que le résultat. Ces formulations indiquent précisément ce que la compétence produit (la formulation d’une hypothèse, la résolution du problème, etc.), c’est-à-dire ce qui est parfois appelé la « performance ». La compétence elle-même, c’est le pouvoir censé être à l’origine de cette performance et qu’on situe au sein du sujet qui l’a accomplie. Toutefois, ces énoncés de compétences ne disent en réalité rien de la compétence. Comme le faisaient remarquer dès 1994 Minet, Parlier et de Witte, la compétence que possède un individu est toujours une réalité inférée à partir de ce qu’on lui voit faire.

Or, cette inférence a toujours quelque chose d’incertain. Lorsqu’un élève accomplit correctement une action, il n’y a pas de certitude que cette réussite ponctuelle prouve absolument qu’il détient la compétence à réaliser ce type d’action. Son succès ponctuel peut être dû au hasard ou à des circonstances particulières (l’énoncé même de la question, l’aide dont il pouvait disposer, etc.). Imaginons qu’un élève ait rédigé un texte argumentatif qui réponde aux critères scolaires pour ce type de tâche. Peut-on en déduire à coup sûr qu’il saura rédiger tout texte argumentatif sur n’importe quel sujet ? Il se pourrait que le thème proposé pour l’argumentation lui soit familier ou lui tienne à coeur, qu’il ait déjà fait un exercice identique, que l’ordre spontané des idées qui lui viennent corresponde par hasard à un ordre rationnel, etc.

Cette caractéristique des compétences ou, du moins, de la manière dont elles sont formulées a une conséquence évidente sur l’évaluation. Si celle-ci se borne à provoquer et à constater la performance, la réalisation de l’une ou de plusieurs d’entre elles n’est jamais une garantie absolue que l’élève réalisera d’autres performances du même type, mais différentes par certains caractères. La résolution d’un problème de géométrie diffère de la résolution d’un autre problème de géométrie, même s’ils portent sur les mêmes notions ; la lecture et la compréhension d’un récit diffèrent de celles d’un autre récit, etc. Parmi les tâches qui relèvent d’une même compétence, chacune a un caractère inédit. Les exigences de l’évaluation viennent se heurter, là, au problème du transfert ou, pour le dire autrement, de la répétabilité d’une démarche lorsqu’elle s’exerce sur des objets et dans des contextes qui diffèrent les uns des autres. C’est par rapport à cette difficulté classique de l’évaluation des compétences que la notion de diagnostic est susceptible d’apporter des éléments intéressants, car le diagnostic ou, plus précisément, le « diagnostic-recherche des causes», au sens que nous avons évoqué plus haut, consiste à remonter de l’effet à la cause, à analyser du constatable pour émettre des hypothèses sur ce qui le produit. Ainsi, de même que la démarche diagnostique en médecine analyse des symptômes pour remonter à la maladie qui les engendre, la démarche diagnostique à l’école permettrait de remonter de la performance de l’élève à la compétence dont elle est le produit. Encore faudrait-il pour cela, comme nous le montrerons plus loin, que la forme d’épreuve proposée permette ce type d’analyse diagnostique.

En outre, une autre spécificité de la compétence doit être signalée. Comme nous venons de l’indiquer, le drame de l’évaluation des compétences est qu’il y a toujours une incertitude sur le fait qu’un individu ayant réussi une tâche puisse réussir une autre tâche du même type. S’il en est ainsi, c’est parce que des tâches ou des situations relevant d’une même compétence peuvent cependant comporter entre elles des différences notables.

Pourtant, dans les référentiels scolaires, il existe des énoncés de compétences qui n’ont pas ce caractère. Ainsi en va-t-il de l’énoncé « Effectuer à la main un calcul isolé sur des nombres » (voir plus haut) ou « Repérer les marques de l’organisation générale d’un texte en paragraphes ». Il est possible d’ailleurs d’imaginer bien d’autres énoncés dont tout le monde s’accorde pour dire qu’ils sont indispensables, tels que « Accorder en genre et en nombre l’adjectif avec le nom » ou bien encore, en anglais, « Mettre une phrase à la forme interrogative». Chacune des actions de ce genre peut s’exercer sur des objets chaque fois nouveaux (lorsqu’on effectue une multiplication, elle ne porte pas chaque fois sur les mêmes nombres), mais l’action reste d’une fois à l’autre identique à elle-même, en ce qu’elle correspond au même algorithme. Parmi les chercheurs qui travaillent sur la notion de compétence, il existe un large consensus pour considérer que les actions de ce type (à caractère automatisable) ne sont pas des compétences (p. ex., parmi beaucoup d’autres, Le Boterf, 1994, 1997 ; Rey, 1996 ; Perrenoud, 1997 ; De Ketele, 2000 ; Lasnier, 2000 ; Roegiers, 2000, 2003 ; Legendre, 2001 ; Beckers, 2002 ; Dolz & Ollagnier, 2002 ; Jonnaert, 2002 ; Scallon, 2004). Tout au plus sont-elles des « procédures » ou des « savoir-faire » faisant partie (en même temps que des savoirs et des attitudes) des ressources pour l’exercice des véritables compétences. Une vraie compétence consiste à mobiliser, à bon escient, parmi les ressources dont dispose l’individu, celles qui conviennent à une situation ou à une tâche toujours quelque peu nouvelle. Cette mobilisation à bon escient comporte à la fois et indissolublement le choix convenable des ressources et leur combinaison également adéquate.

Notons que cette conception de la compétence correspond à l’usage ordinaire du terme. Dans la vie courante, un professionnel est considéré comme « compétent » non pas seulement lorsqu’il est capable d’effectuer, à la demande, des opérations élémentaires propres à son métier, mais lorsqu’il est capable de décider par lui-même quelles opérations il y a lieu de mettre en oeuvre pour répondre à une situation relevant de son domaine, mais éventuellement non routinière.

En accord avec cette conception de la compétence, l’évaluation de compétences doit nécessairement passer par l’affrontement des élèves à une tâche inédite et complexe. Inédite, en ce qu’elle ne doit pas avoir fait l’objet d’une automatisation en classe, car, si elle a été automatisée, c’est qu’elle n’est pas une compétence, mais une procédure. Complexe, non pas en ce qu’elle doit être intentionnellement difficile, mais en ce qu’elle doit exiger la mise en oeuvre d’une pluralité de ressources, car la compétence tient à la capacité qu’a l’individu de choisir, mais aussi de combiner les ressources qui conviennent.

L’évaluation diagnostique des systèmes d’enseignement

C’est connu, dans de nombreux pays, sont organisées des évaluations de compétences qui ne visent pas à caractériser chaque élève, mais à évaluer les systèmes éducatifs ou des parties de ceux-ci (p. ex., les écoles d’une région ou les écoles d’un type donné). L’évaluation du Programme international pour le suivi des acquis des élèves (PISA) en est un exemple sur le plan international. À l’échelle nationale, il existe aussi, dans plusieurs pays, des épreuves standardisées conçues et organisées par la puissance publique, c’est-à-dire extérieurement aux enseignants et aux établissements. C’est le cas, par exemple, des « épreuves externes non certificatives » organisées en Fédération Wallonie-Bruxelles (FWB) à différents moments du cursus pour chaque discipline.

Les évaluations de ce type sont bien des évaluations des compétences des élèves, mais le but est de fournir aux responsables éducatifs des informations permettant le pilotage du système. À première vue, il semble en effet intéressant, pour l’élaboration des politiques publiques, de connaître le niveau moyen des élèves à un âge donné dans une matière donnée, de pouvoir comparer ce niveau avec celui d’autres pays et de pouvoir repérer les éventuelles disparités internes dans les résultats (entre régions, entre établissements ou types d’établissement, selon l’origine des élèves, etc.).

Toutefois, si l’on examine, à titre d’exemple, les épreuves externes non certificatives de la FWB, on constate, comme le relèvent Laveault, Dionne, Lafontaine, Tessaro et Allal (2014), qu’elles portent principalement sur des savoir-faire automatisables et sur des tâches inédites mais simples. Les tâches inédites et complexes y sont rares et, par suite, ces épreuves ne permettent d’évaluer des compétences au sens fort indiqué ci-dessus que d’une manière incomplète. En outre, même lorsque, incidemment, des tâches nouvelles et complexes s’y trouvent, elles ne sont pas construites d’une manière qui permette de comprendre systématiquement les raisons pour lesquelles, le cas échéant, un élève ne parvient pas à effectuer correctement la tâche.

De ce fait, on ne voit pas en quoi les résultats à ces épreuves permettraient aux enseignants d’améliorer leur pratique en intervenant didactiquement sur les causes des difficultés des élèves. On ne voit pas non plus en quoi ces résultats pourraient aider les responsables du système éducatif à prendre des décisions susceptibles d’améliorer la performance globale de la population scolaire, décisions qui devraient nécessairement viser directement ou indirectement la modification des pratiques enseignantes. Tout au plus les résultats à ce type d’épreuve permettent de signaler aux enseignants les domaines du savoir ou les sous-disciplines dans lesquels les élèves sont en moyenne moins performants.

Par suite, si certains tiennent à dire que les épreuves de ce type constituent des diagnostics d’un système éducatif (ou d’une de ses parties), il faut entendre ce terme de diagnostic dans le sens de constat d’une situation, sans possibilité d’émettre des hypothèses opérationnelles sur ses causes. Cela conduit à se demander pourquoi de telles pratiques évaluatives jouissent aujourd’hui d’un tel engouement de la part des décideurs institutionnels, alors qu’elles fournissent si peu d’informations vraiment utiles à l’amélioration des systèmes. Deux raisons peuvent être avancées à ce propos.

La première est d’ordre technique. Comme le rappellent De Ketele et Gérard (2005), un outil d’évaluation, pour avoir des qualités métriques suffisantes, doit comporter un échantillon de questions (ou de tâches) représentatif du domaine d’apprentissage qu’il prétend mesurer. Pour que cette représentativité soit assurée, il est indispensable que l’outil comporte un nombre très important de questions. Or, une tâche nouvelle et complexe, nécessaire à l’évaluation d’une compétence, demande du temps pour être effectuée par les élèves et il n’est matériellement pas possible d’en multiplier le nombre. On ne peut guère imaginer que, dans les conditions scolaires ordinaires, on puisse faire écrire par des élèves une soixantaine de textes argumentatifs avant de décider s’ils possèdent la compétence correspondante. D’où la tentation d’évaluer principalement des procédures élémentaires et des connaissances factuelles parce que cela peut se faire par une série d’items à réponse brève dont le nombre est suffisant pour assurer la validité métrique de l’épreuve. Cependant, la conséquence est que de telles épreuves indiquent surtout si les élèves détiennent des ressources et beaucoup moins s’ils maîtrisent des compétences.

La seconde raison peut expliquer pourquoi ces épreuves, par leur nature, peuvent déboucher sur un diagnostic qui constate la performance des élèves, mais non sur un « diagnostic-recherche des causes » susceptible d’expliquer leurs difficultés éventuelles et permettant d’envisager des remédiations. Il faut remarquer que ce type d’évaluation s’est développé depuis que sont apparues, à l’échelle mondiale, de nouvelles formes de gouvernance dans les systèmes éducatifs et, plus généralement, dans les services publics. Dans beaucoup de pays, c’est traditionnellement l’État qui assurait une partie importante de ceux-ci, notamment ce qui concernait la santé, l’éducation, les infrastructures, etc. Or, comme l’explique Martucelli (2010), sous l’influence du mouvement de la nouvelle gestion publique (New Public Management) se répand l’idée que la gestion de ces services par l’État est coûteuse et peu efficace, et qu’il est préférable de déléguer cette gestion à des organismes privés ou parfois à des organismes publics qui sont mis en concurrence les uns avec les autres. L’État n’a alors plus à contrôler les processus et modalités d’action mis en oeuvre pour assurer les services. Ces modalités sont laissées à l’initiative et à la liberté des organismes autonomes (privés ou publics). Le rôle régulateur de l’État ne s’exerce alors que sur les résultats. Il peut continuer à fixer les normes et les objectifs, mais ne s’occupe pas de la manière de les atteindre. Il se contente de voir, à travers le principe de la reddition de compte (accountability), quels sont les organismes qui les réalisent le mieux et de la manière la plus économique. Dans une telle forme de gouvernance, l’évaluation devient un élément essentiel puisque c’est par les résultats (p. ex., dans le cas de l’éducation, les performances des élèves) que l’État exerce sa régulation. Toutefois, cette évaluation peut se contenter d’un « diagnostic-constat», car il n’est nul besoin d’informations sur les causes de ces résultats (p ex., les modalités didactiques et pédagogiques) qui, elles, relèvent des organismes prestataires. C’est peut-être une des raisons pour lesquelles se généralisent ces évaluations diagnostiques (au sens d’un « diagnostic-constat»), même si les décideurs qui les mettent en place ne sont pas tous nécessairement conscients de toutes les implications de ce choix.

Il est d’ailleurs possible d’imaginer une autre forme de gouvernance en laquelle la régulation n’est plus exercée à travers le contrôle des résultats par l’État, mais par le marché (Dupriez, 2015). Ce sont alors les résultats rendus publics auprès des « consommateurs » (les parents d’élèves, en l’occurrence) qui assurent la suprématie des organismes les plus performants. Toutefois, dans ce cas encore, les évaluations permettant de faire apparaître les résultats peuvent se contenter d’un « diagnostic-constat».

En fin de compte, ce type d’évaluation diagnostique fournit bien un diagnostic sur les systèmes d’enseignement, mais celui-ci est un constat qui ne donne pas d’indications sur la manière de les améliorer.

L’évaluation diagnostique des compétences des élèves

Si le « diagnostic-constat » suffit à l’exercice de ces nouvelles formes de gouvernance, en revanche, les praticiens de l’enseignement ont besoin de formes d’évaluation qui leur permettent un « diagnostic-recherche des causes», car leur visée est différente. Un enseignant doit pouvoir comprendre quelles sont les causes des performances (et, le cas échéant, des mauvaises performances) de ses élèves pour orienter ses choix didactiques. En outre, une telle forme de diagnostic est tout aussi nécessaire lorsqu’il s’agit de pratiquer une évaluation à finalité certificative. Comme indiqué ci-dessus, dans ce type d’évaluation, il n’est pas possible de multiplier le nombre des tâches nouvelles et complexes pour évaluer chaque compétence. Comment, dès lors, s’assurer que la réalisation de quelques tâches nouvelles et complexes – et même souvent d’une seule – garantit la maîtrise de la compétence correspondante ? Cette garantie ne pourra être obtenue qu’en comprenant le processus de fonctionnement de la compétence de façon à pouvoir repérer, même pour une performance unique, si la démarche de l’élève est significative de la maîtrise de cette compétence.

Une évaluation diagnostique (au sens de « diagnostic-recherche des causes») consistera donc à remonter de la performance (qu’elle soit satisfaisante ou non) à sa cause (la compétence ou son absence). Cette opération est problématique puisque, comme il a été vu plus haut, on ne sait pas très bien ce qu’est une compétence, du fait qu’elle est une réalité inférée. Elle est seulement ce qu’on suppose être à l’origine d’une performance et même, plus précisément, ce qu’on souhaite voir exister pour répondre à l’exigence sociale de la répétabilité d’une réponse adaptée dans des situations chaque fois singulières. À cette difficulté propre au diagnostic de compétence s’ajoute une autre plus générale, mais tout aussi redoutable : la difficulté à passer de données constatables à leurs causes, car la notion de cause pose problème.

Nous pourrions espérer trouver quelques éclaircissements sur ce point du côté du diagnostic médical puisque c’est à ce domaine qu’a été originellement empruntée la notion. De ce côté, le diagnostic est l’opération par laquelle le médecin remonte des symptômes constatés chez le patient à la maladie dont il est atteint. Or, est-ce remonter d’effets à leur cause ? Déterminer la maladie, est-ce dire la « cause » des symptômes ? Au cours de l’histoire de la médecine, la manière dont a été conçue la notion de maladie a considérablement varié (Canguilhem, 1966) : trouble constitutionnel de l’organisme (ce qu’on appellerait aujourd’hui maladie génétique), manifestation tératologique, intrusion de pouvoirs maléfiques, disharmonie dans le fonctionnement interne, affection d’origine externe, déficience d’une fonction, réaction à une modification de l’environnement, trouble endogène, suspension des lois de fonctionnement habituel du vivant ou bien, au contraire, réponse de l’organisme, selon les lois de la biologie, à une altération interne ou externe, pathologie saisie comme variation quantitative des processus normaux, etc. La médecine d’aujourd’hui utilise encore plusieurs de ces déterminations, comme si la maladie n’était pas conçue comme une réalité à structure unique, mais comme un terme commode pour désigner ce qui ne va pas et laissant ouverte la diversité des causes (c’est-à-dire l’étiologie).

Ainsi, déterminer la maladie à laquelle correspondent des symptômes ne revient pas nécessairement à indiquer leurs causes. Ce qui semble primer, dans la pratique médicale effective, c’est plus souvent un rapport d’expression. Les symptômes expriment la maladie et, dans la pratique clinique du médecin, sont comme des signes qui lui « disent » la maladie. Comme le fait remarquer Foucault (1963), « le regard de la clinique a cette paradoxale propriété d’entendre un langage au moment où il perçoit un spectacle » (p. 108).

Cela n’empêche pas, cependant, que la maladie soit tenue comme une réalité indépendante des symptômes ; elle ne se réduit pas à être une dénomination attribuée à un ensemble de symptômes. Ainsi, la médecine distingue la symptomatologie (étude des symptômes) de la nosographie (catégorisation des maladies). Or, si la maladie est plus qu’une somme de symptômes, et puisque sa détermination peut laisser en suspens ses causes, qu’est-elle ? Il semble qu’elle représente une entité à vocation d’abord opérationnelle. L’identification d’une maladie, c’est l’identification d’une évolution : dire que tels symptômes sont le signe de telle maladie, c’est dire quelles seront les étapes successives des troubles et, parfois, leur durée approximative. L’identification d’une maladie sert à établir un pronostic. En outre, le cas échéant, elle permet de déterminer le type de traitement qui a fait ses preuves dans ce cas.

À l’instar de ce qui se passe en médecine, la perspective diagnostique appliquée à l’évaluation des compétences scolaires pourrait donc envisager la compétence dans une intention opérationnelle. Il ne s’agirait plus de l’envisager comme la cause de la performance, car cette cause est multiple : y jouent certainement des caractéristiques de l’individu, mais aussi l’état des connaissances, des techniques et des moyens matériels dans lesquels il exerce sa compétence. Il s’agirait plutôt de l’envisager dans des termes qui permettent d’intervenir dans le processus d’apprentissage et de guider sur le chemin de la compétence l’élève qui n’y est pas encore. C’est en ce sens que nous parlerons désormais de recherche de « conditions » plutôt que de causes.

C’est à cette exigence qu’a semblé obéir l’idée de « famille de situations », idée qui a pu paraître pleine de promesses dans les années 1990 parce qu’elle débouchait très directement sur des indications qui pouvaient être utiles aux enseignants. L’idée de départ en est simple : elle consiste à supposer que les diverses situations ou tâches dans lesquelles une compétence donnée est efficace ont quelque chose en commun. La compétence consiste justement à connaître ce caractère commun et à avoir appris quelles sont les ressources, parmi celles que l’individu possède, qui conviennent aux situations présentant ce caractère. Sur cette base, Meirieu et Develay pouvaient, dès 1992, inviter les enseignants à présenter systématiquement à leurs élèves les familles de situations correspondant aux différents contenus de leur enseignement. Dès qu’un enseignant présentait une procédure, une notion, une règle, une loi scientifique, une théorie, etc., il paraissait décisif que, dans le même mouvement, il fasse découvrir aux élèves dans quelle famille de situations pouvait être utilisée cette notion, règle, théorie, etc.

Cependant, à l’examen, cette notion de famille de situations ou de tâches est apparue plus problématique qu’elle ne le semblait au départ, notamment parce que l’élément commun aux situations d’une « famille » peut être de nature très différente selon les compétences (Rey, Carette, Defrance & Kahn, 2003) et, dans certains cas, difficile à repérer et à faire repérer par les élèves. Surtout, les données empiriques disponibles, combinées à l’expérience enseignante, ont fait apparaître qu’un élève qui connaît la famille de situations correspondant à une compétence n’est pourtant pas toujours capable de repérer, dans une situation nouvelle pour lui, les éléments qui permettent de la rattacher à cette famille. Autrement dit, l’élève peut éprouver un problème d’interprétation de la situation ou de la tâche qui lui est présentée.

Une situation comporte toujours une infinité de caractères, d’aspects, d’éléments. Il en va tout autant d’une tâche, même si celle-ci se borne à un énoncé ou à une consigne. Qu’il s’agisse de résoudre un problème (de mathématiques, de physique, etc.), de lire et de commenter un texte, d’analyser des documents, d’écrire un texte, etc., l’élève est confronté à des éléments multiples et divers. Certains d’entre eux sont essentiels pour la réussite de la tâche ; ce sont eux qui permettent à l’élève d’identifier la tâche comme relevant d’une famille de tâches qu’il connaît. D’autres éléments, au contraire, sont inutiles à l’accomplissement de la tâche et doivent être négligés. Pour reprendre un exemple que nous avons déjà utilisé ailleurs, lorsqu’on présente à des élèves de deuxième année du primaire le problème suivant : « Victor a 7 € ; il veut s’acheter un jouet qui coûte 12 €. Combien doit-il demander à ses parents ? », les élèves doivent prendre en compte ce qui concerne la distance numérique entre 7 et 12 et, au contraire, négliger d’autres aspects (le fait qu’il s’agit d’acheter un jouet, le fait qu’il s’agit d’un enfant, les aspects relationnels des rapports avec les parents, etc.). Il semble donc qu’un aspect essentiel d’une compétence tienne à la capacité qu’a l’élève d’opérer la bonne discrimination entre les multiples traits de la tâche qui lui est donnée. Autrement dit, le moment décisif du fonctionnement de la compétence est celui de l’interprétation de la situation (au sens de sélectionner les traits qui importent et d’écarter les autres).

Dès lors, le principe d’un diagnostic (au sens de ce que nous appelons désormais « diagnostic-recherche des conditions ») est de saisir si l’élève est capable ou non d’interpréter correctement la situation. Mais, pour cela, il faut avoir les moyens de distinguer ce qui, dans la performance de l’élève, relève de son interprétation de la tâche et ce qui relève d’autre chose (notamment sa plus ou moins grande maîtrise des connaissances et procédures nécessaires à la tâche). C’est dans ce sens que notre équipe a proposé, au début des années 2000 (Rey, Carette, Defrance & Kahn, 2003), un modèle d’épreuve d’évaluation de compétences en trois phases.

Dans la première, les élèves sont confrontés, comme c’est nécessaire pour évaluer de vraies compétences, à une tâche nouvelle et complexe. Insistons une fois encore sur le fait que le terme « complexe » ne renvoie pas à une recherche systématique de la difficulté, mais signifie que la tâche exige la mobilisation de plusieurs ressources (plusieurs connaissances et plusieurs procédures automatisées), comme le sont beaucoup de tâches scolaires classiques (rédiger un texte ; lire un texte et réagir à cette lecture ; analyser des documents pour en tirer une conclusion ou répondre à une question ; résoudre des problèmes, etc.).

Dans la troisième phase, les élèves ont à effectuer de petits exercices décontextualisés qui permettent de vérifier s’ils maîtrisent les ressources (procédures élémentaires et connaissances partielles) qui entrent dans l’accomplissement de la tâche globale. Ainsi, si un élève ne parvient pas à accomplir la première phase, ses résultats à la troisième permettent de voir si cela tient, entre autres, à sa maîtrise insuffisante des ressources ou si c’est dû à une interprétation erronée ou absente de la tâche de départ.

En outre, une deuxième phase, proposée entre celles que nous venons d’évoquer, demande aux élèves d’accomplir à nouveau la tâche de départ. Toutefois, elle est, cette fois, décomposée en une série de tâches simples dont chacune est nouvelle (ce ne sont pas des procédures automatisées), mais ne requiert que la mobilisation d’une seule ressource. Si un élève ne réussit pas la première phase, sa performance dans la deuxième permet de voir si cela tient à l’interprétation globale de la tâche de départ ou si, même pour une tâche simple, l’élève a du mal à mettre en rapport la tâche avec les ressources dont il dispose, autrement dit s’il n’est pas capable d’établir ce lien indispensable entre ce qu’il sait et une situation nouvelle.

En somme, même si ce modèle de fonctionnement de la compétence laisse encore beaucoup de questions sans réponse, la forme d’épreuve en trois phases va dans la direction d’une évaluation diagnostique, au sens de « diagnostic-recherche des conditions », puisqu’elle permet de cerner au moins partiellement les raisons pour lesquelles un élève n’arrive pas à accomplir la tâche nouvelle et complexe, c’est-à-dire ne possède pas la compétence correspondante.

Par-delà l’approche diagnostique

Le modèle de fonctionnement de la compétence que nous venons de présenter fait apparaître le caractère décisif de l’interprétation de la situation, et le type de diagnostic sur lequel ouvrent les épreuves en trois phases permet de saisir si un élève effectue correctement ou non cette interprétation. Cependant, ni ce modèle de fonctionnement ni ce diagnostic n’offrent encore la possibilité de déterminer pourquoi un élève n’arrive pas à interpréter correctement la situation. C’est sur ce point que nous allons maintenant tenter d’avancer quelques hypothèses. Nous verrons qu’elles nous conduisent à réinterroger la notion même de diagnostic et son usage dans le monde éducatif.

Parmi les élèves (de tous les niveaux de scolarité) qui doivent accomplir des tâches nouvelles et complexes, il arrive que certains d’entre eux donnent des réponses déconcertantes. Par exemple, devant un problème (fin du primaire) où il s’agit, à partir de la vitesse horaire de différents moyens de locomotion (autobus, voiture, marche, bicyclette), de calculer la méthode la plus rapide pour parcourir la distance (indiquée dans l’énoncé) entre un domicile et l’école, certains élèves répondent qu’il faut préférer la bicyclette parce que « c’est plus écologique», tandis que d’autres répondent que la marche est préférable parce qu’elle permet de rencontrer des copains.

Dans un autre problème, des élèves de 5e et 6e années du primaire (l’enseignement primaire dure six ans en Belgique) avaient à établir le bon de commande du matériel (peinture et pinceaux) pour repeindre une salle dont les dimensions étaient données (ainsi que celles de la porte et des fenêtres). En outre, un document (tiré du catalogue d’un marchand de peintures) indiquait les prix des peintures pour les murs, le plafond et la porte, ainsi que le pouvoir couvrant de chacune. Or, un certain nombre d’élèves (en nombre non négligeable) ont donné des réponses qui revenaient à dire que le mieux serait d’acheter d’abord un pot de 5 litres de peinture et qu’ensuite on aviserait.

De même encore, lorsqu’on demande à des élèves du secondaire, après la lecture d’une nouvelle, de donner par écrit leur avis argumenté sur ce texte, on constate que certains remplacent l’argumentation attendue par le récit d’une expérience personnelle ayant quelques similitudes avec l’intrigue de la nouvelle.

Ces réponses (et bien d’autres du même type) sont déconcertantes en ce qu’elles ne correspondent pas du tout à ce que l’enseignant attend, mais elles ne peuvent pourtant pas être qualifiées d’absurdes. Ainsi, lorsqu’on s’interroge sur la manière d’aller de la maison à l’école, il n’y a pas que la durée du trajet qui entre en ligne de compte ; d’autres considérations sont aussi importantes. Dans la vie pratique, beaucoup d’adultes devant repeindre une pièce de leur habitation, plutôt que de prendre les mesures et de calculer la quantité de peinture nécessaire, préfèreront aller acheter d’abord une petite quantité, ne serait-ce que pour voir quel est le pouvoir couvrant réel de la peinture sur le support où ils vont l’appliquer. De même, réagir à un texte littéraire en disant ce qu’il réveille de souvenirs personnels n’a rien d’illégitime, même si cela ne répond pas à l’injonction d’argumenter, c’est-à-dire de rechercher des raisons qui puissent convaincre d’autres personnes qui n’ont pas vécu cette histoire personnelle.

Dès lors, le problème de l’interprétation des tâches et des situations se pose en termes nouveaux. Il n’est plus possible de parler d’une bonne interprétation, par rapport à laquelle toute autre serait mauvaise. Il convient plutôt d’accepter de dire qu’il y a, d’une part, l’interprétation scolairement attendue et, d’autre part, d’autres interprétations qui peuvent avoir du sens dans la vie pratique ou la vie personnelle. Admettre cette multiplicité de modes d’interprétation ne revient pas à nier ni même à réduire l’intérêt des interprétations attendues dans le monde scolaire. Celles-ci impliquent une saisie rationnelle et universalisante (donc impersonnelle) de la réalité. Elles s’appuient sur les savoirs scolaires, eux-mêmes dérivés de savoirs scientifiques, lesquels sont construits sur une problématisation de la réalité et sur une recherche de preuves. Il est donc essentiel de chercher à faire partager par les jeunes ce mode d’interprétation des situations, et seule l’école est en mesure de le faire.

Cependant, reconnaître qu’il y a des interprétations pragmatiques, personnelles, intuitives ou émotionnelles de la réalité, c’est admettre que le mode d’interprétation que l’école exige n’est pas le seul, qu’il ne va pas de soi et qu’il n’est pas « naturel ». Un tel constat a des conséquences à la fois sur le plan didactique et sur le plan de l’évaluation.

Sur le plan didactique, ce constat conduit à souhaiter que les enseignants fassent connaître systématiquement aux élèves les caractères du regard scolaire sur les choses. Il conviendrait que l’enseignant arrive à formuler les raisons pour lesquelles, à l’école, face à une situation ou une tâche nouvelle, c’est tel aspect de la réalité qu’il y a lieu de privilégier, plutôt que d’autres. Un tel travail n’est pas simple parce que les enseignants (et tout autant les chercheurs en éducation), du fait qu’ils ont intériorisé de longue date cette manière de voir la réalité, ne sont plus conscients de ses caractères spécifiques et ont tendance à les considérer comme allant de soi. Cependant, à partir des réponses d’élèves qui ne correspondent pas à l’interprétation scolaire, il est possible d’arriver à saisir, en creux, quelques-uns de ses caractères. Bien que ce ne soit pas l’objet du présent texte, nous en évoquerons quelques-uns, sans prétendre aucunement être exhaustif.

Un des caractères de la saisie scolaire des situations est de chercher systématiquement à les interpréter au moyen des savoirs scolaires. Il faut ici entendre par « savoir » non pas une information ponctuelle (l’énoncé d’une règle, une définition, une formule, un fait historique, un fait scientifique, etc.), mais un ensemble organique d’énoncés et de concepts liés entre eux par des liens logiques, et qui permet de rendre intelligible un aspect de la réalité.

Un autre de ces caractères est la recherche d’un point de vue universel sur le réel, ce qui signifie ne pas introduire des éléments à caractère personnel ou émotionnel et implique également de rédiger la réponse donnée à une question ou un problème sans s’appuyer sur des situations possiblement partagées avec le destinataire. L’auteur doit faire comme s’il écrivait pour quelqu’un qui n’a aucune connivence avec lui ; ce qu’il écrit doit être autosuffisant, sans référence à des situations ou des expériences qu’il aurait en commun avec des lecteurs.

Enfin, nous avons observé des élèves qui, face à une tâche complexe, n’essaient pas de comprendre par eux-mêmes la situation, mais cherchent dans l’énoncé le premier indice disponible auquel ils peuvent raccrocher une connaissance factuelle ou une procédure. Ces élèves sont, vis-à-vis des tâches scolaires, dans une attitude d’obéissance. Par une sorte de peur de penser par eux-mêmes (ou de sentiment d’illégitimité), ils tentent de s’acquitter d’une obligation institutionnelle en livrant un énoncé auquel ils ont été entraînés. La saisie scolairement attendue des tâches exige au contraire que l’élève prenne en charge cognitivement la tâche dans sa nouveauté et sa complexité, même s’il doit en même temps tenter de la traiter au moyen des modèles explicatifs fournis par les savoirs scolaires.

En ce qui concerne l’évaluation, les considérations qui précèdent conduisent à en changer le sens, car, lorsqu’un élève n’effectue pas l’interprétation scolairement valide d’une tâche, ce n’est pas nécessairement le signe d’une défaillance de sa part ; cela peut être seulement le signe qu’il l’interprète autrement, selon d’autres valeurs et en référence à d’autres champs de pratique. Ce que l’évaluation fait apparaître, ce n’est pas un déficit qui serait intrinsèque à l’élève, mais un décalage entre sa manière d’interpréter la réalité et celle que l’école valorise. Ainsi, l’attention et le jugement évaluatif doivent se déplacer d’un individu (l’élève) à une relation (entre deux manières de voir la réalité). L’élève ne peut plus être regardé sur le mode d’un mécanisme qui dysfonctionnerait et qu’il conviendrait de réparer ; il ne peut pas non plus être appréhendé comme un malade qu’il faudrait guérir.

De ce fait, la notion de diagnostic, qui, quoi qu’on fasse, évoque nécessairement le monde médical (comme d’ailleurs celle de remédiation), doit être revisitée du point de vue de sa pertinence. Pratiquer un diagnostic sur la base de la performance d’un élève, c’est en chercher les causes ou les conditions, mais au prix d’un regard extérieur comme celui du médecin sur le malade. C’est tenir pour acquis que la conformité ou la non-conformité de la réponse de l’élève à la saisie scolairement attendue sont affaire de fonctionnement mental. Ce serait alors l’investigation psychologique qui, selon une démarche diagnostique, fournirait l’explication. En rendant compte de l’écart entre la réponse d’un élève et l’attente scolaire par une explication psychologique, on fait de la rationalité scolaire une nature, laquelle se ramènerait en dernier ressort à des déterminismes mentaux. Les modèles explicatifs de la compétence, tels que ceux qui reposent sur la notion de transfert (Richard, 1990 ; Tardif, 1999) ou sur la notion piagétienne de schème (Pastré, Mayen & Vergnaud, 2006), ne semblent pas s’être affranchis de ces présupposés (pour une présentation critique, voir Rey, 2014). Or, les exemples d’interprétations scolairement inacceptables que nous avons donnés ci-dessus font apparaître que la saisie scolaire de la réalité n’est ni naturelle ni normale. En tant qu’elle cherche à être une appréhension rationnelle et universaliste du réel, elle est l’effet d’un choix et, comme les enseignants le savent, d’une ascèse.

S’interrogeant sur l’évolution des manières dont nos sociétés ont conçu la maladie mentale, Foucault (1966) conclut que la psychologie n’est devenue possible que lorsque, dans la confrontation entre la déraison et la raison, cette dernière a été pensée comme une nature. Il évoque ainsi ce moment « où la raison a cessé d’être une éthique pour devenir une nature » (p. 103). L’idée de soumettre la performance scolaire des élèves à un diagnostic relève d’une logique comparable : la rationalité scolaire y est assimilée à un état naturel et toute déviation par rapport à elle sera perçue comme un écart, sinon pathologique, du moins redevable d’une remédiation. Il est possible de soutenir à l’inverse que la saisie des situations au moyen des savoirs scolaires, loin d’être naturelle, est une saisie parmi d’autres et que, comme telle, elle relève non d’un mécanisme mental, mais d’un choix libre. L’envisager ainsi, ce n’est nullement la relativiser ; au contraire, en faire l’objet d’un choix, c’est souligner sa valeur. C’est aussi substituer au diagnostic, qui est une parole sur l’élève, une parole à l’élève, car celui-ci est alors tenu pour un partenaire humain auquel on s’adresse pour lui faire partager un regard nouveau sur le monde.

Conclusion

La distinction entre un diagnostic envisagé comme constat et un diagnostic qui, sur la base de ce qui est constaté, infère des causes ou des conditions possibles permet de rendre compte des différences entre deux types d’évaluation de compétences scolaires. Les évaluations sur une grande échelle qui visent à évaluer les systèmes éducatifs ou des parties de ceux-ci relèvent de « diagnostics-constats ». Prise dans ce sens, l’évaluation diagnostique ne peut servir qu’à comparer des performances d’élèves dans un but de mise en concurrence des systèmes éducatifs, des établissements ou des enseignants. Elle convient à ce mouvement mondial par lequel les pouvoirs publics se désengagent progressivement de l’intervention dans les choix pédagogiques et exercent leur fonction régulatrice en évaluant les organismes d’enseignement, devenus de plus en plus autonomes, sur la base des performances des élèves. Dans cette circonstance sociohistorique, nul n’est besoin de connaître les facteurs (didactiques ou autres) qui pourraient rendre compte de ces performances.

En revanche, les praticiens de l’enseignement ont, eux, tout à gagner à disposer pour chaque élève d’un « diagnostic-recherche des causes » sur le modèle du processus qui, dans le diagnostic médical, permet de remonter des symptômes à la maladie. Même si le diagnostic ainsi envisagé n’est pas toujours en mesure de saisir exhaustivement les causes de la performance de l’élève, il permet au moins d’en apercevoir les conditions en dévoilant certaines caractéristiques de son fonctionnement mental dans l’accomplissement de la tâche. Une telle perception apporte aux enseignants les moyens à la fois de réguler leur pratique didactique et, dans une finalité évaluative, de s’assurer que la performance ponctuelle d’un élève est bien représentative de sa compétence, et non du hasard.

Ainsi, l’intérêt qu’il peut y avoir à pratiquer une évaluation « diagnostique » des compétences n’est pas du côté des grandes enquêtes d’évaluation des systèmes éducatifs, mais plutôt du côté du « diagnostic-recherche des causes », par lequel un enseignant peut remonter de la production des élèves aux conditions qui les ont déterminées et saisir ainsi les moyens de les améliorer.

Cependant, cette évaluation diagnostique comme inférence des causes ou des conditions, malgré son apparent intérêt opérationnel, témoigne d’une saisie objectivante de l’élève. Elle revient à saisir la difficulté scolaire ou l’absence de compétence comme un caractère qui lui serait intrinsèque. Elle risque ainsi de méconnaître ce qui est dû aux particularités des savoirs scolaires ou de prendre ces particularités épistémologiques pour des caractères du fonctionnement mental. Elle participe ainsi de cette tentation qu’ont certains acteurs de l’école de saisir la difficulté scolaire comme de l’ordre du pathologique. Apparaissent ici les limites de l’attitude diagnostique, lorsqu’elle est pratiquée dans une finalité éducative. À cette attitude objectivante et thérapeutique que l’usage du mot diagnostic signale, on peut opposer une attitude pédagogique, laquelle prend le savoir non pour une normalité, mais pour une normativité (Canguilhem, 1966), et prend l’élève non pour un être à guérir, mais pour un partenaire dans la reconquête quotidienne de la rationalité.