Article body

Introduction

Cet article présente les résultats d’une étude (CRSH 2018-2019) qui vise à proposer une consolidation du projet théorique de la sociologie de l’évaluation scolaire. À notre connaissance, ce domaine n’a fait l’objet d’aucun développement depuis les années 1990. Dans le contexte actuel, ce projet trouve une pertinence, notamment pour contribuer à examiner les effets de la pression à l’évaluation des apprentissages et à la production de notes chiffrées jugées nécessaires à des fins comparatives, dans le sillage des changements induits par la nouvelle gestion publique (NGP) (Lessard, 2014 ; Maroy, 2017). Bien que la mise en place de la NGP débute avant les années 1990 selon les contextes nationaux, c’est au cours des 20 dernières années qu’on a pu documenter ses impacts et constater à quel point il s’agit d’une lame de fond importante qui ne semble pas s’essouffler encore.

En effet, le travail des enseignants dans plusieurs pays est actuellement très contraint par ce contexte qui soulève des enjeux sociaux, qu’une sociologie de l’évaluation scolaire peut éclairer. Car les débats sur l’école, sur l’évaluation et sur les notes animent les espaces publics, notamment parce qu’ils mettent en jeu des valeurs centrales pour la société : le mérite, la justice sociale, le patrimoine culturel, le statut de la vérité et l’épanouissement des personnes (Mangez, 2008). De plus, une sociologie de l’évaluation scolaire n’est pas restreinte à éclairer les enjeux liés à l’évaluation des apprentissages des élèves, car son univers de pertinence s’étend au système lui-même et, donc, aux programmes et aux politiques dans une perspective transnationale ou internationale.

Le domaine des recherches sociologiques en évaluation scolaire est très large ; le seul ouvrage dans le monde francophone qui a fait un effort de synthèse de ce domaine théorique est celui de Merle (1998). La synthèse qu’y fait l’auteur est partielle et convoque des débats plus ou moins dépassés aujourd’hui, par exemple sur les biais dans la correction, car situés en dehors du contexte actuel qui redonne à la question de l’évaluation scolaire une grande pertinence.

Dans le monde anglophone, un domaine émergent – Sociology of Valuation and Evaluation – est en train de s’établir, telles qu’en témoignent des synthèses de connaissances (Beljean, 2012 ; Krüger et Reinhart, 2017 ; Lamont, 2012). Or, ce domaine excède largement l’évaluation scolaire, car il se rapporte à toutes les pratiques évaluatives qui touchent l’action humaine, incluant l’éducation, mais aussi l’évaluation institutionnelle, l’évaluation des biens ainsi que l’évaluation des productions symboliques et artistiques et des performances sportives. Autrement dit, il n’est pas spécifique à l’évaluation en contexte scolaire.

Le domaine de la sociologie de l’évaluation scolaire est donc à consolider, car, s’il existe une communauté d’intérêt, soit des chercheurs qui puisent à ses perspectives, leurs travaux ne sont pas rassemblés ni organisés. Notre contribution vise à établir des liens entre eux en débutant en vue d’une consolidation du domaine, d’un point de vue théorique, à travers une analyse de la littérature en français. Cette analyse pourra être ensuite complétée par une recension des écrits en anglais.

Cadre théorique

Quelques précisions théoriques des travaux en évaluation scolaire

Les pratiques d’évaluation des élèves ont été appréhendées selon diverses approches théoriques, notamment : (a) des approches docimologiques en évaluation des apprentissages, (b) des théories déterministes de la reproduction sociale et (c) des théories interactionnistes et situées de l’évaluation (Merle, 2012).

Les approches docimologiques en évaluation des apprentissages

D’abord, les approches docimologiques ont une orientation descriptive-statistique des notes produites par les pratiques d’évaluation. Depuis les études docimologiques classiques (Aymes, 1979 ; Bonniol et al., 1972), la recherche d’une note « juste » est considérée comme utopique. Des biais dans la notation ont été liés par ces recherches à des variables comme l’ordre de correction des copies ou l’expertise enseignante. Or, l’approche docimologique est jugée ahistorique et asociale (Merle, 2012).

Les théories déterministes de la reproduction sociale

Pour leur part, les théories déterministes de la reproduction sociale sont centrées sur l’analyse des déterminants contextuels liés aux pratiques enseignantes et des effets du statut socioscolaire de l’élève sur les résultats scolaires. Elles pointent les « biais » ou erreurs d’évaluation au sein des processus de jugement des élèves, biais provoqués par les informations les concernant. Ces théories ont pour limite de présupposer l’existence de stéréotypes chez les enseignants qui expliqueraient la partialité des notes attribuées, par exemple des préjugés qui favorisent les bons élèves (Merle, 2012).

Les théories interactionnistes et situées de l’évaluation

Enfin, les théories interactionnistes et situées proposent un éclairage des dynamiques entre les enseignants et les élèves en contexte afin d’expliquer les biais de la notation. Dans cette perspective, l’évaluateur et l’évalué sont toujours dans une relation interpersonnelle marquée par leur position sociale respective, laquelle influence leur conduite réciproque au sein d’un rapport de pouvoir. L’incertitude liée à la note peut être expliquée par l’existence d’arrangements évaluatifs liés à la tension entre les exigences institutionnelles de notation et la visée de soutien à l’apprentissage des élèves (Merle, 2012).

En tenant compte des différentes approches ici présentées, cette contribution vise à : (a) mettre en place une consolidation du domaine de la sociologie de l’évaluation scolaire à partir de l’analyse des enjeux sociologiques qui se dégagent des recherches empiriques et conceptuelles en français réalisées au cours des 30 dernières années ; et (b) à l’appui de cette analyse, identifier des perspectives et des questionnements de recherche actualisés en sociologie de l’évaluation scolaire en lien avec des problématiques qui concernent au premier plan les élèves et les enseignants ainsi que le contexte actuel de pression à l’évaluation.

Méthodologie

En scrutant des banques d’articles scientifiques (Cairn, Érudit, FRANCIS et Google Scholar) en 2018, à partir du mot clé « évaluation scolaire » et autres dénominations connexes (« sociologie de l’évaluation », « évaluation des apprentissages/des acquis », « évaluation certificative/sommative/formative/formatrice »), nous avons trouvé 2518 travaux en français qui répondaient aux critères d’inclusion suivants :

  1. Les textes devaient avoir été publiés dans les 30 dernières années (entre 1988 et 2018) ;

  2. Ils pouvaient être des ouvrages, des chapitres, des articles ou des mémoires et des thèses ;

  3. Ceux liés à une recherche empirique pouvaient mobiliser des méthodes de recherche qualitatives et/ou quantitatives.

Lors de cette première étape de sélection, nous avons lu les titres et les résumés de chaque document, puis avons évalué la pertinence du contenu pour répondre à nos objectifs de recherche. Les textes retenus pour la deuxième étape, soit l’analyse approfondie, devaient comporter un cadre conceptuel sociologique en évaluation scolaire (voir section Cadre théorique) ou traiter d’évaluation scolaire en lien avec des enjeux socioéconomiques ou sociopolitiques (effets des pratiques évaluatives sur les élèves, rapports de pouvoir entre acteurs concernés, tri social, etc.). Les textes ancrés dans d’autres approches en sociologie de l’éducation (du curriculum, des groupes professionnels, etc.) n’ont pas été retenus, car ils traitent de nombreux objets qui ne concernent pas directement l’évaluation des apprentissages des élèves, ce qui délimite notre proposition ici.

Ce dernier critère a permis de cibler 72 documents en français. Après leur lecture complète, nous avons extrait un corpus de 59 documents pour la troisième étape (46 articles[1], 8 chapitres de livre, 3 livres, 1 rapport et 1 dossier d’actualité)[2], soit les plus pertinents pour permettre de tracer un portrait du domaine par une analyse approfondie[3].

Pour enrichir cette analyse, nous avons mobilisé d’autres écrits[4] qui permettent de les mettre en perspective ; ils ont été ajoutés en cours d’analyse et choisis pour leur apport complémentaire au corpus. Les textes retenus ont fait l’objet d’une analyse thématique inductive, qui a débuté par la lecture et par la codification de trois articles sur papier. Cette première étape a permis de créer une première liste de thèmes. Puis, une codification sur le logiciel QDA Miner a été réalisée. Elle a généré 43 thèmes, qui portaient sur divers aspects de l’évaluation (p. ex., les fonctions et les objets de l’évaluation, les réformes et le pilotage des systèmes éducatifs, les enjeux éthiques et le jugement professionnel, l’évaluation standardisée, etc.). Les thèmes dégagés ont été regroupés en quatre grandes catégories agglomérantes, présentées dans la suite en fonction des principaux enjeux sociologiques qui semblent structurer le domaine de l’évaluation scolaire.

L’exhaustivité n’était pas visée par ce travail, car nous cherchions plutôt à dégager comment les enjeux sociologiques soulevés par le regroupement et la comparaison de ces textes peuvent aider à délimiter le périmètre d’un nouveau domaine théorique. Il s’agit donc d’une « revue de littérature narrative », qui n’exige pas nécessairement le recours à une méthode de recherche exhaustive, mais plutôt itérative, et qui valorise l’expertise réflexive et le jugement du chercheur (Rhoades, 2011).

Résultats et discussion

Les principaux enjeux sociologiques spécifiques au domaine de l’évaluation scolaire

Les enjeux sociologiques extraits du corpus permettent d’esquisser un domaine en quatre grandes catégories[5] : 1) la fonction formative de l’évaluation et la progression des apprentissages ; 2) l’évaluation d’un savoir agir et l’adaptation aux contextes complexes ; 3) l’évaluation externe et standardisée, et la fabrication des résultats « mesurables » ; et 4) l’évaluation comme matérialisation des normes d’excellence et la démocratisation de la réussite scolaire.

La fonction formative de l’évaluation et la progression des apprentissages

La réussite des élèves est l’enjeu qui revient le plus fréquemment dans les textes analysés, et il est presque toujours lié au développement d’une évaluation centrée sur la progression des élèves et sur le soutien à cette progression, d’où l’association faite avec l’évaluation dite formative. Depuis au moins quatre décennies, cette fonction de l’évaluation a été introduite dans les systèmes scolaires de plusieurs pays, sous différentes appellations (p. ex., évaluation pour l’apprentissage, évaluation formatrice, etc.). Elle est vue comme étant une composante nécessaire de toute pratique évaluative au service des enseignants, des élèves et de la prise de décisions par les autorités scolaires (Deaudelin et al., 2007 ; Laveault, 2014). Elle constituerait la pierre angulaire des plus récentes réformes éducatives visant à amener un plus grand nombre d’élèves à franchir avec succès leur scolarisation (Laveault, 2009 ; Mangez, 2008).

L’évaluation formative est couramment comprise comme un processus cyclique par lequel les enseignants, en interaction avec les élèves, procèdent au recueil et au traitement de l’information concernant les activités d’enseignement et d’apprentissage, en vue d’apprécier le cheminement des élèves et de leur fournir de la rétroaction les aidant à activer des processus internes de régulation (Deaudelin et al., 2007). Cette fonction est aussi envisagée comme une solution à l’hétérogénéisation accrue des groupes-classes, car, en faisant le point sur la situation de chacun vis-à-vis des apprentissages ciblés, elle permet à l’enseignant de choisir les stratégies d’accompagnement les plus adaptées à leurs besoins différenciés (Carette et Dupriez, 2009). Elle se situe donc aussi au service de l’enseignement, attentive aux processus d’apprentissage plutôt qu’aux produits (Morrissette, 2009).

Au vu de l’importance qu’a prise cette fonction de l’évaluation, il est possible de conclure que c’est un véritable paradigme qui s’est graduellement dessiné. En effet, il faut rappeler ici que l’évaluation :

en tant qu’activité scientifique, formelle et intentionnelle, s’est développée dans le contexte plus vaste de l’émergence des sciences sociales et humaines au 19e siècle. Elle a hérité alors de présupposés épistémologiques qui exigeaient une séparation entre le sujet-évaluateur et l’objet évalué

Rodrigues et Machado, 2012, p. 148

Sous l’influence du paradigme positiviste, l’activité d’évaluer était considérée comme une démarche objective, mais cette conception a été progressivement remise en question, surtout à partir des décennies 1960 et 1970, notamment pour des raisons de nature épistémologique (Rodrigues et Machado, 2012). En effet, comme nous l’avons expliqué plus haut, les études docimologiques classiques ont permis de démontrer que la recherche d’une note « juste » est utopique. Des motifs sociopolitiques sont aussi à l’origine de cette remise en question (Rodrigues et Machado, 2012) provenant du côté des recherches déterministes, qui ont constitué un socle critique de l’évaluation scolaire ayant dénoncé son rôle dans la reproduction des inégalités sociales. Ainsi, un des apports les plus importants des recherches sociologiques des années 1960 à 1980 a été de mettre en relief que « l’évaluateur ne note jamais une copie en soi [et que] la notation est un travail de comparaison des travaux d’élèves qui ne peut pas s’exercer indépendamment d’informations scolaires et extrascolaires spécifiques » (Merle, 2012, p. 85). Certaines pratiques d’évaluation défavoriseraient donc les élèves provenant des milieux moins aisés.

Depuis ces travaux critiques, les recherches plus récentes tendent à adopter des perspectives interactionnistes de l’évaluation des apprentissages. Dans cette optique, la démarche évaluative apparaît telle une activité de construction et de négociation des représentations, car les valeurs, les normes et les jugements qui la sous-tendent se trouvent dans les conventions qui lient les gens concernés (Cogérino, 2002 ; Hadji, 1997 ; Issaieva et al., 2011 ; Perrenoud, 1989). Ainsi, il s’agit d’un acte social (Dépret et Filisetti, 2001 ; Dubois, 2006) qui procède d’arrangements évaluatifs (Merle, 1996, 2012) : la note est fabriquée à travers des négociations plus ou moins explicites entre les protagonistes de la relation pédagogique. Dans cette perspective, elle serait aussi tributaire des valeurs des enseignants et de la représentation qu’ils ont du rendement scolaire, ce qui reflète aussi l’appréciation de la manière dont l’élève s’implique et l’intensité des efforts qu’il consent pour progresser et se conformer aux règles scolaires (Cogérino, 2002 ; Hadji, 1997). Comme le soulignent certains auteurs (Cogérino et Mnaffakh, 2008 ; Jeffrey, 2013 ; Merle, 2002 ; Morrissette et Legendre, 2011 ; Vanoutrive et al., 2011), ces arrangements évaluatifs s’enracinent donc dans des représentations différentes de l’équité et dans une forte présence de la norme d’effort ou dans des enjeux de pouvoir et d’autorité. Cela signifie que l’enseignant se prononce non seulement sur la façon dont ses attentes envers les élèves sont satisfaites, « mais aussi, au moins implicitement (et parfois explicitement), sur la relation qui l’unit à l’évalué, en affirmant quelque chose de la valeur et de la place de chacun » (Hadji, 1997, p. 15).

En exposant les biais socioculturels liés au paradigme dominant de l’évaluation, cette remise en cause socioépistémologique a pavé la voie à une redéfinition importante de la démarche en direction de l’évaluation formative (Figari, 2012), et ce, en concomitance avec une tentative de centrer l’évaluation sur les sujets évalués, qui étaient autrefois considérés comme de simples objets. Ils deviennent désormais des protagonistes dans la construction des dispositifs de formation qui leur sont destinés (Rodrigues et Machado, 2012). Cette vision repose sur l’idée que mobiliser l’évaluation pour soutenir la progression des apprentissages plutôt que pour sanctionner permettrait de rapprocher le fonctionnement du système scolaire aux références cognitives et culturelles des élèves, ce qui favorise ainsi leur réussite malgré leurs différences.

Cela dit, plusieurs études sur la professionnalité des enseignants amènent à considérer qu’ils auraient encore des difficultés à intégrer la fonction formative de l’évaluation dans leur quotidien (Bélair et Dionne, 2009 ; Laveault, 2009 ; Monney et Fontaine, 2016 ; Mottier Lopez et Cattafi, 2008), car comment apprécier la progression des élèves dans ce cadre ? Qu’entend-on par l’idée même de « progression » ? Progresser vers quoi, vers quelles normes (Morrissette, 2009) ? Il appert qu’il persisterait chez eux une confusion entre évaluation formative et sommative, et qu’ils offriraient peu d’occasions aux élèves de mettre en oeuvre des stratégies d’autorégulation au coeur de la démarche formative (Cogérino et Mnaffakh, 2008 ; Deaudelin et al., 2007 ; De Ketele, 2010). D’autres travaux suggèrent aussi que le niveau d’enseignement influence l’approche que les enseignants adoptent, ceux du secondaire accordant la priorité à la visée certificative et sélective de l’évaluation, comparativement à leurs collègues du primaire (Chouinard et al., 2005 ainsi que Soussi et al., 2006, cités dans Issaieva et al., 2011). Enfin, des chercheurs pointent aussi un paradoxe : perçue par les élèves et leurs parents comme ne « comptant pas » (Endrizzi et Rey, 2008), l’évaluation formative serait dévalorisée au sein de certains groupes sociaux, mais des enseignants y auraient recours en raison de la désirabilité sociale qu’elle revêt (Issaieva et al., 2011).

L’évaluation d’un savoir agir et l’adaptation aux contextes complexes

Une autre catégorie d’enjeux sociologiques, qui s’inscrit aussi dans une approche interactionniste, vient de la nécessité perçue de rapprocher les contenus d’apprentissage aux contextes de la vie quotidienne, et de favoriser l’intégration et la mobilisation des connaissances dans des familles de situations complexes et authentiques, idée sous-jacente aux plus récentes réformes de plusieurs pays occidentaux. C’est en fait les questions du sens des apprentissages scolaires et du savoir agir en contexte qui sont ici fondamentales. Cette vision trouve plusieurs sources de légitimité dans les discours politiques au sein d’une nouvelle économie mondialisée. Pour ce faire, la plupart des récents changements curriculaires misent sur la notion de compétence, qui a le mérite d’avoir renouvelé les questions du transfert des apprentissages et de l’apprentissage en situation. Dans cette optique, la certification ne constituerait plus la seule issue de l’évaluation, et la question de l’exactitude de la mesure et du produit fini semble dépassée par l’attention qui doit être portée à une évaluation continue en soutien au développement des compétences (Morrissette, 2009).

Cependant, d’aucuns considèrent que la notion de compétence est trop polysémique et manque d’assises théoriques (Dierendonck et Fagnant, 2014 ; Morrissette et Legendre, 2011 ; Mottier Lopez et Tessaro, 2010). Néanmoins, malgré ses interprétations multiples et ses fondements qui paraissent fragiles pour certains, cette notion a donné lieu au courant de l’approche par compétences, devenu dominant dans la plupart des systèmes d’éducation des pays européens et nord-américains (Carette et Dupriez, 2009 ; Dionne, 2014 ; Gérard, 2013 ; Lebrun et al., 2004 ; Monnard et Luisoni, 2013) et qui trouve aussi écho en Amérique latine et en Afrique.

L’évaluation des compétences comporterait des défis importants (De Ketele, 2015 ; Deslandes et Rivard, 2011), notamment sur le plan conceptuel, car le passage d’une pédagogie aux fondements néobéhavioristes à une pédagogie plus constructiviste est encore difficile, notamment faute de manuels scolaires pertinents ou de leur emploi cohérent avec l’approche préconisée (Lebrun et al., 2004 ; Mottier Lopez et Tessaro, 2010). De plus, l’évaluation des compétences implique de nouveaux outils de collecte d’informations sur les apprentissages des élèves et de nouvelles pistes d’interprétation moins mécaniques, car les examens et les contrôles plus traditionnels sont très limités pour saisir la complexité de ces objets d’apprentissage (Dionne, 2014). Certains chercheurs déplorent que les manières d’évaluer des enseignants aient peu changé depuis la pédagogie par objectifs (Carette et Dupriez, 2009) ou que les savoirs appris en formation initiale soient peu mobilisés en salle de classe, au détriment de savoirs expérientiels (Nizet, 2016).

Par ailleurs, il existerait une contradiction entre l’approche par compétences et les connaissances classiques disciplinaires (mathématiques, sciences humaines et sociales, etc.). D’aucuns (Lebrun et al., 2019 ; Rayou, 2015) observent de fait la multiplication contemporaine d’« éducations à » (à la citoyenneté, à l’environnement) dans le milieu scolaire qui ne sont pas nécessairement disciplinaires. Il en résulterait une dépréciation des connaissances disciplinaires, renforcée par la centration des enseignants sur la conduite de la classe (Terrail, 2016). L’approche par compétences favorisant l’interdisciplinarité et le développement de stratégies métacognitives, les compétences de l’élève s’apprécient donc en référence à des familles de situations, et non à des disciplines spécifiques, ce qui amène une complexification du processus d’apprentissage-évaluation (Monney et Fontaine, 2016). Selon Mangez (2008), le tournant vers l’approche par compétences conduirait même à étiqueter de « conservatisme antidémocratique » le fait d’accorder de l’importance aux savoirs et à leur maîtrise formelle.

En continuité avec la catégorie précédente (voir sous-section La fonction formative de l’évaluation et la progression des apprentissages), cette deuxième catégorie concerne des travaux qui proposent une analyse sociologique de l’évaluation des apprentissages dans une perspective interactionniste plus proche de l’acteur (Deaudelin et al., 2007 ; Morrissette, 2009 ; Mottier Lopez, 2007, 2008 ; Mottier Lopez et Allal, 2004, 2008 ; Mottier Lopez et al., 2012). Ainsi, la centration est sur l’élève, sur ses apprentissages et sur les processus qu’il mobilise pour apprendre (Hattie et Timperley, 2007), bref sur son savoir agir. Cette approche « conduit à envisager que les interactions constituent le moteur de la régulation des apprentissages, la rétroaction se construisant et se négociant dans les échanges, et que le pouvoir est redistribué au sein de la communauté de classe » (Morrissette, 2009, p. 6). La classe est alors analysée comme microculture (Mottier Lopez, 2008).

Ainsi, selon Morrissette (2010) ainsi que Mottier Lopez et Laveault (2008), la valorisation de l’évaluation formative et celle de l’acteur dans les processus évaluatifs ont changé le panorama de la recherche dans ce domaine, car, aux côtés des démarches instrumentales, ont émergé des démarches plus informelles au coeur des interactions enseignant-élèves (Morrissette, 2010, 2013). Dans cette optique, des recherches visent par exemple à analyser la motivation et le point de vue d’élèves vis-à-vis des activités évaluatives à l’école ; elles documentent l’évaluation par les pairs ou l’autoévaluation. D’autres s’intéressent au développement professionnel des enseignants, aux stratégies d’évaluation formative interactive et à la régulation des apprentissages. Elles donnent plus de place à l’analyse des pratiques discursives et situées qui sont impliquées dans la négociation qu’implique toute démarche évaluative (Morrissette, 2010 ; Mottier Lopez, 2016).

L’évaluation externe et standardisée, et la fabrication des résultats « mesurables »

Plusieurs textes analysés mettent aussi en relation cette « révolution » des systèmes éducatifs, qui a pris des formes différentes et a connu un succès varié selon les pays, et la mise en place de dispositifs d’assurance qualité et de pilotage des systèmes scolaires, incluant le développement de standards nationaux et d’évaluations externes (Brissaud et Lefrançois, 2014 ; Dierendonck et Fagnant, 2014 ; Endrizzi et Rey, 2008 ; Monseur et Demeuse, 2005 ; Mottier Lopez, 2014 ; Rocque, 2014 ; Tochon, 2011). Dans cette foulée, on a assisté à la multiplication des épreuves d’évaluations externes (pour le suivi des élèves et du pilotage des systèmes) et à l’accroissement de leurs impacts dans ces systèmes éducatifs, en raison de trois principaux phénomènes : (a) la participation d’un nombre toujours plus grand de pays aux enquêtes internationales sur le rendement des élèves ; (b) le nombre accru d’évaluations externes préparées par les différentes juridictions scolaires ; et (c) le souci d’évaluation de performance des établissements et du travail du personnel scolaire (De Ketele, 2013 ; Laveault, 2009, 2014).

L’évaluation externe et standardisée s’est ainsi imposée comme l’un des instruments majeurs d’une nouvelle régulation politique des systèmes éducatifs (Mons, 2009). Si ce type d’évaluation n’est pas une pratique nouvelle, depuis les années 2000, il suscite de nombreuses polémiques scientifiques et médiatiques (Mons, 2009 ; Monseur et Demeuse, 2005). De fait, la tendance aux examens uniformes standardisés pose de nouveaux défis, en particulier celui de leur articulation avec une évaluation formative continue (Fontaine et al., 2013 ; Monseur et Demeuse, 2005). En effet, la pression sociale exercée sur les enseignants les inciterait à se concentrer sur les objectifs évalués lors des épreuves externes, au lieu de mettre en place des modalités d’évaluation formative. En conséquence, ce sont les examens qui définissent le curriculum qui sera enseigné, au détriment de tous les autres aspects, d’où l’aphorisme « enseigner pour l’examen » (teach to the test), qui a acquis une familiarité significative.

Une autre polémique concerne le rapprochement entre le pédagogique et le politique :

Alors qu’hier l’évaluation standardisée centrée sur la mesure des apprentissages s’intéressait principalement à l’élève, aujourd’hui son champ d’intervention est beaucoup plus large et met en lien le pédagogique – sa terre d’élection traditionnelle – et le politique, dont il est devenu un outil de pilotage

Behrens, 2006, cité dans Mons, 2009, p. 5

En ce sens, les données sur l’éducation produites par des organisations internationales (p. ex., l’OCDE et la Banque mondiale) influencent de plus en plus les politiques éducatives (Cerqua et Gauthier, 2013). Dans ce contexte d’interinfluence, les résultats des enquêtes comparées tendent à produire des conséquences concrètes, tangibles pour les populations comme pour les gouvernements (Nóvoa et al., 2014).

Ainsi, malgré les changements de paradigme éducatif rapportés plus haut, paradoxalement, l’évaluation externe et sa standardisation s’inscrivent dans la vision d’action publique séquentielle et rationnelle de la NGP[6] (Mons, 2009), qui procède d’une conception descendante (top-down) ou fonctionnaliste de l’action publique selon laquelle les politiques seraient mises en oeuvre par les acteurs locaux (enseignants, directions d’école) telles qu’elles sont décidées dans leur cadre légal. Alors que, dans le paradigme de l’évaluation formative et de l’approche par compétences, l’élève est considéré comme le premier acteur de sa réussite scolaire, dans celui de l’évaluation standardisée, l’accent est mis en priorité sur la redevabilité des écoles qui, en contrepartie, se voient octroyer davantage de marge de manoeuvre. Néanmoins, les études qui s’intéressent au processus mis en oeuvre par les acteurs locaux dans le cadre de l’évaluation standardisée indiquent que cette vision théorique descendante pose problème, car les acteurs développent des stratégies d’adaptation aux injonctions institutionnelles qui peuvent ne pas aller dans le sens des objectifs attendus (Mons, 2009). Ces propos font ainsi écho à la théorie de la structuration du monde social de Giddens (1987) selon laquelle quand les acteurs sociaux sont sous contrainte et pression, ils s’engagent dans des accords pragmatiques pour s’en sortir.

Le modèle de l’évaluation standardisée prend racine dans des théories de la mesure quantitative, à l’aune d’un paradigme de recherche édumétrique qui accorde du crédit à des dimensions telles que la validité et la fidélité (Lafontaine et Monseur, 2012 ; Mons, 2009) :

  • Les tests permettent une mesure valide des apprentissages des élèves ainsi que de la qualité des enseignements offerts par les écoles ;

  • Cette mesure n’est pas affectée par des différences entre élèves en matière de motivation, de maîtrise de la langue, de statuts sociaux et ethniques. Il serait possible de mesurer ces dimensions d’une manière fiable et relativement juste dans un contexte international ;

  • Le personnel des établissements scolaires, motivé par un dispositif de sanctions/récompenses ainsi que par le regard extérieur posé sur leur travail par les parents et l’opinion publique, cherche à améliorer l’enseignement et dispose des ressources pour le faire ;

  • Les écoles peuvent être tenues responsables des performances des élèves. Les parents comprennent la signification des tests et peuvent interpréter les résultats de leur enfant et des écoles dans leur globalité.

Ces présupposés mettent en relief les prétendus bienfaits de l’évaluation standardisée, mais il n’existe aucun consensus empirique qui permet d’en attester (Mons, 2009 ; Rozenwajn et Dumay, 2015). A contrario, l’épistémologie positiviste et rationaliste, voire technocrate de l’évaluation standardisée (Lafontaine et Monseur, 2012), souvent utilisée pour rendre visibles plusieurs critères considérés comme objectifs, soulève différentes critiques (Lamont, 2012). Sur le plan méthodologique, les prétentions à la justesse et la capacité à chasser tout arbitraire des méthodes d’évaluation sont questionnées : Quelle différence établir entre fait et opinion ? Entre ce qui est prouvé et ce que suggère la preuve (LeBreton, 2012) ?

Ainsi, les promoteurs de ces évaluations standardisées chercheraient à établir leur légitimité en rendant visibles et explicites les critères d’évaluation utilisés, qu’ils soient conscients ou non de leur caractère arbitraire (Lamont, 2012). Belhoste (2002) soulève notamment la question de la légitimité des épreuves et du verdict, lesquels dépendraient de plusieurs facteurs tels que l’autorité des examinateurs et des instances qui les désignent, la validité des connaissances et des aptitudes soumises à l’évaluation ainsi que la fiabilité des corrections et des jugements. Selon cet auteur, l’étude des examens illustre ce qui fait l’intérêt, mais aussi la difficulté de l’histoire de l’éducation : les processus d’enseignement-apprentissage sont des réalités fondamentales de la vie en société, tandis que l’examen et l’évaluation standardisée sont des construits sociaux.

Les études citées dans cette catégorie, qui présente des analyses en lien avec la NGP et l’évaluation standardisée, se trouveraient dans une catégorie sociologique différente qui n’avait pas été ciblée par la littérature sur le domaine. L’objet sociologique de ces travaux est fort différent, dans la mesure où on n’évalue pas seulement les élèves, mais les systèmes et institutions éducatifs de même que les modes de gouvernance.

L’évaluation comme matérialisation des normes d’excellence et la démocratisation de la réussite scolaire

Plusieurs textes ont en commun de faire ressortir comment l’évaluation des apprentissages matérialise ce que Perrenoud (1995) appelle des « normes d’excellence » qui mettent en jeu la démocratisation de la réussite scolaire. Selon lui, ces normes sont diversement interprétées et appliquées à l’ensemble des apprenants, à travers des procédures et des pratiques d’évaluation (in)formelles. Les matérialisations des normes d’excellence scolaire peuvent être identifiées à travers les produits de la démarche évaluative, par exemple les notes et les résultats chiffrés dans les bulletins scolaires ou encore les classements et la hiérarchisation des élèves.

La question des résultats chiffrés de l’évaluation a fait l’objet de fortes polémiques dans le monde francophone, notamment au Québec, en Suisse et en Belgique (Endrizzi et Rey, 2008 ; Mottier Lopez, 2014). Les revendications des parents, qui souhaitent voir la présence familière des notes dans les bulletins, notes qu’ils jugent d’ailleurs plus « objectives » (Morrissette et Legendre, 2011), sont souvent à l’origine de ces polémiques, ce que dénonce Perrenoud (2001) :

Nous sommes encore habités par un modèle archaïque d’évaluation certificative, obsédés par l’équité formelle davantage que par la pertinence du jugement. Mieux vaut dans l’esprit des élèves, de leurs parents, des étudiants, voire des professeurs un QCM qui ne mesure rien d’essentiel, mais paraît plus « objectif » que le jugement d’un professionnel compétent et expérimenté, qu’on estime d’emblée « subjectif »

p. 2

Le lien entre les résultats scolaires et les impacts possibles sur l’estime de soi et la motivation des élèves a été aussi traité dans plusieurs textes analysés. D’un côté, Bourque et al. (2014) mettent de l’avant que les résultats scolaires n’auraient pas d’impacts négatifs sur l’estime de soi des élèves, car des recherches conduites depuis les années 2000 établissent que le lien entre l’estime de soi et le rendement scolaire serait faible et inconsistant (Marsh et O’Mara, 2008, cités dans Bourque et al., 2014). De l’autre côté, Merle (2014) argue qu’on dit de la notation qu’elle aurait pour vertu de favoriser une (saine) émulation et une compétition entre élèves qui serait indispensable à leur motivation, mais que ce discours relèverait le plus souvent de la preuve par soi : ce qui est vécu personnellement est assimilé à une situation commune. Ce discours serait tenu et diffusé par les diplômés, par les anciens bons élèves et par ceux qui sont sortis vainqueurs des épreuves scolaires. Ainsi, toujours selon Merle (2014), croire que la note encourage les élèves revient à être aveugle au gâchis considérable que constitue l’ampleur du décrochage précoce. Pour le dire simplement, les normes d’excellence encourageraient les bons élèves et décourageraient les autres. En outre, pour les meilleurs élèves, les effets globaux de la note ne seraient pas forcément positifs non plus, car la compétition scolaire favoriserait l’individualisme et le développement de comportements antisociaux (Merle, 2014). Dans cette optique, l’essentiel n’est plus d’apprendre, de comprendre ou de se passionner, mais d’être parmi les premiers, ce qui rejoint Gérard (2013), pour qui la prégnance de ces évaluations chiffrées est telle qu’elle semble détourner les élèves des véritables objectifs d’apprentissage ; ils cherchent uniquement à avoir la moyenne, à passer dans la classe supérieure et à réussir l’examen.

Par ailleurs, la controverse sur les notes chiffrées se traduit souvent en débat entre égalité des chances et méritocratie ou excellence scolaire. Pour Jeffrey (2013), les questions qui touchent à la peur de l’excellence scolaire n’ont pas d’explication unique. Il conviendrait de se demander si cette peur provient d’une mauvaise compréhension de l’égalité des chances à l’école, car tous les élèves ne sont pas capables des mêmes performances dans toutes les activités d’apprentissage. Ainsi, « donner les mêmes chances à tous de réussir à l’école ne devrait pas conduire à cesser de reconnaître le mérite et l’excellence selon des standards communs à tous les élèves du même niveau » (Jeffrey, 2013, p. 51). En ce sens, l’excellence ne s’oppose donc pas à l’égalité des chances parce que le système scolaire peut encourager tous les élèves à réussir et soutenir les élèves en difficulté. Toutefois, il faudrait pour cela accepter le fait que des élèves réussissent mieux que d’autres dans certains apprentissages : « Cela ne disqualifie pas ceux et celles qui réussissent moins bien, tant et aussi longtemps qu’on ne se sert pas de l’excellence pour trier les élèves » (Jeffrey, 2013, p. 55). Or, pour Perrenoud (1989), les normes d’excellence et le mode de fabrication des jugements sont des enjeux conflictuels, car on évalue l’excellence en fonction d’une norme implicite ou explicite définie par l’évaluateur. Ainsi, la norme d’excellence serait appliquée aux apprenants lors des pratiques d’évaluation selon l’interprétation qu’en fait l’évaluateur. Pour cet auteur, l’arbitraire de l’évaluation est donc constamment susceptible d’être (re)découvert et contesté par les intéressés.

Dans le panorama scolaire actuel, qui se définit entre égalité des chances et méritocratie, il semblerait que les enseignants, les groupes dominants et les bons élèves privilégient fréquemment le mérite, et que les groupes dominés et les élèves moins performants valorisent davantage le principe d’égalité (Cogérino et Mnaffakh, 2008). On constate, à l’instar de Dubet (2000, cité dans Cogérino et Mnaffakh, 2008), que « plus l’école se démocratise, plus elle s’efforce de réaliser les conditions de l’égalité des chances et plus elle augmente les contradictions entre égalité et mérite. L’école démocratique est aussi méritocratique : les individus supposés égaux sont en constante compétition » (p. 114).

Pour satisfaire les impératifs de performance du système, les élèves perdent donc les moyens nécessaires pour se créer une identité propre puisqu’ils se voient imposer un modèle d’existence d’une organisation extérieure (Bourque et al., 2014). Ainsi, l’évaluation des apprentissages risque de mettre les élèves dans une situation qui leur échappe et dans laquelle ils ne sont pas intéressés à s’engager (Cardinet et Laveault, 2001). Et lorsque ce qui est évalué risque d’influencer l’avenir d’un système, provoquant un rétrécissement du curriculum, le développement d’une éducation humaniste qui promeut l’individualité et la créativité s’en trouve limité. Ainsi, depuis le milieu du 20e siècle, l’école publique essaie de trouver l’équilibre entre, d’un côté, un discours favorable à l’égalité des chances, à l’équité et à la justice des systèmes de formation et, de l’autre, un attachement à des structures sélectives et discriminantes (Gilliéron Giroud et Tessaro, 2009).

Les textes analysés dans cette catégorie posent ainsi l’enjeu de l’analyse sociologique des politiques publiques reposant sur l’examen des sources de légitimité des processus, dont les processus évaluatifs et des évaluateurs. Ici, des analyses situent l’école démocratique dans un véritable contexte de marché. Selon De Ketele (2013), les palmarès favorisent la compétitivité et réduisent l’éducation à un segment du marché scolaire, à une « marchandise » comme une autre, ce qui favorise le développement des fractures sociales et des inégalités scolaires. Ce déplacement s’inscrit dans la mouvance plus large de la globalisation, qui affecte les économies de la planète et influence de manière importante l’éducation depuis la fin du 20e siècle (Rayou, 2015). Dans ces « économies de la connaissance », l’éducation est vue comme un moyen qui permet à l’individu formé d’améliorer son salaire en vue de satisfaire des besoins individuels et de société, notamment la croissance économique (Hanhart, 2019). Elle risque ainsi de contribuer à un développement personnel centré sur l’avoir, plutôt qu’au développement personnel centré sur l’être (De Ketele, 2013).

Conclusion

Nous souhaitons conduire, dans cette dernière section, une discussion dans l’optique du deuxième objectif visé par cette contribution, soit identifier des perspectives et des questionnements de recherche actualisés en sociologie de l’évaluation scolaire en lien avec des problématiques qui concernent les élèves et les enseignants ainsi que le contexte actuel de pression à l’évaluation.

Prenant un peu de hauteur sur ce dialogue que nous avons institué entre les textes étudiés et les autres auteurs convoqués, nous constatons que, jusqu’ici, c’est une sociologie critique qui s’est surtout invitée dans l’exploration des objets qui concernent le domaine de l’évaluation scolaire. Les réflexions suscitées par Merle, Perrenoud, etc. ont joué le rôle de garde-fou à une science qui pourrait être aveugle aux postulats et aux mouvements qui se présentent comme une lame de fond (p. ex., la NGP) et qui suscitent, de manière très compréhensible, beaucoup d’enthousiasme chez les chercheurs du domaine de l’évaluation, qui y voient de nouvelles possibilités de travail. Puisqu’ils s’appuient pour une bonne part sur des statistiques, cette ère de valorisation des chiffres et de la mesure se présente à l’évidence comme une opportunité pour eux.

Les échanges entre la sociologie et le domaine de l’évaluation ont jusqu’ici formé une sorte de couple historique façonnant leur évolution respective, soutenant leur dynamisme et préservant leur richesse parce qu’ils n’ont pas provoqué d’asymétries excessives. La mise en lumière des enjeux critiques liés aux pratiques d’évaluation n’a pas tranché les débats, mais les a animés, sous la forme de controverses et non de la disqualification, ce qui est à notre sens un signe de vitalité scientifique. Si des chercheurs du domaine de l’évaluation se sont référés à des auteurs affiliés à la sociologie, il est raisonnable de penser qu’en l’absence d’un domaine organisé – celui d’une sociologie de l’évaluation –, ils aient dû chercher des appuis extérieurs pour fonder leurs travaux qui différaient des travaux habituels pour le domaine. Et si ces travaux sont restés jusqu’ici un peu en marge, peu liés entre eux et peu organisés en un projet scientifique précis, il est possible qu’une lutte de revendication de juridiction soit en cause. Selon Abbott (1988), les membres d’une écologie professionnelle cherchent à contrôler leurs frontières en établissant des alliances, en légitimant et en validant dans le champ social des savoirs spécialisés pour conserver un monopole sur l’accomplissement de l’activité de travail, c’est-à-dire la « juridiction ». Dans cette optique, le recours à des travaux extérieurs peut sembler menaçant pour un territoire symbolique, car les savoirs spécialisés constituent les repères à partir desquels les membres d’une écologie professionnelle se définissent et se maintiennent en tant que groupe. Or, nous arguons qu’un respect des frontières entre le domaine de l’évaluation et celui de la sociologie serait contreproductif, car ils profitent tous deux d’une évolution croisée, ce qui est bien le sens de l’activité scientifique.

Pour preuve, les nombreux débats épistémologiques ont déjà produit leurs fruits ; la sociologie critique a mis en évidence l’arbitraire des normes évaluatives. Les débats sur les conséquences du contexte actuel ont aussi permis d’éclairer ce qui restait dans l’angle mort de certains chercheurs du domaine de l’évaluation ; les enjeux sociaux dont nous avons fait état, résultant de possibles « conséquences non intentionnelles de l’action » (Giddens, 1987), doivent être tenus en compte.

Dans la première catégorie d’enjeux, nous avons par exemple montré que l’évaluation formative prend de plus en plus de place dans le discours et les politiques des pays francophones, mais qu’elle peut être encore perçue par les élèves et leurs parents comme ne « comptant pas ». Elle serait d’ailleurs dévalorisée au sein de certains groupes sociaux.

Dans la deuxième catégorie, les travaux expliquent que l’approche par compétences propose de nouvelles pistes d’interprétation de l’évaluation moins mécaniques, mais, en pratique, les manières d’évaluer des enseignants auraient peu changé depuis la pédagogie par objectifs.

Dans la troisième catégorie, nous avons discuté des évaluations standardisées et de leur caractère arbitraire. Ainsi, la légitimité des évaluations est remise en question, car elle dépend largement de plusieurs facteurs, par exemple l’autorité des examinateurs et des instances qui les désignent.

Enfin, dans la dernière catégorie d’enjeux, les textes analysés révèlent un panorama scolaire défini entre égalité des chances et méritocratie, certains groupes d’acteurs valorisant l’un ou l’autre de ces pôles.

Néanmoins, ce courant critique s’est présenté jusqu’ici comme une sociologie plutôt théorique. Tout en continuant d’y puiser, nous pensons que les perspectives en recherche pour les années à venir logent à l’enseigne de la sociologie compréhensive de George Herbert Mead (1863-1931), qui se veut bien ancrée empiriquement et qui privilégie des problématiques attentives à l’univers de significations auquel les acteurs se réfèrent et donc aux logiques qui sous-tendent leurs actions (Morrissette et al., 2011). Une telle sociologie permettrait de saisir les expériences de différents groupes d’acteurs sociaux impliqués de près ou de loin et selon différentes positions dans les processus évaluatifs particulièrement saillants du contexte actuel.

L’intérêt de cette sociologie compréhensive réside aussi dans le renouvellement des méthodologies de recherche qu’elle susciterait pour le domaine de l’évaluation. En effet, elle favoriserait des démarches moins courantes qui permettraient de renouveler le regard sur des objets socialement vifs. Par exemple, des ethnographies privilégiant l’observation directe, au sein de démarches ouvertes et non codifiées, pourraient contribuer à poser d’autres regards – présentement absents – sur les enjeux actuels du domaine de l’évaluation. Aussi, des récits biographiques, qui donnent un accès privilégié aux schémas interprétatifs des acteurs concernés, permettraient d’apprécier comment les pratiques évaluatives façonnent les trajectoires des élèves, tout comme des entretiens compréhensifs combinés à l’analyse de situations permettraient d’examiner comment se négocie l’interdépendance des positions des acteurs en classe durant « l’action évaluative ». Bref, aux côtés d’une sociologie critique et théorique, une sociologie compréhensive valorisant des démarches de terrain contribuerait à la diversification méthodologique susceptible de nourrir les travaux à venir.

Limites

Notre analyse des écrits présente bien sûr certaines limites qu’il convient de soulever. Par exemple, en ayant exclu les écrits qui ne concernent pas directement l’évaluation des apprentissages, il est évident qu’on adopte une vision plus étroite des processus d’enseignement/d’apprentissage/d’évaluation, qui sont bien sûr étroitement liés. Par ailleurs, nous avons réalisé une recension des écrits qui ne se veut pas exhaustive, mais, au contraire, qui a laissé place à notre jugement. En ce sens, un certain nombre d’écrits pertinents qui traitent des enjeux sociologiques de l’évaluation scolaire ont pu être mis de côté.

Malgré ces limites, cette recherche a permis de mieux appréhender ce qui pourrait être le domaine de la sociologie de l’évaluation scolaire en mettant en discussion des travaux en français. Nous avons ainsi pu faire un apport à la formalisation du domaine, tout en mettant en lumière différents enjeux sociologiques qui jalonnent les pratiques d’évaluation scolaire.