Article body
Le livre de Gilles Raîche et Nadine Talbot (2020) sur la mesure et l’évaluation constitue un guide pratique des modélisations issues de la théorie de la réponse à l’item. Il propose des solutions aux limites des analyses factorielles classiques à l’égard des variables manifestes discrètes en sciences humaines. L’ouvrage est divisé en deux grandes parties qui amènent le lecteur des concepts théoriques aux applications pratiques. La première partie concerne la méthodologie et se divise en quatre chapitres.
Le premier chapitre écrit par Gilles Raîche présente la modélisation à réponses dichotomiques qui sert à calculer la probabilité d’une réponse à un item en particulier. Cette probabilité s’appuie sur l’invariance par rapport aux items administrés et aux personnes testées. Par exemple, l’auteur détermine la modélisation la plus appropriée avec des critères d’information ; puis, il vérifie l’invariance des paramètres d’items selon la population ; ensuite, il analyse la précision de la mesure pour en assurer la validité et l’interprétation.
Le deuxième chapitre du professeur Éric Dionne présente une réflexion sur la difficulté d’identifier les compétences interculturelles et à les évaluer. Il s’inspire des Tests de concordance de scripts pour produire des données standardisées qui sont bien adaptées aux variables culturelles et efficaces dans l’évaluation formative. Il utilise ce test pour construire et valider un test de jugement servant à évaluer les compétences interculturelles.
Le troisième chapitre de Nadine Talbot et Gilles Raîche présente la méthodologie des méta-analyses afin de rendre comparables les résultats d’études recensées. Ils présentent la méthodologie comme une synthèse des écrits qui a l’avantage de regrouper plusieurs études afin de faire ressortir les éléments manquants. En revanche, la méta-analyse est tributaire des études dont la qualité peut varier et les usages des résultats dans de multiples articles peuvent en altérer les conclusions. Les auteurs y présentent cinq étapes pour réaliser une méta-analyse ainsi que les biais potentiels.
Le quatrième chapitre rédigé par Isabelle Linteau et Étienne Blais présente deux stratégies pour dénouer un enjeu dans lequel les résultats sont contradictoires. L’analyse des bornes extrêmes permet d’estimer la sensibilité de l’effet d’une variable en fonction des tierces variables d’un modèle. La stratégie de régression segmentée permet d’évaluer les différents changements qu’un évènement peut produire sur le comportement d’une série chronologique. Ces deux stratégies combinées apportent des nuances sur un enjeu socialement vif.
La seconde partie de l’ouvrage, comprenant cinq chapitres, présente des exemples d’applications en évaluation. Dans le chapitre cinq, Patrice Potvin, Patrick Charland, Martin Riopel, François Boucher-Genesse et Guy-Norbert Loubaki proposent une démarche de recherche et de développement pour évaluer des compétences transversales avec une seule simulation. À travers cinq étapes, ils construisent une simulation authentique, générique et adisciplinaire. Cette démarche assure la validité de la mesure de la simulation tout en collectant des données pour produire une modélisation multiniveau.
Le sixième chapitre s’intéresse à l’évaluation de la littératie en santé à la suite d’une formation. Maud Bouffard et Claudie Solar proposent un cadre conceptuel qu’elles arriment avec un questionnaire validé. Leurs analyses avec les tests non paramétriques de Wilcoxon, de Mann-Whitney et de Friedman leur permettent d’identifier les limites de l’évaluation de la littératie en santé.
Dans le chapitre sept, Martin Lesage et Gilles Raîche détaillent le processus d’informatisation d’une évaluation hiérarchique des apprentissages. Par une méthodologie de recherche-développement, les auteurs développent et testent une application d’évaluation hiérarchique des apprentissages. À la lumière de ces tests, ils définissent les limites et les améliorations requises à l’application pour son développement informatique.
Le chapitre huit compare deux modèles d’évaluation d’établissements publics. La démarche historique montre les forces et faiblesses des deux modèles d’évaluation. Julie Brusq y met en exergue les limites de transférabilités entre les deux modèles qu’elle invite à dépasser par une intégration dans une entité créée spécialement pour l’évaluation.
Le chapitre neuf vise à valider la qualité psychométrique d’une échelle du niveau d’adéquation perçu des pratiques d’évaluation des apprentissages à l’approche par compétences. Par un test empirique et une analyse factorielle exploratoire, Nadine Talbot montre la nécessité de mesurer simultanément les pratiques d’évaluation des apprentissages et les compétences.
Dans l’ensemble, cet ouvrage est un guide utile autant pour le novice que pour l’expert. L’ouvrage est facilement accessible par la simplicité de son écriture et la qualité de l’organisation des idées. Les chapitres couvrent un éventail de disciplines et des enjeux de différents ordres. Ils ouvrent la voie à des mécanismes capables de dépasser les limites usuelles de l’évaluation et de la mesure. Ces mécanismes apportent un éclairage nouveau sur des questions débattues depuis longtemps où les résultats peuvent être contradictoires, imprécis ou ambigus. Il est toutefois nécessaire de mentionner que les mécanismes en question mériteraient d’être formellement explicités. En ce sens, il manque une conclusion pour bien mettre en valeur les différents apports avec une synthèse des mécanismes. Bien que les chapitres apportent globalement une force argumentaire à l’ouvrage, certains articles apparaissent moins pertinents sur le plan social. Somme toute, il s’agit d’un ouvrage intéressant pour quiconque souhaite assurer la validité de l’interprétation de la mesure en éducation.