Recensions

Raîche, G. et Talbot, N. (dir.). (2020). Des mécanismes pour assurer la validité de l’interprétation de la mesure en éducation. Volume 4 – Interdisciplinarité de la mesure et de l’évaluation. Presses de l’Université du Québec[Notice]

  • Jesse Schnobb

…plus d’informations

  • Jesse Schnobb
    Université du Québec en Outaouais

Le livre de Gilles Raîche et Nadine Talbot (2020) sur la mesure et l’évaluation constitue un guide pratique des modélisations issues de la théorie de la réponse à l’item. Il propose des solutions aux limites des analyses factorielles classiques à l’égard des variables manifestes discrètes en sciences humaines. L’ouvrage est divisé en deux grandes parties qui amènent le lecteur des concepts théoriques aux applications pratiques. La première partie concerne la méthodologie et se divise en quatre chapitres. Le premier chapitre écrit par Gilles Raîche présente la modélisation à réponses dichotomiques qui sert à calculer la probabilité d’une réponse à un item en particulier. Cette probabilité s’appuie sur l’invariance par rapport aux items administrés et aux personnes testées. Par exemple, l’auteur détermine la modélisation la plus appropriée avec des critères d’information ; puis, il vérifie l’invariance des paramètres d’items selon la population ; ensuite, il analyse la précision de la mesure pour en assurer la validité et l’interprétation. Le deuxième chapitre du professeur Éric Dionne présente une réflexion sur la difficulté d’identifier les compétences interculturelles et à les évaluer. Il s’inspire des Tests de concordance de scripts pour produire des données standardisées qui sont bien adaptées aux variables culturelles et efficaces dans l’évaluation formative. Il utilise ce test pour construire et valider un test de jugement servant à évaluer les compétences interculturelles. Le troisième chapitre de Nadine Talbot et Gilles Raîche présente la méthodologie des méta-analyses afin de rendre comparables les résultats d’études recensées. Ils présentent la méthodologie comme une synthèse des écrits qui a l’avantage de regrouper plusieurs études afin de faire ressortir les éléments manquants. En revanche, la méta-analyse est tributaire des études dont la qualité peut varier et les usages des résultats dans de multiples articles peuvent en altérer les conclusions. Les auteurs y présentent cinq étapes pour réaliser une méta-analyse ainsi que les biais potentiels. Le quatrième chapitre rédigé par Isabelle Linteau et Étienne Blais présente deux stratégies pour dénouer un enjeu dans lequel les résultats sont contradictoires. L’analyse des bornes extrêmes permet d’estimer la sensibilité de l’effet d’une variable en fonction des tierces variables d’un modèle. La stratégie de régression segmentée permet d’évaluer les différents changements qu’un évènement peut produire sur le comportement d’une série chronologique. Ces deux stratégies combinées apportent des nuances sur un enjeu socialement vif. La seconde partie de l’ouvrage, comprenant cinq chapitres, présente des exemples d’applications en évaluation. Dans le chapitre cinq, Patrice Potvin, Patrick Charland, Martin Riopel, François Boucher-Genesse et Guy-Norbert Loubaki proposent une démarche de recherche et de développement pour évaluer des compétences transversales avec une seule simulation. À travers cinq étapes, ils construisent une simulation authentique, générique et adisciplinaire. Cette démarche assure la validité de la mesure de la simulation tout en collectant des données pour produire une modélisation multiniveau. Le sixième chapitre s’intéresse à l’évaluation de la littératie en santé à la suite d’une formation. Maud Bouffard et Claudie Solar proposent un cadre conceptuel qu’elles arriment avec un questionnaire validé. Leurs analyses avec les tests non paramétriques de Wilcoxon, de Mann-Whitney et de Friedman leur permettent d’identifier les limites de l’évaluation de la littératie en santé. Dans le chapitre sept, Martin Lesage et Gilles Raîche détaillent le processus d’informatisation d’une évaluation hiérarchique des apprentissages. Par une méthodologie de recherche-développement, les auteurs développent et testent une application d’évaluation hiérarchique des apprentissages. À la lumière de ces tests, ils définissent les limites et les améliorations requises à l’application pour son développement informatique. Le chapitre huit compare deux modèles d’évaluation d’établissements publics. La démarche historique montre les forces et faiblesses des deux modèles d’évaluation. Julie Brusq y met en exergue les …