Corps de l’article

1. Introduction

La réussite scolaire ne dépend pas uniquement des connaissances préalables de l’élève ou de son intérêt pour la matière, mais également des stratégies que celui-ci emploie pour l’apprentissage, pour la résolution de problèmes ou pour la compréhension de texte (Berger et Büchel, 2013; Murphy et Alexander, 2002). En dépit du rôle significatif des stratégies, les recherches montrent que les enseignants n’en proposent que très peu (ou d’heuristiques dans le cas des maths) à leurs élèves, concentrant leur enseignement sur les connaissances et les procédures (Brandmo et Berger, 2013; De Corte, Paepe et Verschaffel, 2011; Elke, Grieder, Tiaden, Steiner, Metzger, Nüesch, Büchel, Berger et Kipfer, 2010; Kistner, Rakoczy, Otto, Dignath-von-Ewijk, Büttner et Kliene, 2010). Ce phénomène est constaté paradoxalement dans les classes d’élèves adolescents, quand bien même enseignants et parents attendent de ceux-ci qu’ils deviennent autonomes dans leurs apprentissages.

Les adolescents rencontrant des difficultés d’apprentissage montrent souvent un fonctionnement déficitaire en compréhension de texte, ce qui handicape leur performance dans de multiples sujets, car les consignes écrites ainsi que les problèmes ne sont pas réservés aux cours de français. Ce déficit s’explique par la faible utilisation ou le recours inadéquat à des stratégies pour s’aider dans la compréhension des informations. Ainsi, les élèves les moins stratégiques voient-ils leurs compétences en compréhension de texte diminuer au cours de leur scolarité (Smith, Borkowski et Whitman, 2008), car le recours à des stratégies plus complexes devient nécessaire. Toutefois, un certain nombre d’études ont montré qu’un entraînement des stratégies d’apprentissage et une prise de conscience de son propre fonctionnement cognitif permettaient d’améliorer la compréhension de texte chez des élèves en difficulté (Büchel et Molo, 2000; De Corte, Verschaffel et Van De Ven, 2001; Guthrie, Wigfield et Perencevich, 2004; Tonks et Taboada, 2011).

Plus généralement, les métaanalyses de Hattie (2009) révèlent que l’enseignement de stratégies métacognitives, qui servent à la régulation des processus cognitifs (par exemple planifier les étapes de résolution d’un problème), aurait un effet moyen de d = ,69 sur les performances scolaires (63 études au total) alors que l’utilisation par les élèves de stratégies d’apprentissage (cognitives et métacognitives) montre un effet moyen de d = ,60 (5667 études au total). Ces deux effets indiquent d’une manière générale qu’un entraînement stratégique permet d’améliorer les performances scolaires de plus d’un demi écart-type en comparaison à un groupe suivant un enseignement habituel. Ainsi, il s’agit d’un moyen d’améliorer la réussite scolaire des élèves. Dans le champ de la compréhension de texte, les métaanalyses de Dignath et Büttner (2008) et Dignath, Büttner et Langfeldt (2008) sur des élèves des niveaux scolaires primaires et secondaires concluent que des entraînements visant l’apprentissage de stratégies cognitives et métacognitives sont efficaces, ceci d’autant plus s’ils sont couplés à un enseignement des métaconnaissances relatives aux conditions d’utilisation des stratégies ainsi qu’à une réflexion métacognitive sollicitée chez les élèves. Les stratégies cognitives enseignées lors de ces entraînements sont, par exemple, des stratégies d’élaboration consistant à résumer un texte ou à paraphraser un paragraphe; les stratégies métacognitives sont notamment la planification, soit la sélection de stratégies et l’allocation d’un certain temps pour apprendre, et le monitorage, soit la vérification de sa compréhension du texte au fur et à mesure de la lecture. Par ailleurs, une différence significative existe entre l’effet d’un entraînement stratégique donné par un membre du groupe de chercheurs et l’effet d’un même entraînement donné par les enseignants, ces derniers jouant alors le rôle d’intermédiaire entre les chercheurs et les élèves. En effet, c’est compréhensible, le premier effet est plus large que le second (Dignath et Büttner, 2008; Dignath et al., 2008; Hattie, Biggs et Purdie, 1996) notamment parce que la situation de classe est largement plus complexe que la situation de laboratoire et que les enseignants traduisent et adaptent les principes de l’entraînement à la réalité de leurs classes. Toutefois, il nous paraît essentiel que ce soient les enseignants qui administrent ce type d’entraînement à leurs élèves étant donné qu’une intégration des principes de cet entraînement dans l’enseignement quotidien est souhaitée à long terme. Selon Brown et Palincsar (1987), «toute procédure d’entraînement qui se veut d’une utilité pratique doit être réalisable dans le cadre de l’enseignement, c’est-à-dire qu’elle doit pouvoir être implémentée par des enseignants ordinaires et dans des conditions proches de celles d’une classe ordinaire» (p. 110, traduction des auteurs).

Une autre source de variation dans les effets réside dans l’administration individuelle ou collective de l’entraînement. Bien que cette distinction n’ait pas été analysée dans l’étude de Dignath et Büttner (2008), il est évident qu’un entraînement collectif est moins adapté aux besoins et caractéristiques de chacun des élèves. Toutefois, ceci est plus facilement réalisable en classe et présente l’avantage de se rapprocher des situations d’enseignement typiques.

L’objectif de la présente étude est d’analyser les effets d’un module d’entraînement métacognitif, administré par des enseignants en situation de classe (collective), sur les performances et stratégies en compréhension de texte ainsi que dans une tâche de transfert éloigné. Le transfert éloigné consiste en l’application de stratégies dans un contexte ou une situation différente de celle dans laquelle des stratégies ont été apprises. Ce qui distingue cette étude de la majorité des recherches est que l’entraînement est donné par les enseignants et non par les chercheurs et qu’il porte sur une diversité de tâches, facilitant ainsi le transfert des stratégies. Un plan de recherche impliquant trois temps de mesure, soit un prétest, un post-test immédiatement après la fin de l’intervention et un post-test différé 12 semaines après l’intervention a été appliqué.

1.1 Le module d’entraînement métacognitif

L’entraînement a constitué en un module de 12 leçons réalisées sous une forme collective, soit en classe entière. Les objectifs du module sont d’augmenter l’implication active des élèves dans leurs apprentissages, ceci par l’amélioration de leurs connaissances métacognitives et de leurs stratégies d’apprentissage, en particulier leurs stratégies métacognitives. Les nombreuses recherches suivant ces objectifs et qui ont été menées par le troisième auteur ont servi de fondement au présent module d’entraînement (p. ex., Berger, Kipfer et Büchel, 2008, 2010; Büchel, Berger, Kipfer et Frauchiger, 2010; Büchel, Grassi, Scharnhorst et Ghilardi, 2002). Quatre types de tâches ont été réalisés en alternance par les élèves: deux de type non scolaire (tirés des programmes DELV[1] [Büchel et Büchel, 1995] et Programme d’Enrichissement instrumental[2] [PEI, Feuerstein, Rand, Hofman et Miller, 1980]) et deux de type scolaire (compréhension de texte et résolution de problèmes mathématiques), ceci afin de favoriser le transfert des stratégies apprises dans le cadre de la résolution des exercices de type non scolaire aux exercices scolaires. Le contenu du module ainsi que les objectifs poursuivis figurent dans le tableau 1.

Tableau 1

Contenus et objectifs pour chaque séance

Contenus et objectifs pour chaque séance

-> Voir la liste des tableaux

Afin de préparer les enseignants à l’application du module d’intervention métacognitive, une formation de cinq jours leur a été proposée. Ses buts étaient de fournir aux enseignants les bases théoriques de la métacognition[3], des stratégies d’apprentissage et de leur application dans les différents types de tâches. De plus, les principes d’une médiation efficace étaient exposés et les enseignants se familiarisaient avec le matériel du module et des guides de médiation destinés à structurer l’intervention. À titre d’exemple, des extraits du guide de médiation pour les leçons consacrées à la compréhension de texte figurent dans l’annexe.

Des analyses des effets de l’entraînement (sur l’utilisation de stratégies, les perceptions de soi ainsi que les performances) ont déjà été réalisées à un niveau général ainsi que pour la résolution de problèmes mathématiques et rapportées dans diverses publications (Berger et al., 2008, 2010). Dans le présent article, nous proposons des analyses approfondies relatives aux effets de l’entraînement sur les stratégies, performances en compréhension de texte ainsi que le transfert des effets à une leçon de type scolaire.

2. Méthodologie

2.1 Participants

Au total dix enseignants et leurs 84 élèves ont participé à l’étude. Les participants venaient de plusieurs écoles professionnelles et de quatre cantons de Suisse romande. Trois enseignants ayant suivi la formation de cinq jours décrite préalablement et appliquant le module d’intervention de 12 leçons constituaient le groupe expérimental 1 (GE1). Quatre enseignants, également formés, ont appliqué les principes enseignés durant la formation, mais sans appliquer le module d’intervention tel que proposé (groupe expérimental 2; GE2). Finalement, trois enseignants n’ayant pas suivi la formation et ignorant les enjeux de la recherche ont constitué le groupe contrôle (GC). Ces derniers ont simplement enseigné comme ils le faisaient habituellement. La description des élèves selon l’âge moyen, la répartition des sexes et la nationalité est fournie dans le tableau 2.

Tableau 2

Caractéristiques de l’échantillon

Caractéristiques de l’échantillon

Note: Concernant le nombre d’élèves dans chaque classe (n), le premier nombre correspond aux participants lors du prétest, le second aux participants au post-test immédiat et le troisième aux participants au post-test différé. L’âge moyen (années; mois) et la répartition des sexes et de nationalités concernent les caractéristiques des participants au prétest.

-> Voir la liste des tableaux

Tous les élèves suivaient une formation professionnelle initiale d’une durée de deux ans, dont les exigences sont sensiblement plus faibles que celles des formations professionnelles classiques en trois ou quatre ans[4]. Ces élèves présentent de sérieuses difficultés d’apprentissage et sont jugés comme inaptes à accomplir une formation professionnelle classique. Leur formation accentue la pratique d’un métier, ceci au détriment des compétences scolaires ou du développement d’un raisonnement plus abstrait. Le quotient intellectuel non verbal moyen des participants, calculé selon les résultats au test Naglieri non verbal achievement test (Naglieri, 1998) est de 79,81 soit environ 20 points au-dessous de la norme; aucune différence statistiquement significative n’existe entre les trois groupes. Ce niveau intellectuel place les participants dans la catégorie des slow learners. Les classes sont toutes à effectif limité, au maximum 13 élèves, ce qui est habituel dans ce type de formations professionnelles. La mortalité expérimentale a été de 21 abandons entre le pré et le post-test différé, principalement due au licenciement de certains apprentis et au changement de projet professionnel d’autres.

2.2 Instruments

2.2.1 Test de connaissance du vocabulaire de Bonnardel (BV8, Bonnardel, 2002)

Ce test est composé de 50 items constituant des séries de six mots parmi lesquels cinq sont fortement liés sémantiquement et l’un est différent. La tâche de l’élève est d’identifier ce dernier. La consistance interne du score dans notre échantillon est de α = ,81. Le score moyen de l’échantillon au complet est très faible: 12,88 (écart-type 5,90) sur un maximum de 50 points, aucune différence statistiquement significative n’existe entre les trois groupes. Le résultat de ce test est utilisé comme covariée dans les analyses.

2.2.2 Test de compréhension de texte

Une perspective microanalytique a été choisie afin d’identifier et d’examiner les comportements en situation, soit durant une tâche spécifique (Cleary, 2011). La tâche de compréhension de texte nommée «Les détectives» (Büchel et Molo, 2000) a été adaptée et déclinée en trois versions parallèles, une pour chaque temps de mesure. Le test est constitué de trois parties. Premièrement, les élèves ont dix minutes pour lire le texte en ayant la possibilité de prendre des notes sur une feuille à part. Il leur est annoncé qu’ils devront ensuite répondre à des questions, ceci sans pouvoir consulter le texte. Deuxièmement, les élèves répondent à onze questions à choix multiples qui évaluent leur compréhension du texte (score de performance). Ils peuvent s’aider de leurs notes ou répondre de mémoire. Finalement, les élèves complètent sept items de type Likert (échelle de réponse à quatre niveaux) se référant à des stratégies (p. ex., «J’ai essayé de reformuler le texte dans mes propres mots pour vérifier que j’avais compris») qu’ils auraient pu utiliser (score stratégique). Ces stratégies ont été sélectionnées sur la base de la littérature scientifique (De Corte et al., 2001; Paris et Flukes, 2005; McKeown et Beck, 2009) et des expériences tirées de l’étude de Büchel et Molo (2000); elles sont similaires à celles qui ont été enseignées dans le module d’entraînement. Une analyse factorielle exploratoire a révélé que les items formaient une échelle unidimensionnelle. La consistance interne du score de performance est de α = ,58 au prétest, α = ,58 au post-test immédiat et α = ,69 au post-test différé. Pour les scores stratégiques, les indices sont dans l’ordre de α = ,76, ,68 et ,67. Finalement, une question ouverte demandait à l’élève de décrire la ou les stratégies qu’il avait employées («Qu’avez-vous fait pour vous souvenir de l’histoire et répondre aux questions le mieux possible?»). L’analyse des réponses à cette question révèle que l’écrasante majorité des élèves mentionne les stratégies «lire» et «relire» ou «prendre des notes». À cause de ce manque de variabilité, ces informations n’ont pas été analysées.

2.2.3 Qualité des prises de notes

Les notes prises par les élèves au cours des trois exercices de compréhension de texte présentées lors des phases de tests ont été analysées quant à leur qualité selon trois critères. Premièrement, la structure qui concerne le niveau d’organisation des notes (de «linéaire», c’est-à-dire simplement dans l’ordre du texte à «hautement structurée», présentant les relations entre les personnages et les faits découvertes au fur et à mesure de la lecture du texte). Deuxièmement, l’exhaustivité qui concerne le degré auquel les notes couvrent le contenu du texte. Finalement, la synthèse qui porte sur le fait de prendre des notes en utilisant des abréviations, des dessins ou autres raccourcis. Chacun de ces critères a été codé selon trois niveaux (1 à 3 points attribués). Un accord interjuge a montré que le codage des prises de notes était fiable (n = 19). Structure: τ = 1,00, exhaustivité: τ = ,62 (p < ,01) et synthèse: τ = ,82 (p < ,01).

2.2.4 Leçon scolaire sur DVD

Afin d’évaluer les effets de transfert «éloigné» de l’entraînement, deux versions parallèles d’une leçon standardisée ont été élaborées et administrées respectivement au post-test immédiat et différé. Le sujet des leçons (films pédagogiques) relevait du domaine de la biologie du corps humain (anatomie et physiologie): les muscles au post-test immédiat et le squelette au post-test différé. Ces thématiques ont été choisies, car aucun élève ne suivait un apprentissage dans un domaine en lien avec la biologie et ainsi, des différences interindividuelles dans les connaissances préalables étaient peu probables. La leçon était organisée en six phases. En premier, le chercheur lit une série de questions liées au sujet du film afin d’éveiller la curiosité des élèves. Puis, un film de vingt minutes est projeté une première fois. Immédiatement après cette projection, les élèves répondent par écrit à neuf questions ouvertes évaluant leur compréhension. Les questions portent sur des processus biologiques et non sur des faits précis requérant une mémorisation. Le film est ensuite projeté une seconde fois afin que les élèves puissent compléter leurs réponses si nécessaire. À la suite de cette seconde projection, ils répondent à un questionnaire à choix multiples (score de performance) dont les questions sont identiques aux questions ouvertes. Pour cela, ils peuvent utiliser leurs réponses aux questions ouvertes. Ce design a été choisi afin d’attribuer des scores aux différentes étapes de la leçon. La consistance interne du score de performance est de α = ,69 (8 items) au post-test immédiat et α = ,71 (9 items) au post-test différé. Finalement, afin d’évaluer les stratégies utilisées, les élèves répondent à la question ouverte suivante: «Qu’est-ce que vous avez fait afin de comprendre et vous souvenir de la leçon?». Les réponses à cette question ont été codées selon le système proposé par Büchel et al. (2002) en cinq catégories ordinales, représentant des stratégies de plus en plus sophistiquées. Les trois premières décrivent des niveaux d’activités attribués à chaque stratégie décrite et les deux derniers qualifient les réponses non liées à l’utilisation de stratégies. Les cinq catégories et les scores correspondants sont les suivants:

  1. Stratégie très active ou stratégie métacognitive (3 points; p. ex., «Je me suis arrêté quand j’ai réalisé que je ne comprenais pas»)

  2. Stratégies actives (2 points; p. ex., «J’ai procédé par étape»)

  3. Stratégies passives ou naïves (1 point; p. ex. «J’ai lu et relu le texte»)

  4. Réponses déviantes (0 point; p. ex., «Grâce à mon crayon», «C’est bon pour le moral de réfléchir beaucoup»)

  5. Pas de réponse (0 point; l’élève n’a rien écrit du tout).

Si un élève a mentionné plusieurs stratégies, les scores correspondants ont été additionnés, ainsi le score d’un élève peut être supérieur à 3 points. Un accord interjuge montre que le système de codage est fiable (τ = ,92, p < ,01).

2.2.5 Échelle d’évaluation des compétences métacognitives par l’enseignant

Cet instrument a été inspiré de l’échelle utilisée par Desoete et Roeyers (2006) qui demande aux enseignants d’évaluer les compétences métacognitives de chacun de leurs élèves en indiquant dans quelle mesure ils démontrent certains comportements (p. ex., «Cet élève vérifie son travail avant de le rendre»). L’échelle contient huit items auxquels l’enseignant répond sur une échelle de type Likert en sept points (1 = jamais; 7 = toujours). La consistance interne du score était de α = ,93 au prétest et α = ,90 au post-test immédiat.

2.3 Procédure

Tous les tests ont été administrés de manière collective et en classe. Le prétest, constitué du BV8 et du test de compréhension de texte, a été complété en décembre. Lors des premières semaines de janvier, les enseignants du GE1 ont reçu le matériel d’entraînement. Ils ont ensuite enseigné les 12 leçons au rythme d’une par semaine (14 semaines étaient à disposition). À la fin de la dernière leçon, un membre du groupe de recherche s’est rendu dans chaque classe des trois groupes afin d’administrer le post-test immédiat (constitué du test de compréhension de texte et de la leçon scolaire sur DVD). Des entrevues réalisées à ce moment-là ont révélé que les enseignants du GE2 avaient utilisé, comme cela était convenu, le matériel correspondant à environ la moitié des leçons du module. Huit semaines après ce premier post-test, le même membre du groupe de recherche a administré le post-test différé (constitué à nouveau du test de compréhension de texte et de la leçon scolaire sur DVD) à toutes les classes.

3. Résultats

Toutes les analyses de variances à mesure répétées ont été réalisées de manière unidirectionnelle, en incluant le groupe comme facteur intersujets, le temps de mesure comme facteur intrasujets et le score au BV8 comme covariée.

3.1 Compréhension de texte

3.1.1. Performances

Les performances correspondent au nombre de réponses correctes dans le questionnaire à choix multiples, converti en score z, car une question a dû être éliminée au post-test immédiat, car elle était mal formulée et le nombre de questions n’est ainsi pas identique aux trois temps de mesure. Le tableau 3 présente les moyennes pour chaque groupe, ceci à chaque temps de mesure.

Tableau 3

Performance et stratégies durant les tests de compréhension de texte

Performance et stratégies durant les tests de compréhension de texte

Note: Les scores de performance sont exprimés en scores-z. Les écarts-types figurent entre parenthèses.

-> Voir la liste des tableaux

Une analyse de covariance (ANCOVA) à mesure répétée avec la performance comme variable dépendante a été réalisée. Un effet de la covariée est révélé, F(1,51) = 15,07, p < ,01, η2 partiel = ,23. Des analyses de contrastes révèlent un effet d’interaction marginalement significatif Temps x Groupe, F(2, 51) = 2,41, p = ,05, η2 partiel = ,09, entre les post-tests immédiat et différé. Cet effet est significatif entre le GE1 et le GC, F(1,36) = 3,86, p = ,03, η2 partiel = ,10 ainsi qu’entre le GE2 et le GC, F(1,30) = 3,51, p = ,04, η2 partiel= ,11.

3.1.2 Stratégies

Les scores moyens de stratégies mesurées par les sept items de type échelles de Likert spécifiques au texte sont présentés dans le tableau 3. L’analyse de la variance (ANOVA) à mesure répétée montre un effet d’interaction Temps x Groupe significatif, F(4,76) = 2,82, p = ,02, η2 partiel= ,13. La covariée n’a pas d’effet significatif. Les analyses de contrastes révèlent que l’interaction est significative entre le prétest et le post-test immédiat, F(2,38) = 4,73, p = ,02, η2 partiel= ,11. Des analyses de contrastes supplémentaires indiquent que l’effet est significatif entre le GE1 et le GC, F(1,23) = 8,26, p = ,01, η2 partiel= ,26 ainsi qu’entre le GE1 et le GE2, F(1,23) = 3,31, p = ,04, η2 partiel= ,13. Bien que le score du GE1 régresse (non significativement) au post-test différé, il reste significativement supérieur au niveau du prétest, ce qui indique un certain maintien de l’amélioration dans l’utilisation des stratégies. Le tableau 4 indique les nombres et la proportion d’élèves qui ont pris des notes durant les tests de compréhension de texte ainsi que les rangs moyens de la qualité des notes.

Tableau 4

Proportion d’élèves ayant pris des notes Rangs moyens dans les critères de qualité de la prise de notes

Proportion d’élèves ayant pris des notes Rangs moyens dans les critères de qualité de la prise de notes

Note: les scores de structure t synthèse ainsi que d’exhaustivité représentent les rangs moyens.

-> Voir la liste des tableaux

Nous observons que la proportion d’élèves prenant des notes croît dans chacun des trois groupes, ce qui suggère qu’ils prennent conscience de l’utilité de cette stratégie. Concernant la qualité des notes, le test Friedman de différence de rang moyen révèle que les élèves du GE1 améliorent significativement la structure et synthèse de leurs notes entre le prétest et le post-test immédiat (χ(1) = 5,333, p = ,02) alors que les scores des autres groupes ne changent pas significativement. Entre post-test immédiat et différé, aucune différence significative n’apparaît. L’exhaustivité n’est pas non plus affectée par l’entraînement.

L’analyse des corrélations révèle que le niveau de structure et synthèse est associé à la performance en compréhension de texte aux trois temps de mesure: respectivement r = ,213, ,250 et ,424, tous p < ,01. Le niveau d’exhaustivité est également associé à la performance, bien que dans une moindre mesure: respectivement r = ,187, ,218 et ,214, tous p < ,01.

3.2 Analyse des différences interindividuelles

En complément de l’analyse des effets relatifs aux groupes et en reconnaissant que tous les élèves des groupes expérimentaux n’ont pas profité dans une mesure identique de l’entraînement, une analyse des gains résiduels a été réalisée. Cette mesure consiste dans le changement de score (entre le prétest et le post-test immédiat) qui n’est pas prédit par le prétest et reflète de ce fait le gain qui n’est pas linéairement dépendant du niveau initial (Campbell et Kenny, 1999). Ces scores de changement ont l’avantage d’éviter les problèmes liés à la régression vers la moyenne. Nous les avons utilisés afin de distinguer deux types d’élèves: ceux qui ont profité de l’entraînement (dont les performances se sont améliorées) et ceux qui n’ont pas amélioré leurs performances. Les gains résiduels ont été calculés pour les scores de performance, de stratégies et de contrôle métacognitif évalué par l’enseignant. Les «gagnants» ont été définis comme le 33% des élèves (GE1 et GE2) montrant, entre le prétest et le post-test immédiat, les plus hauts gains résiduels, les autres élèves étant dits «non gagnants». Des ANOVA ont ensuite été utilisées pour comparer les gagnants et les non-gagnants. Nous conjecturons que les élèves qui ont amélioré leurs performances ont également amélioré leurs stratégies et réciproquement. Le lien avec les connaissances de vocabulaire pourrait expliquer pourquoi certains élèves s’améliorent et d’autres ne le font pas.

En comparaison aux «non-gagnants», les «gagnants» en performance dans la compréhension de texte montrent un gain résiduel supérieur dans l’utilisation de stratégies, F(1, 32) = 4,79, p = ,01, η2 partiel = ,14. De plus, ils démontrent un niveau de vocabulaire plus élevé, F(1, 44) = 3,81, p = ,03, η2 partiel = ,08. Les «gagnants» en contrôle métacognitif, soit les élèves qui ont le plus fortement progressé dans le domaine stratégique selon leurs enseignants, montrent un gain résiduel dans les stratégies en compréhension de texte supérieur aux «non-gagnants», F(1, 24) = 4,77, p = ,02, η2 partiel = ,17. Finalement, les «gagnants» ont un niveau de vocabulaire plus élevé que leurs pairs, F(1, 28) = 8,06, p < ,01, η2 partiel = ,22.

3.3 Transfert

3.3.1 Performances

Le tableau 5 montre les scores de performance à la leçon scolaire sur DVD.

Tableau 5

Performance, scores moyens (écarts-types entre parenthèses) relatifs aux annotations, et moyenne des stratégies rapportées quant au film pédagogique

Performance, scores moyens (écarts-types entre parenthèses) relatifs aux annotations, et moyenne des stratégies rapportées quant au film pédagogique

-> Voir la liste des tableaux

Au post-test immédiat, le GE1 obtient un score supérieur aux deux autres groupes, mais les différences ne sont pas significatives. Une analyse de covariance incluant le score au post-test immédiat en tant que covariée et le score au post-test différé en tant que variable dépendante révèle par contre un effet significatif du groupe, F(2,54) = 2,30, p = ,05, η2 partiel = ,11, ainsi qu’un effet de la covariée. Des analyses de contrastes unidirectionnelles révèlent que le GE1 diffère marginalement du GE2, p = ,07, mais pas du GC. Afin d’investiguer les raisons de la faible performance du GE2 au post-test différé, nous avons évalué les annotations (constituées des annotations relatives au premier visionnement et des éventuels ajouts relatifs au second visionnement) prises durant le visionnement du film pédagogique (voir tableau 5). Pour chaque réponse correcte, deux points ont été accordés, un point pour une réponse partiellement correcte.

Dans chaque groupe, une amélioration substantielle des scores apparaît, indiquant que des annotations plus pertinentes ont été prises au deuxième post-test. L’analyse des corrélations entre prise de notes et performance révèle que la prise de note du GE2 au post-test différé n’est pas associée au score (pour les GE1 et GC r = ,45 à ,60, p < ,001, mais pour le GE2 r = ,25, ns). Ceci suggère que les élèves du GE2, au contraire du GE1 et du GC, n’ont pas profité de leurs notes au moment de répondre au questionnaire à choix multiples relatif à la leçon sur DVD. De plus, ceci est le cas pour chacune des quatre classes constituant ce groupe.

3.3.2 Stratégies

Les stratégies décrites en réponse à la question ouverte ont été codées (accord interjuge de τ = ,84, p < ,01) selon le système exposé plus haut (voir tableau 5). Une ANCOVA avec le score au post-test immédiat comme covariée révèle que, au post-test différé, le GE1 diffère significativement du GC, F(2,36) = 8,50, p < ,01, η2 partiel = ,20 ainsi que du GE2, F(2,34) = 10,88, p < ,01, η2 partiel = ,25. Les scores du GE2 ne diffèrent pas de ceux du GC.

4. Discussion et conclusion

Les objectifs de la présente étude étaient d’évaluer les effets d’un entraînement métacognitif sur les performances et stratégies en compréhension de texte ainsi que sur une tâche de transfert. Un module de 12 leçons a été appliqué par des enseignants de classes d’apprentis de la formation professionnelle à faible niveau d’exigences. Un plan de recherche quasi expérimental comprenant un prétest, un post-test immédiat et un post-test différé a été appliqué.

4.1 Interprétation des effets de l’entraînement

Comme nous l’avons déjà observé dans le cadre des effets sur la résolution de problèmes mathématiques (Berger et al., 2010), l’entraînement montre des effets significatifs dans les performances et les stratégies de compréhension de texte. Le GE1 et le GE2 réalisent, en comparaison du GC, une amélioration significative de leurs performances lors du post-test différé, mais pas directement suite à l’entraînement. Ainsi il semble qu’un certain temps soit nécessaire avant que les effets de l’entraînement ne se manifestent. Concernant le développement des stratégies, les effets apparaissent dans le GE1 juste après l’intervention. Ceci se manifeste dans les deux mesures des stratégies, soit les échelles de Likert autorapportées et la qualité des notes prises durant la lecture du texte.

L’évaluation du transfert éloigné a révélé des résultats plus décevants. Seule une différence marginalement significative a été identifiée; elle concerne la comparaison entre GE1 et GE2. Il apparaît ainsi que les élèves du GE1 ont rencontré des difficultés à transférer les apprentissages réalisés durant l’entraînement à une leçon scolaire simulée. Le plan de recherche appliqué ne permet pas d’exclure que l’intervention ne produise effectivement que des effets de transfert éloignés modestes. Il est, par contre, plus probable que la méthode de simulation d’une leçon scolaire par un film n’était pas compatible avec le contexte dans lequel les stratégies ont été enseignées. Dans l’entraînement, il s’agissait d’une situation d’apprentissage dans laquelle les stratégies ont été acquises en exécutant des tâches de compréhension. Par contre, dans le post-test différé, les élèves se voyaient confrontés à un film qui, dans notre culture, induit une sorte d’attention qui n’est pas dérangée par d’autres activités, telles que l’application de stratégies comme la prise de notes. Une leçon concernant un texte à comprendre donné par l’enseignant aurait été plus similaire à la situation d’entraînement, mais elle aurait introduit des différences, probablement significatives, entre le style d’enseignement des différents enseignants. La seule solution, mais coûteuse, aurait été l’application de la même leçon dans toutes les classes par le même enseignant.

Les tailles des effets significatifs sont modérées, ce qui peut paraître limiter le succès de l’entraînement. Nous expliquons ceci par le fait que ce ne sont pas des chercheurs, mais les enseignants des classes concernées qui ont administré l’entraînement (Dignath et Büttner, 2008), suite à une formation relativement brève. De plus, l’entraînement a été réalisé collectivement, ce qui modère également ses effets, car la prise en compte des besoins individuels est limitée. Ainsi, nous considérons que les effets ne sont pas négligeables. À ce sujet, l’analyse des différences interindividuelles confirme que certains élèves ont plus fortement profité de l’entraînement que d’autres. Nous avons également observé un lien entre progression dans les stratégies et dans les performances, ce qui soutient la validité de notre démarche. En d’autres termes, ceci suggère que travailler à l’amélioration des stratégies des élèves leur permet d’atteindre des performances supérieures. Les enseignants ont également estimé que les élèves ayant le plus progressé dans leurs performances en compréhension de texte ont le plus progressé dans leurs stratégies.

Dans la tâche de transfert, qui consistait en une leçon simulée sur DVD, le GE2 a montré une diminution au post-test différé. Si ceci semble à première vue curieux, une explication plausible est un effet de lassitude. En effet, selon nos analyses, les élèves de ce groupe (dans les quatre classes) n’ont pas profité des annotations qu’ils avaient réalisées durant le visionnement du film pour répondre au test à choix multiples. Ceci alors qu’ils avaient pris des annotations de qualité comparable aux deux autres groupes. D’une manière générale, cette lassitude interroge les moyens à mettre en oeuvre pour que les élèves des trois groupes s’investissent dans les tests et que, ainsi, les résultats ne soient pas biaisés par le désengagement. Ceci est en particulier important pour les GE2 et GC.

4.2 Limites et perspectives

Aux niveaux conceptuels et méthodologiques, plusieurs limites et améliorations potentielles sont à souligner. Premièrement, l’entraînement n’a considéré que de manière très limitée les problèmes de motivation et de régulation de la motivation. Or, ces aspects ont une influence avérée sur l’application de stratégies d’apprentissage, notamment dans le cadre de la compréhension de texte, et le maintien des stratégies (Büchel, Berger et Kipfer, 2011; Dignath et Büttner, 2008; Tonks et Taboada, 2011). Il serait pertinent d’intégrer, tant dans la formation des enseignants que dans les guides de médiation, des méthodes pour favoriser le sentiment d’efficacité personnelle et les attributions causales des réussites et échecs aux stratégies plutôt qu’à l’intelligence ou au hasard. Cette intégration a en effet le potentiel d’augmenter les effets de l’entraînement ainsi que leur maintien (Borkowski, Weyhing et Carr, 1988; Schunk et Ertmer, 2000).

Dans le cadre de la présente étude, les stratégies ont été analysées par plusieurs méthodes: de manière autorapportées grâce à des échelles de Likert, par des questions ouvertes ainsi que par le codage des notes prises durant la lecture du texte (représentant la façon dont le texte a été traité) ou des annotations durant la leçon sur DVD. D’autres méthodes pour la mesure en situation collective devraient être imaginées pour améliorer la validité de nos mesures. Bien qu’avec des adolescents et des adultes ce soit une méthode fructueuse (Büchel, 1988), mesurer l’utilisation de stratégies par la pensée à voix haute serait très difficilement réalisable avec le grand nombre d’élèves impliqués dans la recherche. Une piste à explorer est celle que développe Winne: l’analyse des traces laissées par les élèves comme indicateurs de leur fonctionnement stratégique (Winne, 1982; Winne, Zhou et Egan, 2011). Par exemple, l’on pourrait demander aux élèves d’utiliser des surligneurs de différentes couleurs afin de différencier des éléments d’un texte ou de mettre par écrit leur raisonnement par un autre moyen. L’analyse des notes que nous avons réalisée dans la présente étude constitue une étude des traces. Elle a l’avantage d’être réalisée de manière non intrusive, c’est-à-dire qu’elle ne modifie pas le fonctionnement cognitif de l’élève au contraire de la pensée à voix haute qui pourrait affecter les processus de pensée chez certains élèves (Winne et al., 2011). De plus, en complément de la mesure des stratégies et des performances, il serait pertinent de mesurer l’évolution des métaconnaissances des élèves. En effet, l’entraînement visait un développement des métaconnaissances notamment sur les stratégies. Le test développé par Artelt, Beinicke, Schlagmüller et Schneider (2009) permettrait d’analyser dans quelle mesure les élèves ont pris conscience de l’utilité ou de l’inutilité de certaines stratégies pour la compréhension de texte. Il constituerait un ajout bénéfique dans ce type d’études.