Élaboration de l’Échelle du sentiment d’efficacité personnelle des enseignants en gestion de classe (ÉSEPGC)

Gaudreau, Nancy; Frenette, Éric; Thibodeau, Stéphane

doi:https://doi.org/10.7202/1036762ar

Introduction

Au cours des trente dernières années, plusieurs chercheurs se sont intéressés à l’étude des pratiques de gestion de classe des enseignants et à leur sentiment d’efficacité personnelle (SEP) (Baker, 2005 ; Rimm-Kaufman & Sawyer, 2004). Malgré l’importance du SEP des enseignants en gestion de classe et son influence sur l’apprentissage, il ne semble pas exister d’échelle permettant de le mesurer de façon contextualisée et spécifique comme le préconise Bandura (2006). Le but de cette recherche consiste à élaborer une échelle portant sur le SEP des enseignants en gestion de classe qui pourra être utilisée en concomitance avec d’autres questionnaires. Pour ce faire, les concepts de SEP et de gestion de classe seront d’abord explicités. Ensuite, une synthèse des questionnaires relatifs au SEP des enseignants en gestion de classe sera présentée, ainsi que leur démarche d’élaboration, leurs spécificités et leurs qualités psychométriques. Enfin, la démarche d’élaboration de l’Échelle du sentiment d’efficacité personnelle des enseignants en gestion de classe (ÉSEPGC) sera détaillée.

Problématique

Des chercheurs intéressés par l’étude du SEP des enseignants ont démontré son influence majeure dans le vécu scolaire des enseignants (Bandura, 2007). Des études ont d’ailleurs mis en évidence la présence de liens entre le SEP des enseignants, leurs pratiques pédagogiques (Gordon, 2001 ; Melby, 1995) et la réussite des élèves (Armor et al., 1976 ; Ashton & Webb, 1986 ; Ross, 1998). Les enseignants qui présentent un fort SEP démontrent une plus grande capacité à planifier et à organiser les activités d’enseignement et d’apprentissage, et ils sont plus engagés, plus ouverts aux nouvelles idées et aux approches pédagogiques novatrices pouvant répondre aux besoins de leurs élèves (Melby, 1995 ; Simbula, Guglielmi, & Schaufeli, 2011 ; Tschannen-Moran & Hoy, 2001). Par exemple, plus l’enseignant présente un fort SEP à gérer les comportements difficiles des élèves, moins il vit de stress, plus ses pratiques de gestion de classe sont éducatives et adaptées aux besoins des élèves, et plus ces derniers adoptent une conduite favorable à l’apprentissage (Gordon, 2001 ; Hamre, Pianta, Downer, & Mashburn, 2008 ; Hastings, 2005). À l’inverse, les enseignants qui présentent un faible SEP éprouvent plus de difficultés dans la gestion des élèves présentant des comportements difficiles (Baker, 2005 ; Gordon, 2001), affichent des attitudes plus négatives, et vivent davantage de stress et d’épuisement professionnel (Betoret, 2009 ; Caprara, Barbaranelli, Steca, & Malone, 2006 ; Chan, 2007 ; Klassen & Chiu, 2010 ; Skaalvik & Skaalvik, 2010).

Il est reconnu que la capacité de l’enseignant à gérer efficacement sa classe a des répercussions importantes sur le vécu scolaire et sur la réussite des élèves. À cet effet, la méta-analyse réalisée par Wang, Haertel et Walberg (1993) révèle que, parmi des facteurs comme le soutien parental, la motivation et le milieu socioéconomique, la gestion de classe est celui qui influence le plus l’apprentissage. Une gestion de classe efficace permet de rentabiliser le temps d’enseignement-apprentissage ainsi que de maintenir l’intérêt et l’engagement des élèves (Edmunds & Edmunds, 2010). Elle prévient aussi les écarts de conduite et la présence de comportements perturbateurs (Evertson & Weinstein, 2006 ; Kauffman, Mostert, Trent, & Pullen, 2006 ; Myers & Pianta, 2008). Néanmoins, des études démontrent que la gestion de classe s’avère très difficile pour une majorité d’enseignants (Brouwers & Tomic, 2000 ; Martin, Nault, & Loof, 1994), surtout lorsque ceux-ci doivent intervenir auprès d’élèves présentant des difficultés comportementales (Avramidis & Kalyva, 2007 ; Goodman & Burton, 2010 ; Helfin & Bullock, 1999 ; Jeffrey & Sun, 2006).

Plusieurs échelles mesurant le SEP des enseignants ont été développées au cours des trente dernières années (Avanzi et al., 2013 ; Dellinger, Bobbett, Olivier, & Ellett, 2008). Toutefois, il semble qu’aucune d’entre elles ne permette de le mesurer en tenant compte des divers aspects de la gestion de classe (O’Neill & Stephenson, 2011). De fait, le caractère multidimensionnel de la tâche des enseignants complexifie l’évaluation du SEP de ces derniers. À cet égard, la recherche menée par Skaalvik et Skaalvik (2007), à partir de leur échelle, a permis d’identifier six dimensions au SEP des enseignants : l’enseignement ; l’adaptation pédagogique aux besoins individuels des élèves ; la motivation scolaire ; la gestion de la discipline en classe ; la coopération avec les collègues et les parents ; ainsi que la capacité à faire face aux imprévus et aux défis liés à la profession. Comme plusieurs échelles relatives au SEP, cette dernière permet d’effectuer une évaluation globale de celui des enseignants sans toutefois permettre une évaluation spécifique, voire plus exhaustive de leur SEP à gérer la classe. À cet égard, Bandura (2006) insiste sur l’importance de formuler plusieurs énoncés faisant référence à des contextes variés d’intervention afin de mesurer de manière fiable le SEP des enseignants dans un champ précis d’activité. Par conséquent, l’élaboration d’une échelle du SEP des enseignants en gestion de classe exige la présence d’un nombre minimal d’énoncés pour chacune des dimensions liées à ce concept. Or, les instruments de mesure disponibles actuellement ne permettent pas de répondre à ce critère puisqu’ils ne portent que sur certains aspects de la gestion de classe. Afin de répondre à ce besoin, cet article a pour objectif de présenter l’élaboration d’une nouvelle échelle du SEP des enseignants spécifique à la gestion de classe et prenant appui sur les recommandations de Bandura (2006) et des étapes proposées par Dussault, Valois et Frenette (2007). En plus de mesurer de façon spécifique le SEP des enseignants en gestion de classe en prenant en compte toutes ses dimensions, celle-ci se veut courte afin de limiter le nombre de données manquantes et d’être utilisée avec d’autres échelles (Graham, 2009).

Cadre conceptuel

Le sentiment d’efficacité personnelle (SEP)

Selon l’approche sociocognitive de Bandura (2007), le fonctionnement humain est le produit d’une interaction dynamique et permanente entre les facteurs personnels, les comportements et les circonstances environnementales (modèle de la causalité triadique réciproque). D’après cette approche, les facteurs personnels (cognitions, émotions, états physiologiques), les comportements (expériences, modèles d’action, engagement, évitement) et l’environnement (contexte, contrainte, présence ou non de soutien, etc.) interagissent les uns avec les autres de manière simultanée et réciproque, influençant ainsi le fonctionnement de la personne (Carré, 2004). Situé au coeur de cette approche, le SEP réfère à la croyance de l’individu en sa capacité d’organiser et d’exécuter la ligne de conduite requise pour produire des résultats souhaités (Bandura, 2007). Il régule alors les choix, la motivation, l’effort et la persévérance de l’individu dans un contexte donné. Le SEP contribue fortement aux performances, quelles que soient les aptitudes réelles de la personne (Bandura, 1992). Il ne s’agit donc pas d’un trait ou d’une caractéristique personnelle stable, mais plutôt d’une croyance qui se développe en fonction des expériences vécues, des tâches et de leur contexte de réalisation (Bandura, 2007). En fait, le SEP résulte d’expériences d’apprentissage qui proviennent de quatre sources : 1) les expériences de maîtrise, 2) la persuasion verbale, 3) les expériences vicariantes, et 4) les états émotionnels et physiologiques dans un contexte donné (Bandura, 1986, 2007).

Habituellement, le SEP est étudié en fonction d’une tâche donnée (Choi, 2003 ; Luszczynska, Scholz, & Schwarzer, 2005). Dans le cas présent, il s’agit du SEP des enseignants relatif à la gestion de classe. Pour Brouwers et Tomic (2001), ce dernier réfère aux croyances des enseignants en leurs capacités à organiser et à exécuter les actions nécessaires au maintien d’un climat favorable aux apprentissages.

La gestion de classe

La gestion de classe consiste à organiser et à diriger les activités du groupe, ainsi qu’à réguler les interactions sociales qui s’y déroulent. Elle se définit comme étant « l’ensemble des pratiques éducatives auxquelles les enseignants ont recours afin d’établir, de maintenir et de restaurer des conditions propices au développement des compétences des élèves en classe » (Archambault & Chouinard, 2009, p. 15). Les chercheurs dans le domaine de la gestion de classe reconnaissent qu’elle implique l’établissement de dispositifs et la mise en oeuvre de différentes actions par l’enseignant. Selon Garrett (2014), le concept de gestion de classe demeure méconnu, et plusieurs praticiens et chercheurs en ont une représentation incomplète, voire biaisée. Par exemple, nombre d’entre eux considèrent la gestion de classe et la discipline comme des synonymes. Cet état de fait explique sans doute la surreprésentation des énoncés portant sur la gestion de la discipline en classe dans les échelles du SEP des enseignants comportant la dimension de gestion de classe. Pourtant, les spécialistes du domaine reconnaissent que la gestion de classe réfère à des actions très complexes et diversifiées. À cet égard, Garrett (2014) ainsi que O’Neill et Stephenson (2011) proposent cinq dimensions ou sphères d’intervention qui se distinguent par leur nature et leur visée : 1) gérer les ressources, 2) établir des attentes claires, 3) capter et maintenir l’attention et l’engagement des élèves sur l’objet d’apprentissage, 4) développer des relations sociales positives, et 5) gérer les comportements difficiles des élèves.

Gérer les ressources

La gestion des ressources réfère à la gestion du temps, de l’espace et du matériel. Elle constitue un élément très important de la gestion de classe puisqu’elle assure une utilisation optimale du temps d’apprentissage. Une mauvaise organisation sur les plans temporel, spatial et matériel cause habituellement beaucoup de perte de temps d’apprentissage en classe (Doyle, 2006 ; Evertson & Emmer, 2009 ; Henley, 2006 ; Kern & Clemens, 2007 ; Oliver & Reschly, 2007 ; Thompson, 2012).

Établir des attentes claires

Plusieurs chercheurs reconnaissent l’importance d’établir des attentes claires en classe (Archambault & Chouinard, 2009 ; Doyle, 2006 ; Edmunds & Edmunds, 2010 ; Evertson & Emmer, 2009 ; Evertson & Weinstein, 2006 ; Jones & Jones, 1990 ; Kauffman et al., 2006 ; Kern & Clemens, 2007 ; Thompson, 2012). Les règles permettent d’assurer le bon fonctionnement de la classe et clarifient les attentes de l’enseignant à l’égard des comportements sociaux à adopter. L’enseignement de routines et de procédures permet de faciliter les périodes de transition et de développer l’autonomie des élèves. Pour leur part, les consignes de l’enseignant dirigent la conduite des élèves sur les plans scolaire et social. Selon Walker et Walker (1994), celles-ci doivent être de type alpha, c’est-à-dire qu’elles doivent être courtes et claires, et référer à des comportements attendus observables. L’établissement d’attentes claires se réalise conjointement avec la gestion des ressources, qui permet de soutenir sa mise en oeuvre.

Capter et maintenir l’attention et l’engagement des élèves sur l’objet d’apprentissage

La gestion d’une classe exige de l’enseignant la capacité à capter l’attention des élèves et à maintenir celle-ci sur la tâche. Elle réfère aussi à la qualité de l’enseignement (planification, organisation et interventions pédagogiques). Pour Archambault et Chouinard (2009), elle englobe les moyens qui permettent aux élèves de comprendre les objectifs, la démarche d’enseignement et le processus d’apprentissage. Ainsi, la gestion de classe vise aussi à bien orchestrer les activités d’enseignement-apprentissage qui y prennent vie. Elle implique que l’enseignant doive capter l’attention des élèves ainsi que tenir compte de leurs intérêts, de leur rythme d’apprentissage et de leurs capacités. Un grand nombre de chercheurs reconnaît qu’il s’agit là d’une composante majeure de la gestion de classe (Adamson, 2010 ; Doyle, 2006 ; Edmunds & Edmunds, 2010 ; Evertson & Emmer, 2009 ; Evertson & Weinstein, 2006 ; Jones & Jones, 1990 ; Oliver & Reschly, 2007 ; Webster-Stratton, Reid, & Stoolmiller, 2008).

Développer des relations sociales positives

Le développement de relations sociales positives réfère à la qualité des relations entre les individus (enseignant et élèves). Elles prennent la forme d’interactions verbales et non verbales, et peuvent se traduire par un contexte coopératif, d’entraide, d’approbation des comportements attendus ou encore d’enseignement. La relation maître-élève influence de manière significative l’apprentissage (Doumen et al., 2008 ; Wang, Haertel, & Walberg, 1993). La qualité de celle-ci influence aussi le climat de classe et la conduite des élèves (Hamre & Pianta, 2005). Elle joue également un rôle important dans la trajectoire du développement comportemental des jeunes élèves (Berry & O’Connor, 2010 ; Doumen et al., 2008 ; Pianta, 1999 ; Potvin, 2009). De plus, la présence d’interactions sociales positives entre les élèves favoriserait le développement d’une image de soi positive et l’émergence d’un sentiment d’appartenance à la classe (Archambault & Chouinard, 2009 ; Doyle, 2006 ; Edmunds & Edmunds, 2010 ; Evertson & Weinstein, 2006 ; Jones & Jones, 1990 ; Thompson, 2012).

Gérer les comportements difficiles

Pour certains auteurs, la gestion des comportements difficiles des élèves occupe une place prédominante dans la gestion de classe (Doyle, 2006 ; Edmunds & Edmunds, 2010 ; Evertson & Emmer, 2009 ; Jones & Jones, 1990 ; Kauffman et al., 2006 ; Thompson, 2012). L’indiscipline en classe peut se traduire de différentes manières : refus de faire le travail demandé, retard, non-respect des droits de parole, comportements perturbateurs (bruits, déplacements inappropriés, manque de respect, etc.) et conduites agressives. Les enseignants habiles à gérer cette composante de la gestion de classe sont en mesure d’intervenir efficacement dans des contextes d’intervention très variés. Cela exige qu’ils soient en mesure d’observer les comportements des élèves, de poser une hypothèse fonctionnelle permettant d’expliquer leur présence et d’agir de manière à répondre aux besoins éducationnels des élèves. Différentes stratégies d’intervention doivent donc être maîtrisées et leur utilisation doit se faire de manière différenciée. Pour Emmer et Hickman (1991), la gestion des comportements difficiles exige des connaissances et des habiletés particulières chez l’enseignant. Cela explique pourquoi certains enseignants s’acquittent efficacement des autres dimensions de la gestion de classe, mais éprouvent des difficultés à gérer les comportements difficiles des élèves (Jeffrey & Sun, 2006). Plusieurs chercheurs estiment d’ailleurs que les comportements perturbateurs représentent ce qui est le plus difficile à gérer au sein de la classe (Avramidis, Bayliss, & Burden, 2000 ; Dunlap & Fox, 2011 ; Helfin & Bullock, 1999 ; Melby, 1995). De plus, la variété des contextes d’intervention auxquels elle réfère exige qu’une attention particulière lui soit accordée dans l’élaboration d’une échelle du SEP en gestion de classe. Cela implique qu’un plus grand nombre d’énoncés soit nécessaire afin de représenter le plus fidèlement possible les multiples situations dans lesquelles l’enseignant est appelé à intervenir.

Une synthèse des questionnaires relatifs au SEP des enseignants

La recension des écrits réalisée par O’Neill et Stephenson (2011) démontre que plusieurs échelles relatives au SEP des enseignants s’intéressent à la gestion de classe, sans toutefois en considérer les différentes dimensions. La plupart de celles-ci utilisent des énoncés génériques (plutôt que spécifiques) pour mesurer le SEP des enseignants (p. ex., « Je suis capable de bien gérer ma classe »). Elles sont souvent constituées de plusieurs sous-échelles qui contiennent un seul énoncé ou peu d’énoncés portant sur la gestion de classe. Par conséquent, le nombre d’énoncés abordant cette dimension se retrouve souvent très limité et ne permet pas de mesurer le SEP de l’enseignant dans des contextes variés et précis de gestion de classe, comme le recommande Bandura (2003, 2006).

De fait, la majorité des échelles relatives au SEP des enseignants comporte très peu d’énoncés (1 à 5) sur la gestion de classe (p. ex., Betoret, 2009 ; Çakir & Alici, 2009 ; Dussault, Villeneuve, & Deaudelin, 2001 ; Friedman, 2003 ; Friedman & Kass, 2002 ; Gibson & Dembo, 1984 ; Meijer & Foster, 1988 ; Paneque & Barbetta, 2006 ; Rich, Lev, & Fischer, 1996 ; Rimm-Kaufman & Sawyer, 2004 ; Schwarzer & Hallum, 2008 ; Siwatu, 2007 ; Skaalvik & Skaalvik, 2007 ; Woolfson & Brady, 2009 ; Yoon, 2004). D’autres échelles présentent un plus grand nombre d’énoncés sur le sujet (de 6 à 14), mais n’abordent toutefois que quelques-unes des cinq dimensions de la gestion de classe recensées par O’Neill et Stephenson (2011). En effet, certaines ne traitent pas de la gestion des ressources en classe (p. ex., Brouwers & Tomic, 2001 ; Brownell & Pajares, 1999 ; Emmer & Hickman, 1991 ; Main & Hammond, 2008 ; Milson & Mehlig, 2002 ; Soodak & Podell, 1996 ; Tschannen-Moran & Hoy, 2001) ; de l’établissement d’attentes claires (p. ex., Erdem & Demirel, 2007 ; Milson & Mehlig, 2002 ; Soodak & Podell, 1996) ; du maintien de l’attention et de l’engagement des élèves sur la tâche (p. ex., Milson & Mehlig, 2002 ; Soodak & Podell, 1996 ; Tschannen-Moran & Hoy, 2001) ; du développement de relations positives (p. ex., Brouwers & Tomic, 2001 ; Emmer & Hickman, 1991 ; Erdem & Demirel, 2007 ; Main & Hammond, 2008 ; Tschannen-Moran & Hoy, 2001) ; et de la gestion des comportements difficiles des élèves (p. ex., Milson & Mehlig, 2002). Seule l’échelle développée par Dellinger, Bobbett, Olivier et Ellett (2008) comporte des énoncés qui abordent l’ensemble des composantes de la gestion de classe. Cependant, plusieurs de ses énoncés réfèrent à des situations de gestion de classe plutôt génériques (et non spécifiques), contrairement aux recommandations formulées par Bandura (2006).

En somme, il ne semble pas exister d’échelle qui permette de mesurer de manière spécifique le SEP des enseignants en gestion de la classe. De même, celles disponibles en anglais présentent des lacunes non négligeables. En effet, la majorité des échelles du SEP recensées ont été évaluées auprès d’un seul échantillon de participants (nombre variant de 39 à 1444 participants), sans présenter les étapes menant à l’élaboration de l’échelle (p. ex., Main & Hammond, 2008 ; Woolfson & Brady, 2009). D’autres ont toutefois recours à une évaluation préliminaire de l’échelle (p. ex., Brownell & Pajares, 1999 ; Gibson & Dembo, 1984 ; Meijer & Foster, 1988). La plupart des recherches présentent le niveau de consistance interne (coefficient alpha de Cronbach) pour l’échelle, mais plus rarement les analyses factorielles appuyant la structure théorique. La nécessité de développer une échelle en français qui permette de mesurer le SEP des enseignants en gestion de classe en tenant compte des cinq dimensions recensées par O’Neill et Stephenson (2011) et d’une démarche complète d’élaboration s’avère donc pertinente. De plus, l’échelle proposée doit présenter un nombre restreint d’énoncés afin de limiter le nombre de données manquantes et de faciliter son utilisation conjointe avec d’autres questionnaires (Graham, 2009).

Méthodologie

L’élaboration de l’Échelle du sentiment d’efficacité personnelle des enseignants en gestion de classe (ÉSEPGC) a été réalisée à partir des sept étapes proposées par Dussault et al. (2007), inspirées des lignes directrices suggérées par DeVellis (2003) : 1) déterminer ce que l’échelle doit mesurer, 2) générer une banque d’énoncés, 3) déterminer le format de l’échelle, 4) procéder à l’évaluation de la banque initiale d’énoncés par des experts, 5) effectuer une évaluation préliminaire de l’échelle (analyse d’items et structure factorielle) auprès d’un échantillon qui s’apparente à la population cible (prétest), 6) procéder à une analyse d’items auprès de la population cible, et 7) vérifier la structure factorielle auprès de la population cible. À l’étape 5, l’utilisation du modèle de Rasch permettra de vérifier l’apport de chacun des énoncés à sa dimension et d’optimiser leur nombre en proposant une version courte.

L’échantillon pour le prétest (étape 5)

Pour le prétest, un groupe de 97 étudiants (94 femmes et 3 hommes) au baccalauréat en éducation préscolaire et en enseignement primaire qui terminaient leur 3^e année d’études a répondu au questionnaire. Il s’agit d’un échantillon qui s’apparente, comme le suggère DeVellis (2012), à la population cible. En effet, une parenté avec la population cible s’explique par le choix d’une carrière en enseignement.

L’échantillon tiré de la population (étapes 6 et 7)

Deux échantillons tirés de la population cible ont été fusionnés afin de valider les résultats obtenus au prétest : 1) 85 enseignants du préscolaire (n = 42) et du primaire (n = 43) comprenant 83 femmes et 2 hommes (ce qui est représentatif de la population enseignante à ces ordres d’enseignement quant au genre) et 2) 58 enseignants en formation professionnelle comprenant 29 femmes et 29 hommes.

Analyse (étapes 5, 6 et 7)

Pour les étapes 5, 6 et 7, le niveau de consistance interne (coefficient alpha de Cronbach) pour chacune des dimensions est calculé et interprété selon les critères proposés par DeVellis (2012). L’indice de discrimination (obtenu à partir de la corrélation item-total) de chaque énoncé en lien avec sa dimension est considéré comme problématique lorsque sa valeur est inférieure à 0,30 (Crocker & Algina, 2006).

Le modèle de Rasch (étape 5)

Les données au prétest ont été analysées par dimension à l’aide du rating scale model (Andersen, 1977 ; Andrich, 1978 ; Wright & Masters, 1982) à partir de la version 3.81 du logiciel WINSTEPS (Linacre & Wright, 1999). Ce logiciel est utilisé pour estimer les statistiques d’ajustement et le niveau d’endossement des énoncés (logit) aux prescriptions du modèle. Deux statistiques d’ajustement sont disponibles : infit et outfit (Linacre, 1994 ; Wright & Masters, 1982). La statistique infit est calculée en multipliant le carré de chaque résidu standardisé par la variance du score attendu, puis en divisant le total par la somme des variances de chaque score attendu. La statistique outfit est calculée par la moyenne des carrés des résidus standardisés (Penta, Arnould, & Decruynaere, 2005). Les statistiques infit et outfit présentant des valeurs près de 1 sont considérées comme satisfaisantes, tandis que les valeurs entre 0,5 et 1,5 sont considérées comme productives pour la mesure (Linacre, 2002).

Cette approche permettra de vérifier l’ajustement des énoncés au modèle de Rasch pour chacune des dimensions et d’optimiser les dimensions en réduisant le nombre d’énoncés. Elle a été utilisée à plusieurs reprises pour réduire des échelles (p. ex., Dussault, Fernet, & Frenette, 2013 ; Las Hayas, Quintana, Padierna, Bilbao, & Muñoz, 2010 ; Simos, Sideridis, Protopapas, & Mouzaki, 2011 ; Weller et al., 2012). Cole, Rabin, Smith et Kaufman (2004) proposent deux critères pour réduire le nombre d’énoncés : 1) un mauvais ajustement de l’énoncé au modèle de Rasch et 2) une redondance quant au niveau d’endossement (logit) entre des énoncés. Les énoncés ne respectant pas les critères d’ajustement au modèle sont retirés des analyses subséquentes. Par la suite, les énoncés redondants sont identifiés lorsque deux ou plusieurs présentent un niveau similaire d’endossement. Lorsque des énoncés présentaient le même niveau d’endossement, deux experts ont procédé à une analyse de contenu afin de déterminer celui à retenir dans la version courte. Les experts devaient choisir celui qui était le plus pertinent pour le concept mesuré.

La structure factorielle

Des analyses factorielles confirmatoires ont été effectuées à l’aide de la version 6.2 du progiciel EQS (Bentler, 2006). Plusieurs indices ont été utilisés pour estimer l’adéquation des modèles proposés, c’est-à-dire le degré de correspondance entre la matrice des estimés théoriques et la matrice des estimés empiriques : le chi-carré de Satorra-Bentler (pour variable catégorielle), le nombre de degrés de liberté, le rapport du chi-carré de Satorra-Bentler sur le nombre de degrés de liberté correspondant (SB𝜒2/dl), l’indice d’adéquation comparatif (comparative fit index, CFI), l’indice d’adéquation non normé (non-normed fit index, NNFI) proposé par Tucker et Lewis (1973) et l’erreur quadratique moyenne de l’estimation (root mean square error of approximation, RMSEA) de Steiger (1990).

Étant donné les problèmes liés au SB𝜒², le rapport du chi-carré sur le nombre de degrés de liberté correspondant (SB𝜒²/dl) a été utilisé (Hayduk, 1987). Une valeur 𝜒²/dl plus petite que 5 signifie habituellement que les données observées s’ajustent bien au modèle théorique proposé, tandis qu’une valeur plus petite que 2 signifie un ajustement appréciable (Jöreskog & Sörbom, 1993). Deux indices d’ajustement relatif ont également été utilisés : le CFI et le NNFI. Ces indices varient entre 0 et 1, et proviennent de la comparaison entre le modèle proposé et le modèle nul (dans lequel aucun lien n’est postulé entre les variables). Le modèle présentant une valeur du CFI et du NNFI supérieure à 0,90 est généralement jugé comme adéquat (Schumacker & Lomax, 1996), tandis qu’une valeur supérieure à 0,95 est considérée comme appréciable. Nous avons également eu recours à l’erreur quadratique moyenne de l’estimation. Selon Browne et Cudeck (1993) ainsi que Marsh, Ellis, Parada, Richards et Heubeck (2005), une valeur inférieure à 0,08 est tout à fait acceptable, tandis qu’une valeur de 0,05 est considérée comme appréciable. La méthode d’estimation du maximum de vraisemblance, l’option variable catégorielle et l’option Robust ont été utilisées aux fins d’analyse. L’option Robust a été retenue, car certains indicateurs ne respectaient pas l’hypothèse de normalité des données (Yuan & Bentler, 2000).

Résultats de l’élaboration de l’échelle

À partir de la procédure proposée par Dussault et al. (2007), voici les résultats obtenus au cours de chacune des étapes d’élaboration de l’échelle.

Étape 1

L’ÉSEPGC vise à mesurer le SEP des enseignants en tenant compte des cinq dimensions de la gestion de classe recensées par Garrett (2014) ainsi que O’Neill et Stephenson (2011).

Étape 2

Afin de générer la banque d’énoncés, certaines recommandations ont été suivies. Selon Bandura (2012), les énoncés doivent permettre de mesurer des capacités perçues, et non des intentions. Il faut ainsi opter pour des formulations à l’indicatif présent en employant le verbe pouvoir (« je peux ») et faire (« je fais ») ou des expressions similaires comme « je suis capable » conjuguées à la 1re personne du singulier. Bandura (2012) ajoute que la force d’une échelle relative au SEP réside dans sa capacité à mesurer un large éventail de performances dans un domaine d’activité. La banque d’énoncés a été développée eu égard à la recension des écrits portant sur l’évaluation du SEP des enseignants en gestion de classe élaborée par O’Neill et Stephenson (2011). Après avoir recensé les échelles relatives au SEP des enseignants publiées en anglais entre 1984 et 2009, ces auteures ont analysé les énoncés de 25 échelles comportant au moins un énoncé sur la gestion de classe. La recherche dans les bases de données a permis de confirmer, à la connaissance des auteures, qu’aucune nouvelle échelle dans ce domaine ne semble avoir été publiée entre 2009 et 2013.

Pour compléter le classement des énoncés en fonction des cinq dimensions de la gestion de classe effectué par O’Neill et Stephenson (2011), d’autres énoncés issus d’échelles traduites et validées en français par Dussault et ses collaborateurs (2001) et par Gaudreau (2011) ont été ajoutés. La banque constituée comprenait alors 14 énoncés en français et 50 énoncés en anglais. Puisque les dimensions de gestion de classe portant sur la gestion des ressources et sur l’établissement d’attentes claires comprenaient peu d’énoncés ou que ceux-ci étaient redondants, 8 nouveaux énoncés en français ont été créés. Ensuite, les 50 énoncés en anglais ont été adaptés en français selon la méthode de la traduction inversée. La banque était alors constituée de 72 énoncés en français : D1) gérer les ressources (n = 10), D2) établir des attentes claires (n = 10), D3) capter et maintenir l’attention et l’engagement des élèves sur la tâche (n = 10), D4) développer des relations positives (n = 20), et D5) gérer les comportements difficiles (n = 22).

Étape 3

Le format retenu pour les choix de réponse est celui d’une échelle de type Likert à six niveaux, allant de « 1 = tout à fait en désaccord » à « 6 = tout à fait en accord ». Il s’agit du type d’échelle le plus fréquemment utilisé pour mesurer des attitudes, des croyances ou des opinions (DeVellis, 2012). De plus, ce format d’échelle exige une formulation déclarative des énoncés, telle qu’elle est recommandée par Bandura (2006) pour l’élaboration d’une échelle relative au SEP.

Étape 4

Dans un premier temps, l’évaluation des énoncés de la banque initiale a été réalisée à deux reprises par un groupe de quatre experts. Dans un deuxième temps, les énoncés ont été évalués par six enseignants. Ceux-ci devaient évaluer la validité de contenu de chacun des 72 énoncés. Concrètement, ils se sont prononcés sur la clarté et sur la pertinence des énoncés par rapport à la dimension que ces derniers devaient mesurer. Ils pouvaient également suggérer des reformulations susceptibles de clarifier les énoncés ou encore en proposer de nouveaux qui permettraient d’étudier le phénomène sous des angles qui n’ont pas été traités (DeVellis, 2012). Le comité d’experts a été composé de deux professeurs, d’une chargée de cours et d’une conseillère pédagogique. Ces personnes ont été choisies parce qu’elles possèdent une expertise reconnue dans le domaine de la gestion de classe. À la suite de cette évaluation, 31 énoncés ont été jugés très clairs, tandis que 32 énoncés ont été reformulés et 7 ont été retirés parce que les experts ne s’entendaient pas sur les dimensions de gestion de classe qu’ils permettaient de mesurer. Après avoir effectué ces modifications, le comité d’experts a été consulté une seconde fois pour évaluer les 65 énoncés retenus selon les mêmes critères. À cette étape, 9 autres énoncés ont été retirés. Finalement, un groupe composé de six enseignants a également été consulté afin d’évaluer la clarté et la pertinence des énoncés. À la suite de cette consultation, les concepteurs de l’échelle ont retiré 15 énoncés jugés moins clairs ou redondants, ce qui a alors permis d’obtenir la version préliminaire de l’ÉSEPGC, composée de 41 énoncés : D1 (n = 7), D2 (n = 7), D3 (n = 7), D4 (n = 7) et D5 (n = 13).

Étape 5

Le niveau de consistance interne (coefficient alpha de Cronbach) pour les cinq dimensions est considéré comme satisfaisant selon les critères proposés par DeVellis (2012) (voir Tableau 3). Une seule corrélation item-total est considérée comme problématique (< 0,30 ; Crocker & Algina, 2006).

Le niveau de fiabilité et l’indice de séparation au rating scale model obtenus à partir du logiciel WINSTEPS sont présentés pour les étudiants et les énoncés au tableau 1. Le niveau de fiabilité selon le modèle de Rasch (qui peut être interprété de la même façon que le coefficient alpha de Cronbach ; Hsueh, Wang, Sheu, & Hsieh, 2014) pour les étudiants est considéré comme satisfaisant, sauf pour D1, où il est considéré comme acceptable. Le niveau de fiabilité selon le modèle de Rasch pour les énoncés est considéré comme satisfaisant pour toutes les dimensions. Une valeur élevée des indices de séparation indique une bonne différenciation sur le continuum (item ou personne). La même interprétation que pour les indices de fiabilité peut donc être formulée. Ces résultats indiquent qu’il est possible de procéder à la sélection d’énoncés sur la base des critères proposés.

Tableau 1

**Niveau de fiabilité et indices de séparation**

Le tableau 2 présente le nombre d’énoncés par dimension, plus précisément le nombre d’énoncés dans la version préliminaire (avant les analyses avec WINSTEPS), le nombre d’énoncés présentant un mauvais ajustement, le nombre d’énoncés retirés pour redondance du niveau d’endossement et le nombre d’énoncés total dans la version finale de l’échelle (voir Annexe).

Après le retrait des énoncés, le niveau de consistance interne (coefficient alpha de Cronbach) pour chacune des dimensions de cette version courte (28 énoncés) de l’échelle est considéré comme satisfaisant selon les critères proposés par DeVellis (2012) (voir Tableau 3). Le niveau de consistance interne par dimension est du même ordre de grandeur que pour la version préliminaire. Aucun énoncé n’est considéré comme problématique selon la corrélation item-total (< 0,30 ; Crocker & Algina, 2006).

Malgré le nombre limité de répondants, le modèle comprenant cinq dimensions corrélées présente un ajustement appréciable : SB𝜒² = 350,43 ; dl = 342 ; 𝜒²/dl = 1,02 ; CFI = 0,99 ; NNFI = 0,99 ; et RMSEA = 0,017. Tous les liens dans le modèle sont significatifs. Les saturations sont présentées au tableau 4. Les corrélations entre les dimensions varient entre 0,36 et 0,70.

Étape 6

Le niveau de consistance interne (coefficient alpha de Cronbach) pour chacune des dimensions de cette version de l’échelle est considéré comme satisfaisant selon les critères proposés par DeVellis (2012) (voir Tableau 3). Le niveau de consistance interne par dimension est du même ordre de grandeur que pour la version préliminaire. Aucun énoncé n’est considéré comme problématique selon la corrélation item-total (< 0,30 ; Crocker & Algina, 2006).

Tableau 3

**Consistance interne à chacune des étapes de validation de l’échelle (alpha de Cronbach)**

Étape 7

Malgré le nombre limité de répondants, le modèle comprenant cinq dimensions corrélées présente un ajustement appréciable : SB𝜒²= 457,71 ; dl = 342 ; 𝜒²/dl = 1,34 ; CFi = 0,99 ; NNFi = 0,99 ; et RMSEA = 0,044. tous les liens dans le modèle sont significatifs. les saturations sont présentées au tableau 4. Les corrélations entre les dimensions varient entre 0,38 et 0,86. Bien qu'une corrélation de 0,86 puisse sembler élevée, l'erreur standard associée est faible indiquant que cette corrélation est différente de 1, ce qui justifie sa présence dans le modèle.

Les moyennes obtenues par dimension révèlent que le SEP des enseignants à gérer les ressources (D1) et à établir des attentes claires (D2) est plus élevé que pour les autres dimensions. En cohérence avec la littérature, le SEP des enseignants à gérer les comportements difficiles des élèves (D5) s’avère plus faible. le tableau 5 présente les moyennes et écartstypes par dimension pour le prétest et pour la collecte de données auprès d’un échantillon tiré de la population.

Tableau 5

**Moyennes et écarts-types par dimension**

Discussion

Cette étude visait à élaborer une nouvelle échelle permettant de mesurer le SEP des enseignants en gestion de la classe. En cohérence avec les travaux de Garrett (2014) ainsi que ceux de O’Neill et Stephenson (2011), l’ÉSEPGC permet de mesurer les cinq dimensions de la gestion de classe et comble ainsi l’absence d’échelle en français qui permette de mesurer le SEP des enseignants dans ce contexte. L’élaboration de cette échelle a été réalisée en respectant les critères proposés par Bandura (2006) et les étapes suggérées par Dussault et al. (2007). Contrairement aux échelles existantes mesurant seulement certains aspects de la gestion de classe, l’ÉSEPGC permet de mesurer l’étendue de la capacité perçue des enseignants à gérer la classe dans des contextes variés. Elle a été élaborée à partir d’une analyse conceptuelle approfondie afin que chaque dimension de la gestion de classe soit définie, clarifiée et mesurée. Pour ce faire, la présence d’un plus grand nombre d’énoncés portant sur la gestion des comportements difficiles des élèves (D5) s’avérait nécessaire afin d’assurer une mesure plus fiable, précise et contextualisée du SEP des enseignants à gérer une diversité de problèmes de comportement en classe. L’élaboration de l’ÉSEPGC permet ainsi de répondre au besoin des chercheurs désireux d’étudier le SEP des enseignants en gestion de classe en conformité avec sa représentation conceptuelle.

L’approche de Dussault et ses collaborateurs (2007) pour élaborer l’échelle est inspirée des lignes directrices proposées par DeVellis (2003). Cette approche permet, lors de l’élaboration du questionnaire, d’obtenir divers éléments de preuve de validité. Différentes analyses répertoriées par Downing (2003) pour évaluer les cinq éléments de preuve du cadre de validité de Messick (1989) ont été utilisées. La présente étude a permis d’obtenir des preuves de la validité de contenu (experts et revue de littérature) et de la validité apparente (enseignants). Du côté de la structure interne, divers éléments de preuve de validité sont présentés : les corrélations item-total, le niveau de consistance interne, l’utilisation d’un modèle de mesure (Rasch) et la dimensionnalité (structure factorielle).

Les différentes analyses effectuées à l’aide du modèle de Rasch ont permis de réduire le nombre d’énoncés dans l’échelle, sans altérer le niveau de consistance interne (coefficient alpha de Cronbach). Les analyses factorielles au prétest et avec l’échantillon tiré de la population (enseignants au préscolaire-primaire et en formation professionnelle) ont permis de confirmer la structure à cinq dimensions corrélées. Considérant que les chercheurs utilisent fréquemment plusieurs échelles lors d’une recherche, il apparaissait important de proposer une échelle du SEP en gestion de classe constituée d’un nombre restreint d’énoncés. L’élaboration d’une échelle d’efficacité personnelle à 28 énoncés qui conserve le même niveau de consistance interne que sa version initiale à 41 énoncés s’avère donc une force importante.

Cette étude présente certaines limites. D’abord, il y a lieu de mentionner la taille des échantillons utilisés. De fait, de nouvelles études réalisées auprès d’un plus vaste échantillon permettraient de valider les résultats obtenus. Ensuite, bien que des éléments de preuve de validité soient obtenus pour deux des cinq sources proposées par Messick (1989), des analyses supplémentaires devraient être effectuées pour obtenir des éléments de preuve des trois autres sources (processus de réponses, relations avec d’autres variables et validité de conséquence), mais aussi pour recourir à d’autres preuves de validité de structure interne (fonctionnement différentiel d’item, généralisabilité, etc.). Cependant, il importe de mentionner que la plupart des recherches ne portent généralement que sur une ou deux preuves de validité (Hébert, Valois, & Frenette, 2008). Enfin, nous estimons qu’il serait pertinent de procéder à une validation transculturelle de cette échelle en anglais afin de répondre aux besoins des chercheurs anglophones intéressés par la recherche dans ce domaine.

Élaboration de l’Échelle du sentiment d’efficacité personnelle des enseignants en gestion de classe (ÉSEPGC)

Note des auteurs

Résumé

Abstract

Resumo

Introduction

Problématique

Cadre conceptuel