Article body

Introduction

Dans le contexte actuel, de nombreuses réformes scolaires mettent les enseignants au défi. Dans plusieurs cantons suisses, par exemple, comme dans de nombreux pays, une réforme scolaire en cours met en avant le principe selon lequel des solutions intégratives sont préférables aux solutions séparatives dans la scolarisation des élèves ayant des besoins particuliers (CDIP, 2007). Cette intégration en classe ordinaire peut avoir des conséquences autant pour l’élève intégré, les camarades de classe que les enseignants, et nécessite la mise en oeuvre de mesures d’aide spécifiques afin de favoriser sa réussite. Ces conséquences impliquent le plus souvent une redéfinition du rôle de l’enseignant ordinaire, qui est amené à collaborer avec des intervenants externes, ou à l’intérieur de la classe avec un enseignant spécialisé (Benoit & Angelucci, 2011 ; Scruggs, Mastropieri, & McDuffie, 2007). Au-delà de la collaboration, des qualifications et des expériences des enseignants, leurs attitudes vis-à-vis de l’inclusion semblent liées à leurs aptitudes perçues à prendre en charge des élèves ayant des difficultés d’apprentissage. Les croyances et les perceptions que peuvent avoir les individus sur leur efficacité influencent une grande partie des domaines de la vie quotidienne, des comportements, des pensées et de la motivation (Lecomte, 2004). Elles affectent les efforts que les enseignants mettent en oeuvre et les objectifs qu’ils visent, mais elles sont aussi associées aux attitudes qu’ils auront en classe (Loreman, Sharma, & Forlin, 2013 ; Tschannen-Moran, Woolfolk Hoy, & Hoy, 1998). Ainsi, l’auto-efficacité est un facteur central qui aurait un impact sur les performances dans toutes les tâches d’enseignement (Imants & De Brabander, 1996) et pourrait donc avoir une importance dans la façon dont l’enseignant abordera la redéfinition de son rôle dans le contexte d’une réforme telle que celle de l’école inclusive. Notamment, il semble que les attitudes des enseignants envers l’inclusion ainsi que leur niveau d’auto-efficacité soient déterminants dans la mise en place efficace de l’inclusion scolaire (Avramidis & Norwich, 2002 ; Friend & Bursuck, 2009 ; McLeskey, Waldron, So, Swanson, & Loveland, 2001 ; Moeller & Ishii-Jordan, 1996 ; Paneque & Barbetta, 2006 ; Sharma, Loreman, & Forlin, 2011). Il semble donc nécessaire d’inclure l’auto-efficacité des enseignants dans les recherches étudiant la mise en oeuvre de telles réformes (Bonvin, 2011). Or, un examen de la littérature révèle une certaine confusion conceptuelle concernant l’auto-efficacité des enseignants ainsi qu’une grande disparité dans les mesures utilisées afin de l’évaluer (Tschannen-Moran et al., 1998 ; voir aussi ci-après). De plus, il n’existe pas à ce jour d’échelle largement utilisée dans le monde francophone qui ne présente pas de difficulté conceptuelle et métrique (voir la section suivante, État de la recherche).

Le présent article propose donc un état des lieux des outils d’évaluation quantitatifs permettant de mesurer l’auto-efficacité chez les enseignants ainsi qu’une analyse de leur fréquence d’utilisation. Il vise ainsi d’une part à clarifier le concept et sa mesure telle qu’elle est appliquée à ce jour et, d’autre part, à faciliter le choix d’un instrument adéquat pour une validation en français.

État de la recherche

Plusieurs termes sont utilisés pour qualifier cette notion, dont efficacité personnelle ou sentiment d’efficacité. Nous utiliserons, dans le présent article, le terme auto-efficacité, que nous allons tenter de définir. Selon Lecomte (2004), l’auto-efficacité se compose de sentiments spécifiques d’efficacité liés à des activités particulières, telles que l’enseignement. Il définit l’auto-efficacité des enseignants en tant que croyances et sentiments que les enseignants ont quant à leurs capacités et leur efficacité à motiver les élèves et à favoriser l’apprentissage (Lecomte, 2004). Précisément dans le domaine de l’enseignement, deux approches théoriques sont présentées comme étant à la base de nombreux travaux. La première définit l’auto-efficacité en tant que croyances personnelles sur l’influence de certaines actions, contrôlables par les enseignants, et sur les conséquences et les résultats de l’enseignement (Rotter, 1966). La seconde définit l’auto-efficacité des enseignants en tant que croyances sur leurs propres capacités à réaliser certaines actions, croyances qui influenceront ensuite leurs efforts, leur persistance et leurs réactions devant les obstacles (Bandura, 1977, 1997). Gibson et Dembo (1984) ont, sur la base des travaux de Bandura, redéfini l’auto-efficacité comme étant l’évaluation personnelle que font les enseignants de leurs capacités à engendrer des changements positifs chez leurs élèves. Une autre définition semble davantage se baser sur l’approche de Rotter en suggérant que l’auto-efficacité se réfère aux croyances en l’influence que les enseignants peuvent avoir sur l’apprentissage de leurs élèves, même les plus difficiles ou les moins motivés (Guskey & Passaro, 1994). Tschannen-Moran et ses collaborateurs (1998) ont mis en évidence la confusion provoquée par l’approche de Rotter (notion de locus de contrôle interne et externe), qui diffère de celle de Bandura (croyances d’un individu sur ses capacités à réaliser une action particulière). En effet, ces auteurs stipulent qu’un individu peut tout à fait croire qu’une conséquence est uniquement le résultat de son action, et qu’elle est donc interne et contrôlable, tout en ayant peu ou pas du tout confiance en ses capacités à réaliser cette action (Tschannen-Moran et al., 1998). Nous retiendrons donc la définition selon laquelle l’auto-efficacité se réfère aux croyances d’un individu sur les capacités qu’il mettra en oeuvre dans une situation donnée, soit les croyances des enseignants au sujet de leurs compétences à réaliser une tâche liée à l’enseignement et dans un contexte spécifique (Tschannen-Moran et al., 1998). Ainsi, l’auto-efficacité est un concept contextuel.

Malgré un cadre théorique quelquefois confus, le concept d’auto-efficacité reste largement étudié dans le domaine de l’enseignement. Pour ne se limiter qu’au domaine de l’intégration ou de l’inclusion scolaire, où l’auto-efficacité peut impliquer la perception des capacités à enseigner dans une classe hétérogène (Andrews & Lupart, 2000), son influence significative sur la capacité à accepter les difficultés inhérentes à l’inclusion a été montrée (Busby, Ingram, Bowron, Olivier, & Lyons, 2012). Par exemple, un enseignant se percevant comme étant compétent et ayant confiance en ses capacités à enseigner en classe inclusive estimera qu’un élève ayant des besoins particuliers pourra apprendre efficacement en classe ordinaire, alors qu’un enseignant qui n’a pas confiance considérera qu’il ne pourra pas apporter quelque chose de constructif pour ce même élève (Sharma et al., 2011). Ainsi, des études ont pu mettre en évidence que les enseignants présentant un niveau élevé d’auto-efficacité avaient davantage confiance en leurs capacités à enseigner de façon efficace en classe inclusive et à gérer les élèves ayant des besoins particuliers (Brownell & Pajares, 1999), et montraient des attitudes positives envers l’inclusion (Soodak, Podell, & Lehman, 1998 ; Weisel & Dror, 2006). Ils seraient également les plus disposés à utiliser de nouvelles méthodes afin de répondre aux besoins de leurs élèves (Berman, McLaughlin, Bass, Pauly, & Zellman, 1977 ; Guskey, 1988 ; Stein & Wang, 1988), auraient davantage tendance à recommander le maintien des élèves ayant des besoins particuliers en classe ordinaire (Podell & Soodak, 1993 ; Soodak & Podell, 1993, 1994) ou à accepter de les prendre en charge dans leur classe (Soodak & Podell, 1994), et auraient des niveaux d’organisation et de planification supérieurs (Allinder, 1994). L’auto-efficacité a également été associée à la satisfaction professionnelle et permettrait de lutter contre le stress (Caprara, Barbaranelli, Borgogni, & Steca, 2003 ; Ware & Kitsantas, 2007). Le niveau de collaboration entre enseignants serait également lié à une augmentation de l’auto-efficacité (Chester & Beaudoin, 1996 ; Rosenholtz, 1989), et les enseignants qui utiliseraient des méthodes d’enseignement variées et qui auraient un niveau élevé d’auto-efficacité seraient les plus réceptifs à l’inclusion (Soodak et al., 1998). Enfin, l’expérience d’enseignement dans des classes inclusives aurait une forte influence sur l’auto-efficacité des enseignants et agirait même lorsque le type d’enseignement (ordinaire par rapport à spécialisé) est contrôlé (Malinen et al., 2013). Les enseignants exprimeraient néanmoins des craintes concernant leurs aptitudes à enseigner en classe inclusive et estimeraient être trop peu formés pour y parvenir convenablement (Hemmings & Weaven, 2005 ; Bishop & Jones, 2002 ; Scruggs & Mastropieri, 1996 ; Winter, 2006).

Bien que le corpus de recherches disponibles sur l’auto-efficacité des enseignants soit conséquent, il reste des questions quant à son évaluation (Henson, Kogan, & Vacha-Haase, 2001). Une des premières échelles conçues afin de tenter de mesurer le concept d’auto-efficacité chez les enseignants est la Teacher Efficacy Scale (TES) de Gibson et Dembo (1984). Initialement composée de 30 items, cette échelle a fait l’objet de plusieurs analyses factorielles ayant abouti à différentes versions, dont une francophone (Dussault, Villeneuve, & Deaudelin, 2001 ; Hoy & Woolfolk, 1993 ; Soodak & Podell, 1993 ; Woolfolk & Hoy, 1990). Cette échelle est devenue un instrument de mesure largement utilisé, voire prédominant (Henson et al., 2001). Cependant, plusieurs auteurs s’accordent à dire que la TES ne reflète pas complètement le concept d’auto-efficacité selon la définition donnée par Bandura et sur laquelle elle est censée se baser (Coladarci & Fink, 1995 ; Guskey & Passaro, 1994 ; Tschannen-Moran et al., 1998). Malgré les critiques, la TES reste une échelle très utilisée dans différents pays (Diken, 2004 ; Dussault et al., 2001 ; Liaw, 2009). Lors de leur revue de la littérature, Tschannen-Moran et ses collaborateurs (1998) ont indiqué que certains auteurs utilisaient des combinaisons d’items provenant de différents outils de mesure existants ou créaient leur propre mesure. Il existe donc une variété importante d’échelles évaluant l’auto-efficacité, ce qui rend difficile le choix d’utiliser une échelle plutôt qu’une autre. Cette diversité d’outils reflète d’ailleurs les confusions théoriques évoquées précédemment, ainsi que l’importance de ce concept tant sur le plan théorique qu’empirique.

Méthode

Les articles publiés entre janvier 2000 et juin 2015 ont été recherchés sur les bases de données ScienceDirect, Academic Search Premier, PsycINFO et ERIC à l’aide des mots clés teacher ou enseignant et self-efficacy ou auto-efficacité utilisés de façon combinée. Ainsi, 1571 études ont été recensées sur ces quatre bases de données. Les critères d’inclusion comprenaient d’avoir dans le titre et/ou dans les mots clés au moins un des termes suivants : teacher et self-efficacy, teacher self-efficacy (auto-efficacité des enseignants), teacher efficacy, teachers’ self-efficacy beliefs ou teachers’ perception of self-efficacy (auto-efficacité perçue). Lorsque seul un des deux termes (teacher ou self-efficacy) était présent, le résumé de l’article a été analysé afin de s’assurer que l’article porte sur le sujet de l’auto- efficacité des enseignants.

Les critères d’exclusion, au regard de la méthodologie utilisée et de la forme de l’article, comprenaient les études qualitatives, les revues de la littérature, les méta-analyses et les thèses non publiées sous forme d’articles. Les autres critères d’exclusion concernaient les échelles ayant été recensées moins de cinq fois, celles portant sur l’auto-efficacité générale (p. ex., la General Self-Efficacy Scale de Jerusalem & Schwarzer, 1981 ; Schwarzer & Jerusalem, 1999), les échelles évaluant l’auto-efficacité des enseignants dans des disciplines spécifiques (p. ex., le Science Teaching Efficacy Belief Instrument de Riggs & Enochs, 1990), les échelles s’éloignant de la simple relation enseignant-élève ou encore trop connotées culturellement (p. ex., la Classroom and School Context Teacher Self-Efficacy Scale de Friedman & Kass, 2002 ; la Norwegian Teacher Self-Efficacy Scale de Skaalvik & Skaalvik, 2007) et, enfin, les échelles n’évaluant qu’une sous-dimension de l’auto-efficacité des enseignants (p. ex., la Teacher Efficacy in Classroom Management and Discipline Scale d’Emmer & Hickman,1991).

Après élimination des doublons en raison de la recherche croisée dans quatre bases de données, le corpus d’articles analysés, avec l’objectif d’observer les outils d’évaluation utilisés pour mesurer l’auto-efficacité perçue des enseignants, comprenait 247 articles. Les échelles utilisées dans chaque article ont été recensées et catégorisées en fonction de leur fréquence d’utilisation. Certains articles utilisaient parfois plusieurs échelles afin d’évaluer l’auto-efficacité des enseignants. Dans de tels cas, chaque échelle a été recensée comme ayant été utilisée une fois. Ainsi, cinq échelles sans spécificité de discipline ont été recensées au minimum dans huit articles différents entre les années 2000 et 2015. Parmi ces articles, les études de validation de certaines échelles ont été incluses dans notre revue de la littérature (Dussault et al., 2001 ; Sharma et al., 2011 ; Tschannen-Moran & Woolfolk Hoy, 2001), mais elles n’ont pas été recensées comme étant une utilisation de l’échelle.

Résultats

Les tableaux 1 à 5 présentent les cinq échelles recensées dans 46 articles.

La Teacher Efficacy for Inclusive Practices Scale (TEIP)

Parmi les instruments de mesure sans spécificité de discipline, la Teacher Efficacy for Inclusive Practices Scale (TEIP ; Sharma et al., 2011) a été recensée dans huit articles différents. Elle a été conçue afin d’évaluer l’auto-efficacité perçue des enseignants intervenant en classe inclusive et se compose de 18 items répartis selon trois dimensions : (a) l’enseignement inclusif, qui correspond à la perception de l’efficacité à enseigner en utilisant des pratiques inclusives, (b) l’efficacité dans la collaboration, qui correspond à la perception de l’efficacité à impliquer les parents et les autres professionnels, et (c) l’efficacité dans la gestion de classe, qui correspond à l’efficacité à gérer les comportements perturbateurs. Cette troisième dimension se centre davantage sur l’environnement et les pratiques éducatives. Un score élevé indique que les répondants présentent un sens élevé d’auto-efficacité perçue à enseigner dans des classes inclusives. Les études utilisant la TEIP ont été menées sur des échantillons de futurs enseignants et d’enseignants en exercice au Bangladesh (Ahsan, Sharma, & Deppeler, 2012), au Pakistan et en Australie (Shaukat & Sharma, 2013 ; Sharma, Shaukat, & Furlonger, 2015), en Amérique du Nord (Park, Dimitrov, Das, & Gichuru, 2014 ; Peebles & Mendaglio, 2014 ; Sokal & Sharma, 2013), en Chine, en Finlande et en Afrique du Sud (Malinen, Savolainen, & Xu, 2012 ; Malinen et al., 2013). Les indices de consistance interne du score total de l’échelle et des trois facteurs sont satisfaisants (entre 0,75 et 0,98), excepté pour le facteur 3 dans l’étude de Sharma et ses collaborateurs (2015) avec un alpha de Cronbach de 0,61. Peebles et Mendaglio (2014) indiquent que la fiabilité externe de l’échelle doit encore être déterminée, car aucune étude n’inclut de test-retest.

Tableau 1

Recensement des articles utilisant l’échelle Teacher Efficiency For Inclusive Practices Scale – TEIP (Sharma et al., 2011)

Recensement des articles utilisant l’échelle Teacher Efficiency For Inclusive Practices Scale – TEIP (Sharma et al., 2011)

-> See the list of tables

L’échelle d’auto-efficacité de Bandura

L’échelle d’auto-efficacité de Bandura (1997) a été recensée dans 16 articles différents entre 2000 et 2015. Cet instrument permet d’évaluer la perception qu’ont les enseignants de leurs capacités à réaliser des tâches spécifiques et se compose de 30 items divisés en sept facteurs illustrant l’efficacité à :

  • enseigner ;

  • impliquer les parents ;

  • impliquer la communauté ;

  • maintenir la discipline ;

  • instaurer un climat positif ;

  • influencer la prise de décision ;

  • influencer l’utilisation de certaines ressources scolaires.

Bien qu’elle présente des indices de consistance interne satisfaisants (voir Tableau 2), il existe différentes versions de cette échelle, où le nombre d’items varie considérablement. Parmi les articles recensés, seules quatre études ont utilisé la version originale (Al-Fadhli & Singh, 2006 ; Khan, Fleva, & Qasi, 2015 ; Rashidi & Moghadam, 2014 ; Woolfolk Hoy & Spero, 2005). Les autres études ont utilisé soit une version abrégée (Engstrand & Roll-Pettersson, 2014 ; Guo, Justice, Sawyer, & Tompkins, 2011 ; Guo, Piasta, Justice, & Kaderavek, 2010 ; Hines & Kritsonis, 2010 ; LoCasale-Crouch, Davis, Wiens, & Pianta, 2012 ; van Uden, Ritzen, & Pieters, 2013), soit une version adaptée au contexte culturel ou au contexte de l’étude (Faleye, 2008 ; Guo, Dynia, Pelatti, & Justice, 2014 ; Kim & Kim, 2010 ; Rimm-Kaufman & Sawyer, 2004). Dans l’étude de Yoon, Evans et Strobel (2014), l’échelle a été uniquement utilisée dans le but de concevoir une échelle spécifique. La consistance interne de cette échelle est néanmoins satisfaisante, malgré les différentes versions (alphas de Cronbach compris entre 0,73 et 0,95), excepté pour l’étude de Faleye (2008).

Tableau 2

Recensement des articles utilisant l’échelle d'auto-efficacité de Bandura (1997)

Recensement des articles utilisant l’échelle d'auto-efficacité de Bandura (1997)

-> See the list of tables

La General Teacher Self-Efficacy Scale

La General Teacher Self-Efficacy Scale (Schwarzer, Schmitz, & Daytner, 1999) a été recensée dans 17 articles différents. Elle se compose de 10 items évaluant l’auto-efficacité dans quatre domaines majeurs de la profession d’enseignant : (a) la réussite professionnelle, (b) le développement de compétences, (c) les interactions sociales, et (d) le stress professionnel (Schwarzer et al., 1999). Les auteurs estiment que l’auto-efficacité générale d’un enseignant ne peut être observée qu’en prenant en considération ces quatre domaines (Chan, 2008a). Construite sur la base de la théorie sociocognitive de Bandura, elle présente une consistance interne (alphas de Cronbach compris entre 0,76 et 0,82) et une fiabilité de test-retest (variant de 0,65 à 0,76) relativement satisfaisantes selon l’étude initiale (Schwarzer et al., 1999). Ces indices ne sont pas mentionnés dans certaines études (Dicke et al., 20015 ; Er & Gürgan, 2011 ; Schmitz & Schwarzer, 2000 ; Verešová & Malá, 2012). Des études utilisent une version raccourcie (Holzberger,Philipp, & Kunter, 2014 ; Öztaş & Dilmac, 2009) ou complétées par des items supplémentaires (Weissenrieder, Roesken-Winter, Schueler, Binner, & Blömeke, 2015), et les modalités de cotation varient également. Certains auteurs utilisent une échelle de type Likert à 4 modalités (Betoret, 2009 ; Betoret & Artiga, 2010 ; Holzberger, Philipp, & Kunter, 2013 ; Holzberger et al., 2014 ; Rahman, Sulaiman, Nasir, & Omar, 2014 ; Schwerdtfeger, Konermann, & Schönhofen, 2008 ; Verešová & Malá, 2012 ; Weissenrieder et al., 2015), d’autres à 7 modalités (Kaye & Brewer, 2013) ou à 11 modalités (Chan, 2008a, 2008b, 2008c) avec des terminologies variées. Enfin, bien qu’un modèle à deux facteurs regroupés sous un facteur général soit suggéré dans une étude (Dicke et al., 2015), aucune analyse factorielle n’est disponible, ce qui ne permet pas de définir si cette échelle doit plutôt être utilisée de façon multidimensionnelle ou unidimensionnelle.

Tableau 3

Recensement des articles utilisant l’échelle General Teacher Self-Efficiency Scale (Schwarzet et al., 1999)

Recensement des articles utilisant l’échelle General Teacher Self-Efficiency Scale (Schwarzet et al., 1999)

-> See the list of tables

Finalement, il ressort de la revue de la littérature que les échelles les plus souvent utilisées dans les 247 articles analysés sont la Teachers’ Sense of Efficacy Scale (TSES) de Tschannen-Moran et Woolfolk Hoy (2001) avec un total de 143 études (soit 58 %) et la Teacher Efficacy Scale (TES) de Gibson et Dembo (1984) avec un total de 66 études (soit 27 %).

La Teacher Efficacy Scale (TES)

La TES est une échelle de 30 items conçue par Gibson et Dembo (1984) qui se compose de deux facteurs : (a) l’efficacité personnelle (EP), qui se définit comme étant la perception des enseignants au sujet de leurs capacités à amorcer un changement chez leurs élèves, et (b) l’efficacité générale (EG), qui est constituée des croyances en leurs capacités à surmonter et à dépasser l’influence de facteurs externes sur l’apprentissage des élèves. Certains auteurs ont indiqué que cette échelle était si fréquemment utilisée qu’elle était considérée comme constituant la mesure « standard » de l’auto-efficacité chez les enseignants (Henson et al., 2001). Il s’avère qu’elle est également citée en tant que référence dans les études taïwanaises (Lin & Gorrell, 2001). Cependant, cette échelle a été révisée ou a fait l’objet d’une adaptation dans la majorité des études concernées (voir Tableau 4), que ce soit sur le plan de la culture, de la discipline enseignée ou encore du thème et de la population de l’étude. Plusieurs versions différentes ont été recensées :

  • à 24 items : Milson, 2003 ; Milson et Mehlig, 2002 ; Yenice, 2009 ;

  • à 22 items : Abu-Tineh, Khasawneh, et Khalaileh, 2011 ; Gao et Mager, 2011 ; Roll-Pettersson, 2008 ;

  • à 21 items : Küçüktepe, 2010 ;

  • à 20 items : Denzine, Cooney, et McKenzie, 2005 ; Weshah, 2012 ;

  • à 19 items : Almog et Shechtman, 2007 ;

  • à 18 items : Lin, Gorrell, et Taylor, 2002 ; Leyser, Zeiger, et Romi, 2011 ;

  • à 16 items : Ahmad, 2011 ; Brouwers et Tomic, 2003 ; Brouwers, Tomic, et Stijnen, 2002 ; de la Torre Cruz et Casanova Arias, 2007, 2008 ; Dussault, Payette, et Leroux, 2008 ; Ebmeier, 2003 ; Egyed et Short, 2006 ; Graham, Harris, et Fink, 2001 ; Henson, 2001b ; Henson, Bennett, Sienty, et Chambers, 2000 ; Kurz et Knight, 2004 ; Lee, Patterson, et Vega, 2011 ; Slone et Hancock, 2008 ; Tournaki et Podell, 2005 ;

  • à 15 items : Malow-Iroff, O’Connor, et Bisland, 2007 ; Ransford, Greenberg, Domitrovitch, Small, et Jacobson, 2009 ;

  • à 14 items : Çayci, 2011; Glaubman et Lifshitz, 2001; Gordon et Debus, 2002;

  • à 13 items : Gaudreau, Royer, Frenette, Beaumont, et Flanagan, 2013; Tournaki, Lyublinskaya, et Carolan, 2009 ;

  • à 10 items : Beasley, Gratin, Lincoln, et Penner-Williams, 2013 ; Henson, 2011a ; Henson et Chambers, 2002 ; Kulinna, Cothran, et Kloeppel, 2011 ; Liaw, 2009; Pekkanli Egel, 2009; Shechtman, Levy, et Leichtentritt, 2005 ; Woodcock, 2011 ; Woolfolk Hoy et Spero, 2005 ;

  • à 8 items : Yin, Lee, Jin, et Zhang, 2013; et

  • à 5 items : une seule dimension, centrée sur l’habileté perçue à gérer les problèmes de comportement; Pas, Bradshaw, et Hershfeldt, 2012.

Quatre études ont uniquement utilisé les cinq items de la sous-échelle EP (Goddard & Goddard, 2001 ; Høigaard, Giske, & Sundsli, 2012 ; Huang & Liu, 2007 ; Tuchman & Isaacs, 2011). Les échelles de type Likert utilisées diffèrent également en fonction des études (à 9, 6 et 5 modalités). Les alphas de Cronbach présentés dans les différentes études démontrent une grande variabilité puisqu’ils sont compris entre 0,57 et 0,99. Cette variabilité est notamment due au grand nombre de versions différentes utilisées. Enfin, six études rapportent les résultats d’analyses factorielles confirmatoires (Brouwers & Tomic, 2003 ; Brouwers et al., 2002 ; de la Torre Cruz & Casanova Arias, 2007 ; Denzine et al., 2005 ; Gordon & Debus, 2002 ; Yin et al., 2013). Certains auteurs concluent que les deux sous-échelles reflètent des construits différents et que cette échelle serait peu précise (Brouwers & Tomic, 2003 ; Brouwers et al., 2002), montrant la complexité de l’évaluation de l’auto-efficacité chez les enseignants (de la Torre Cruz & Casanova Arias, 2007).

Tableau 4

Recensement des articles utilisant l’échelle Teacher Efficiency Scale – TES (Gibson & Dembo, 1984)

Recensement des articles utilisant l’échelle Teacher Efficiency Scale – TES (Gibson & Dembo, 1984)

-> See the list of tables

La Teachers’ Sense of Efficacy Scale (TSES)

La TSES a été conçue par Tschannen-Moran et Woolfolk Hoy (2001) pour pallier les problèmes de fiabilité et de validité des autres instruments de mesure existants, et pour mieux refléter les types de tâches auxquelles les enseignants doivent faire face. Les versions longue (à 24 items) et courte (à 12 items) de cette échelle permettent d’évaluer l’auto-efficacité perçue des enseignants. Les analyses factorielles ont mis en évidence trois sous-échelles : (a) l’efficacité dans l’engagement des étudiants (EEE ; motivation des élèves), (b) l’efficacité dans les stratégies d’enseignement (ESE ; stratégies mises en place pour répondre aux besoins de tous les élèves), et (c) l’efficacité dans la gestion de la classe (EGC ; gestion des comportements et discipline). Les items se présentent sous la forme d’affirmations. La version longue de la TSES, sans adaptation, a été recensée dans 67 articles différents, contre 38 pour la version courte (voir Tableau 5). Quatre autres versions ont été dénombrées : une version à 23 items (Saricoban, 2010), à 18 items (Wagler & Moseley, 2005 ; Wolters & Daugherty, 2007), à 11 items (De Jong et al., 2014 ; Nie, Tan, Liau, Lau, & Chua, 2013) et à 9 items (De Neve, Devos, & Tuytens, 2015). Les autres études utilisent des versions adaptées de l’échelle en fonction du contexte culturel, de la discipline enseignée ou encore du niveau d’enseignement. La structure factorielle de l’échelle est identique dans la version longue et la version courte, les trois facteurs étant conservés. Huit études ayant réalisé des analyses factorielles (exploratoires ou confirmatoires) retrouvent une structure factorielle identique à la structure d’origine : celles de Fives et Buehl, 2010 ; de Gao, Xiang, Chen, et McBride, 2013 ; de Gibbs et Powell, 2012 ; de Klassen et Chiu, 2010 ; de Putman, 2012 ; de Senler et Sungur, 2010 ; de Swanson, 2012 ; et de Yavuz, 2010. Cette échelle a également été utilisée dans quatre études afin de tester la validation externe de construit d’un autre questionnaire, notamment la validité discriminante : celles de Dunn, Airola, et Lo, 2013 ; de Swanson, 2010a, 2010b ; et de Yoon et al., 2014. Selon les différentes études, la consistance interne de l’échelle varie entre 0,53 et 0,99 (voir Tableau 5). Les valeurs les plus faibles (0,53 ; 0,65 ; 0,68) se retrouvent la plupart du temps dans des études utilisant une version modifiée de l’échelle originale. Dans les autres études, les alphas de Cronbach sont tous supérieurs à 0,70. Comme pour la TES (Gibson & Dembo, 1984), cette variabilité peut être due aux différentes adaptations des items. Woolfolk Hoy et Spero (2005) indiquent que la TSES serait supérieure aux autres mesures d’évaluation de l’auto-efficacité perçue des enseignants, car elle serait théoriquement plus proche de la théorie de Bandura (1997 ; voir la section suivante, Discussion).

Tableau 5

Recensement des articles utilisant l’échelle Teachers’ Sense of Efficiency Scale – TSES (Tschannen-Moran & Woolfolk Hoy, 2001)

Recensement des articles utilisant l’échelle Teachers’ Sense of Efficiency Scale – TSES (Tschannen-Moran & Woolfolk Hoy, 2001)

-> See the list of tables

Discussion

L’objectif de la présente étude était de réaliser une revue de la littérature permettant d’observer la fréquence d’utilisation des outils d’évaluation de l’auto-efficacité chez les enseignants. Il s’agissait également de faciliter le choix d’un instrument adéquat pour une validation et une application dans le monde francophone.

Bien qu’il semble que le concept d’auto-efficacité soit fortement dépendant de la spécificité des situations (Riggs & Enochs, 1990), les reproches souvent formulés à l’encontre des instruments de mesure sont qu’ils apparaissent comme étant trop généraux ou, au contraire, trop spécifiques. Ainsi, un modèle considérant une multitude de dimensions peut être bénéfique, mais il doit également être pertinent quant à l’objet d’étude. La TEIP (Sharma et al., 2011) présente l’avantage d’avoir justement été créée afin d’évaluer l’auto-efficacité perçue dans des classes inclusives. De plus, elle est peu sensible au contexte culturel puisque la structure factorielle de l’échelle varie peu entre les échantillons chinois, finlandais et sud-africain (Malinen et al., 2013). En effet, les trois facteurs sont maintenus et seul le nombre d’items varie d’une version à l’autre en fonction des différents facteurs. Cependant, malgré son utilisation dans des échantillons d’enseignants titulaires (Malinen et al., 2012 ; Malinen et al., 2013), cette échelle a initialement été créée afin d’examiner l’auto-efficacité perçue à enseigner dans des classes d’inclusion chez les futurs enseignants. Ainsi, cette échelle peut être utilisée en tant qu’outil d’évaluation de l’auto-efficacité à enseigner en classes inclusives des enseignants stagiaires avant de terminer leur programme de formation. Elle permettrait de s’assurer que ces derniers sont préparés à enseigner dans ce type de classe (Sharma et al., 2011). Ses qualités psychométriques ont été évaluées dans différents pays (Malinen et al., 2013), mais des données supplémentaires doivent encore être recueillies chez les enseignants titulaires.

Le manque d’information disponible sur la structure factorielle de la TSES conçue par Schwarzer et ses collaborateurs (1999) ainsi que sa faible fréquence d’utilisation ne permettent pas d’approuver sa validité. Elle a été essentiellement utilisée en Europe. Concernant l’échelle d’auto- efficacité de Bandura (1997), sa structure factorielle paraît également complexe en évaluant l’auto-efficacité des enseignants à l’intérieur et à l’extérieur de la classe dans différentes tâches d’enseignement. De plus, elle apparaît peu stable puisque plusieurs versions de cette échelle existent, avec une forte variation du nombre d’items selon les versions (de 30 à 11 items). Un des risques de l’utilisation de ce type d’échelle est d’obtenir des résultats peu généralisables (Tschannen-Moran et al., 1998).

La TES (Gibson & Dembo, 1984) semble être un instrument de choix afin d’évaluer l’auto-efficacité des enseignants puisque plusieurs auteurs estiment qu’il s’agit d’un instrument de référence (Henson et al., 2001 ; Lin & Gorrell, 2001). Bien que la version de référence à 16 items reste la plus fréquemment utilisée, les différentes versions de cette échelle rendent difficile une éventuelle estimation de sa validité. Tschannen-Moran et Woolfolk Hoy (2001) ont souligné des problèmes conceptuels (p. ex., le manque de clarté concernant le sens à donner aux deux facteurs) et statistiques (p. ex., l’instabilité de la structure factorielle) pouvant rendre son utilisation problématique. Un consensus s’est formé autour de l’idée qu’elle ne mesure pas exactement le concept d’auto-efficacité selon la théorie de Bandura (Coladarci & Fink, 1995 ; Guskey & Passaro, 1994 ; Tschannen-Moran et al., 1998). Ainsi, le second facteur – l’efficacité générale – censé représenter les croyances sur les conséquences que peuvent avoir les actions des enseignants reflèterait en fin de compte les croyances sur les capacités à gérer les élèves difficiles (p. ex., « Si les parents s’occupaient plus de leurs enfants, je pourrais faire plus moi-même » ; Dussault et al., 2001).

La TSES (Tschannen-Moran & Woolfolk Hoy, 2001) ressort de la revue de la littérature en tant qu’échelle la plus fréquemment utilisée dans les recherches sur l’auto-efficacité des enseignants. Bien que ce recensement n’atteste ni de sa validité ni de ses qualités psychométriques, cet instrument de mesure est présenté par plusieurs auteurs comme étant l’outil le plus adapté à l’évaluation du concept d’auto-efficacité tel qu’il est défini par Bandura (Tschannen-Moran & Woolfolk Hoy, 2001 ; Klassen & Chiu, 2010, 2011). Les items de la TSES semblent être davantage en lien avec la théorie de l’auto-efficacité puisqu’ils évaluent les perceptions des enseignants sur leurs capacités perçues à réaliser certaines tâches spécifiques d’enseignement dans le contexte tout aussi spécifique de la classe (Klassen & Chiu, 2010, 2011). Selon Klassen et Chiu (2011), alors que les mesures antérieures se focalisaient sur la perception d’avoir certaines compétences (p. ex., « Je suis doué dans l’enseignement des mathématiques »), la TSES se centre sur les capacités perçues à réaliser certaines actions (p. ex., « Je suis persuadé de pouvoir correctement enseigner les mathématiques aux élèves »). La version à 24 items présente néanmoins des alphas de Cronbach en moyenne très élevés, ce qui peut indiquer que les items ne sont pas suffisamment discriminants les uns des autres et suggérer de favoriser l’utilisation de la version courte. De plus, sa validité interculturelle a été examinée sur des échantillons de différents pays d’Amérique du Nord, d’Asie et d’Europe (Klassen et al., 2009a), ce qui semble indiquer qu’elle est peu sensible au contexte culturel. Son adaptation et son utilisation dans les régions francophones semblent donc pouvoir être soutenues.

Pour conclure en revenant à l’exemple de la réforme inclusive en cours présentée en introduction, l’état de la recherche internationale a produit un certain nombre d’hypothèses au sujet des facteurs susceptibles de soutenir sa mise en oeuvre. Il s’agit par exemple de reconnaître que la modification de l’environnement scolaire qu’elle implique engendre également le besoin de modifier et de compléter les formations offertes (Nougaret, Scruggs, & Mastropieri, 2005) afin de procurer aux futurs enseignants les ressources suffisantes, de les préparer à enseigner à des groupes hétérogènes d’élèves et qu’ils aient confiance en leurs capacités (Busby et al., 2012). Les croyances concernant l’efficacité ayant tendance à rester relativement stables dans le temps, surtout chez les enseignants les plus expérimentés et malgré de nouvelles formations (Malinen et al., 2012), les années de formation initiale semblent donc le moment le plus adéquat afin d’agir sur ces croyances et perceptions (Woolfolk Hoy & Spero, 2005).

Afin de tester ces hypothèses dans des contextes d’étude francophones, tant avec de futurs enseignants qu’avec des enseignants en exercice, il convient de disposer d’un instrument qui soit à la fois fiable, valide et appliqué à diverses questions et populations de recherche. Sur la base de notre revue des instruments, de leur utilisation et de leurs qualités psychométriques, il semble que la TSES (Tschannen-Moran & Woolfolk Hoy, 2001) soit prometteuse, que ce soit dans l’optique de tester des hypothèses incluant le construit d’auto-efficacité dans un contexte spécifique ou de disposer de données et résultats de recherche comparables entre contextes francophones et non francophones. La TSES manque cependant encore d’études de validation en français, ce qui est regrettable au vu du rôle central que l’auto-efficacité semble devoir jouer dans la détermination de la disposition et de la capacité des enseignants à répondre aux défis actuels de l’enseignement, ainsi que dans la protection de leur bien-être psychologique.