Corps de l’article

Problématique

Au cours des quinze dernières années, de multiples études se sont intéressées à l'autoefficacité des enseignants. Gibson et Dembo (1984) définissent ce construit comme la croyance que l'enseignant a de sa capacité à influencer l'apprentissage des élèves. La théorie sociocognitive de Bandura (1977, 1982, 1997) fournit un cadre théorique pour l'étude de l'autoefficacité. Selon cette théorie, le sentiment d'autoefficacité constitue la croyance que possède un individu en sa capacité de produire ou non une tâche (Bandura, 1982, 1993). Plus grand est le sentiment d'autoefficacité, plus élevés sont les objectifs que s'impose la personne et l'engagement dans leur poursuite (Bandura, 1982, 1993). Le sentiment d'autoefficacité est un construit multifactoriel (Bandura, 1977, 1997). Bandura établit une distinction entre les résultats tangibles et les attentes d'efficacité, de telle sorte que les gens peuvent croire que certaines actions vont produire certains résultats (attentes de résultats), mais s'ils ne se sentent pas capables d'exécuter ces actions, ils ne pourront ni les initier ni persister à les accomplir (attentes d'efficacité).

Appliquer à l'enseignement les deux facteurs du sentiment d'autoefficacité sont, selon Gibson et Dembo (1984), le sentiment d'efficacité générale et le sentiment d'efficacité personnelle de l'enseignant. Le sentiment d'efficacité personnelle est la croyance qu'un enseignant a en sa capacité à influencer les apprentissages des élèves. Il s'agit d'une forme d'évaluation personnelle. La seconde dimension, le sentiment d'efficacité générale, réside dans la croyance que le corps enseignant est capable d'apporter des changements chez les étudiants, en dépit des contraintes extérieures au milieu scolaire. Il s'agit de la croyance que les élèves sont éducables sans qu'aucune spécification concernant les individus responsables et la façon d'y arriver ne soit donnée (Ross, Bradley et Gadalla, 1996).

À la lumière de cette théorie, il est permis de croire que la qualité des interventions des enseignants est liée à leurs croyances quant à leur capacité de faire en sorte que les élèves apprennent. D'ailleurs, les études menées durant les quinze dernières années sur le sentiment d'autoefficacité des enseignants tendent à confirmer ce postulat. Elles montrent que plus grand est ce sentiment, plus les enseignants ont des croyances humanistes au travail (Enochs, Scharmann et Riggs, 1995; Woolfolk et Hoy, 1990), plus ils sont optimistes en classe (Woolfolk, Rosoff et Hoy, 1990) et meilleures sont leurs présentations de leçon, leur gestion de classe et les questions posées aux élèves (Saklofske, Michayluk et Randhawa, 1988). Les enseignants ayant un fort sentiment d'autoefficacité tendent à recourir moins rapidement à un spécialiste pour les enfants qui présentent des problèmes de comportements en classe. De plus, un sentiment plus grand d'autoefficacité des enseignants paraît lié à un plus grand engagement dans la profession (Coladarci, 1992). Guskey (1988) soutient que les enseignants qui manifestent un plus grand sentiment d'autoefficacité adoptent des attitudes plus positives à l'égard de l'implantation de nouvelles pratiques enseignantes et perçoivent moins les difficultés lors de cette implantation. Bref, comme le soulignent Rich, Lev et Fischer (1996), on peut supposer que le sentiment d'autoefficacité a un effet significatif sur la nature et la qualité du travail de l'enseignant et, par voie de conséquence, sur les élèves. De tels résultats incitent de plus en plus de chercheurs à s'intéresser au sentiment d'autoefficacité des enseignants pour mieux comprendre et pour mieux expliquer leurs comportements professionnels.

Le Teacher efficacy scale[1] développé par Gibson et Dembo (1984) constitue l'un des instruments les plus utilisés dans les études sur le sentiment d'autoefficacité des enseignants (Enochs, Scharmann et Riggs, 1995; Saklosfske, Michayluk et Randhawa, 1988; Woolfolk et Hoy, 1990; Coladarci, 1992; Woolfolk, Rosoff et Hoy, 1990; Evans et Tribble, 1986; Minke, Bear, Deemer et Griffin 1996; Taylor et Tashakkori, 1995; Hoy et Woolfolk, 1993). Ce questionnaire a été traduit en coréen (Gorrell et Hwang, 1995), en allemand (Meijer et Foster, 1988) et en hébreu (Rich, Lev et Fischer, 1996). Son utilisation fréquente par les chercheurs pour mesurer l'autoefficacité des enseignants est justifiée en raison, d'une part, des conceptions théoriques qui le sous-tendent et, d'autre part, de ses qualités psychométriques.

L'échelle se compose de 16 énoncés où l'enseignant est appelé à indiquer son opinion sur une échelle Likert allant de 1 (Tout à fait en désaccord) à 6 (Tout à fait d'accord). Le sentiment d'efficacité personnelle est évalué à l'aide de neuf items (par exemple, Quand j'essaie vraiment, je peux venir à bout des élèves les plus difficiles) alors que sept items évaluent le sentiment d'efficacité générale (par exemple, La capacité d'apprendre d'un élève est essentiellement reliée aux antécédents familiaux). Plus le score est élevé à chacun des facteurs, plus le sentiment d'autoefficacité de l'enseignant est élevé. Gibson et Dembo (1984) rapportent, comme indice de fidélité du test, un coefficient alpha (Cronbach) de consistance interne égal à 0,79. Les analyses factorielles exploratoires menées par Gibson et Dembo (1984) montrent l'émergence de facteurs. Le premier facteur explique 18,2% de la variance totale et le second facteur explique 10,6% de la variance totale. Le premier facteur représente le sentiment d'efficacité personnelle de l'enseignant et équivaut à l'autoefficacité personnelle de Bandura. Le second facteur représente la croyance dans la capacité de l'enseignement d'exercer de l'influence sur l'apprentissage des élèves en dépit de l'environnement social et familial; il s'agit du sentiment d'efficacité générale. Il correspond aux attentes de résultats de Bandura. De plus, Gibson et Dembo (1984) rapportent une corrélation de -0,19 entre les deux facteurs. Saklofske et al. (1988), de leur côté, obtiennent une corrélation quasi nulle entre les deux facteurs (r = 0,03). Ces résultats suggèrent l'indépendance relative des deux construits tel que le suggère Bandura (1997).

Objectif

Selon nous, il n'existe actuellement aucune mesure française du sentiment d'autoefficacité des enseignants ayant fait l'objet d'évaluations métrologiques. Compte tenu de l'importance du concept, la traduction en langue française du Teacher efficacy scale et sa validation deviennent nécessaires. Les deux études rapportées veulent donc contribuer à la validation transculturelle de cet instrument. À cette fin, le processus utilisé s'inspire des étapes proposées par Vallerand (1989).

La méthode de Vallerand (1989) offre plusieurs avantages. Outre le caractère opérationnel des étapes suggérées, le processus de traduction utilise, comme chez Haccoun (1987), la traduction inversée. Les étapes proposées permettent en outre de vérifier tant la stabilité temporelle que la consistance interne et la validité de construit de la version traduite. Aussi, Vallerand (1989) prend en compte la dimension culturelle, notamment lors de l'évaluation du prétest, et des sujets évaluent l'ambiguïté et la pertinence des items. De plus, pour vérifier la validité de construit de la version traduite, cette méthode préconise l'utilisation de l'analyse factorielle confirmatoire lorsque la validité de l'instrument original a été éprouvée à l'aide d'analyse factorielle (Vallerand, Guay et Blanchard, 2000).

Selon Vallerand (1989), la réalisation de traductions fidèles et valides en langue française passent par sept étapes qui sont 1) la préparation de la version préliminaire par traduction inversée, 2) l'évaluation et la modification de cette version par une approche de type comité, 3) l'évaluation de la version expérimentale par prétest, 4) l'évaluation de la validité concomitante et de contenu, 5) l'évaluation de la fidélité, 6) l'évaluation de la validité de construit, et 7) l'établissement des normes. L'étape 4 n'a pu être respectée à cause de la non-disponibilité de sujets bilingues pour évaluer la validité concomitante. Pour ce même motif, la technique par analyse d'énoncés que suggère Haccoun (1987) n'a pu être retenue. Par ailleurs, l'étape 7 ne se révélait pas utile puisque l'instrument sera employé à des fins de recherche plutôt qu'à des fins cliniques. En plus d'être non pertinente, cette étape exige un large échantillon sollicitant ainsi inutilement un nombre élevé d'enseignants.

Sont rapportés ici les résultats de deux études portant sur la cinquième et la sixième étapes de la méthode utilisée. Une première étude permet de vérifier la stabilité temporelle, la consistance interne et la validité de construit à l'aide d'une analyse factorielle exploratoire. Une seconde étude permet d'évaluer, à l'aide d'analyses factorielles confirmatoires, la structure factorielle de l'Échelle d'autoefficacité des enseignants (ÉAEE).

Première étude

Méthode

Participants – Un échantillon de 314 étudiants (289 femmes et 35 hommes) en formation des maîtres en adaptation scolaire (n=58), en enseignement au préscolaire et au primaire (n=178), ou en enseignement secondaire (n=78) participent à celle-ci. Ils sont à mi-parcours de leurs études et leur âge moyen et de 22,2 ans. Parmi eux, 46 ont complété à deux reprises et à deux semaines d'intervalle, l'Échelle d'autoefficacité des enseignants afin d'en éprouver la stabilité temporelle.

Analyses – La fidélité de l'échelle a été éprouvée à l'aide de la corrélation test-retest et la consistance interne a été testée à partir des questionnaires complétés par les 314 participants à cette étude. Enfin, une analyse factorielle exploratoire a été faite sur les 16 items de l'échelle. À cette fin, une analyse factorielle en composantes principales comme procédure d'extraction avec rotation «varimax» a été effectuée.

Résultats – Les résultats figurent au tableau 1. Ce tableau montre que l'ÉAEE présente une bonne consistance interne (α = 0,71) et une bonne stabilité temporelle (rtest-retest= 0,83). Les résultats de l'analyse factorielle exploratoire montrent que l'ÉAEE reproduit bien le modèle théorique à deux dimensions, sauf pour l'item 14 (Un enseignement de qualité peut venir à bout de l'influence du milieu familial sur l'élève) qui semble poser un problème. En effet, contrairement à la structure théorique, il est davantage corrélé avec les items du facteur «sentiment d'efficacité personnelle» qu'avec ceux du facteur «sentiment d'efficacité générale». Un autre item semble aussi poser problème puisqu'il ne rencontre pas le seuil de rétention (0,32) que proposent Tabachnick et Fidell (2001) et que retient la présente étude (I16 Même un enseignant qui possède des habiletés à enseigner peut n'exercer aucune influence sur de nombreux étudiants). Cependant, il corrèle avec le facteur «sentiment d'efficacité générale» (0,24), mais pas avec le facteur «sentiment d'efficacité personnelle» (0,008). Enfin, le premier facteur explique 32,5% de la variance totale et le second, 24%. Par conséquent, la seconde étude du processus de validation prendra en compte l'item 16, mais ne prendra pas en compte l'item 14.

Tableau 1

Analyse factorielle exploratoire: stabilité temporelle (rtest-retest) et consistance interne (a) de l'échelle d'autoefficacité des enseignants

Analyse factorielle exploratoire: stabilité temporelle (rtest-retest) et consistance interne (a) de l'échelle d'autoefficacité des enseignants

-> Voir la liste des tableaux

Deuxième étude

Méthode

Participants – Les participants à cette étude sont 266 enseignants de 23 à 60 ans (moyenne d'âge = 41,7). Parmi ceux qui ont indiqué l'ordre d'enseignement, on en dénombre 25 au préscolaire, 129 au primaire, 91 au secondaire général et 18 en formation professionnelle. Cet échantillon compte 178 femmes et 88 hommes.

Les 15 items de l'ÉAEE retenus lors de la première étude ont été soumis à des analyses factorielles confirmatoires (version 5.6 du logiciel EQS; Bentler, 1995). Dans ce type d'analyses, les spécialistes ne s'accordent pas encore sur la manière de calculer la taille minimale requise pour ces échantillons (Pedhazur et Pedhazur-Schmelkin, 1991). Toutefois, plusieurs auteurs s'entendent pour recommander le recrutement d'au moins 200 participants (Crocker et Algina, 1986) alors que d'autres suggèrent un ratio de 4 (Pedhazur et Pedhazur-Schmelkin, 1991), voire cinq répondants (Nunally, 1978) par item. Dans le cadre de cette étude, un échantillon supérieur à 200 participants a été retenue. Cette taille correspond à un très bon ratio répondants/items: 20,4 (326/16).

Modèles éprouvés – Afin de vérifier la validité du construit, il convient, selon Anderson et Gerbing (1988), de tester plus d'un modèle à l'aide d'analyse factorielle confirmatoire. L'étude utilise donc deux modèles. Le premier éprouve une structure à deux dimensions où chacun des items est lié aux deux facteurs de premier ordre auxquels ils correspondent. Ce modèle postule, comme dans la version originale anglaise, l'indépendance des deux facteurs de premier ordre. Le second modèle est identique au premier, si ce n'est qu'il postule la covariance entre les facteurs de premier ordre.

Analyses – Comme l'ont fait Brodeur, Valois, Dussault et Villeneuve (1999), nous avons utilisé plusieurs indices pour estimer l'adéquation des modèles proposés, soit le niveau de correspondance entre la matrice des estimés théoriques et la matrice des estimés empiriques: a) la statistique du chi-carré (χ2), b) le rapport du chi-carré sur le nombre de degrés de liberté correspondant (χ2/dl), c) l'indice d'adéquation comparatif (Comparative Fit Index, CFI), et d) la version modifiée de l'Akaike Information Criterion (Consistent version of the AIC, CAIC) tel que l'a proposé Bozdogan (1987).

Bentler (1995) précise qu'un chi-carré non significatif indique que le modèle proposé offre une représentation adéquate des données. Sur le plan statistique, un test du chi-carré significatif révèle que le modèle n'est pas adéquat pour l'échantillon à l'étude. Toutefois, il ressort qu'une valeur du chi-carré significative n'indique pas nécessairement que le modèle proposé ne reproduit pas adéquatement les données de l'échantillon, car la statistique du chi-carré est très sensible à la taille de l'échantillon (Bentler et Bonett, 1980; Marsh, Balla, et McDonald, 1988). En effet, la probabilité que la valeur d'un chi-carré soit significative augmente avec la taille de l'échantillon. Par contre, Hayduk (1987) montre que le rapport du chi-carré sur le nombre de degrés de liberté correspondant (χ2/dl) permet de corriger, en partie, ce problème. Une valeur χ2/dl plus petite que 5 signifie habituellement que les données s'ajustent bien au modèle théorique proposé (Jöreskog et Sörbom, 1993). Le CFI, de son côté, varie entre 0 et 1 et provient de la comparaison entre le modèle proposé et le modèle nul (où aucun lien n'est postulé entre les variables). Les modèles présentant un CFI supérieur à 0,90 sont généralement jugés comme adéquats (Schumacker et Lomax, 1996). Enfin, le CAIC est un coefficient important, car il tient compte à la fois du degré d'ajustement du modèle et du nombre de degrés de liberté pour estimer quel modèle semble le plus approprié, soit lequel devrait avoir les plus petites valeurs de CAIC (Bentler, 1995).

Résultats – Les moyennes et écarts-types de chacun des 15 items retenus sont présentés au tableau 2. Celui-ci permet de voir que le niveau d'accord des enseignants à l'égard des items appartenant à la dimension «sentiment d'efficacité personnelle» est plus fort que le niveau d'accord des items appartenant à la dimension «sentiment d'efficacité générale».

Le premier modèle éprouve une structure à deux dimensions où chacun des items est lié aux deux facteurs de premier ordre auxquels ils correspondent. Pour ce modèle, l'indice CFI rencontre les critères d'un bon ajustement des données (CFI = 0,89). De plus, il présente une valeur de 1,85 pour l'indice χ2/dl et de -341,02 pour le CAIC. En bref, bien que ce modèle obtienne un chi-carré significatif qui voudrait dire qu'il ne reproduit pas adéquatement les données, il rencontre les critères d'un bon ajustement. Il constitue donc une bonne représentation des données.

Le deuxième modèle propose une structure qui vérifie également une structure à deux facteurs de premier ordre mais postule une covariance entre les facteurs de premier ordre. Les résultats du tableau 3 révèlent que l'indice d'ajustement associé à ce modèle est bas en ce qui concerne le CFI (modèle 2: CFI = 0,66 et CAIC = - 335,26). Par contre, le tableau montre aussi que ce modèle rencontre le critère d'un bon ajustement (χ2/dl=3,02). Ces résultats suggèrent, comme l'indique la valeur significative du chi-carré, que ce modèle à deux facteurs liés peut difficilement être jugé acceptable et que le premier modèle lui est supérieur.

Tableau 2

Moyennes et écarts-types des items du questionnaire de sentiment d'autoefficacité des enseignants (*=items inversés)

Moyennes et écarts-types des items du questionnaire de sentiment d'autoefficacité des enseignants (*=items inversés)

-> Voir la liste des tableaux

Tableau 3

Indices d'ajustement obtenus pour chacun des modèles théoriques éprouvés

Indices d'ajustement obtenus pour chacun des modèles théoriques éprouvés

-> Voir la liste des tableaux

En effet, les résultats montrent que les indices d'ajustement et de parcimonie du premier modèle sont supérieurs à ceux du second. En effet, le premier modèle présente des valeurs χ2/dl plus petites que celles du deuxième modèle (1,85 < 3,02 pour l'indice χ2/dl). De plus, la valeur du deuxième modèle n'approche pas le seuil recherché de 0,90, ce qui contribue aussi à appuyer la supériorité du premier modèle. Toutefois, la valeur de l'indice de parcimonie CAIC du premier modèle est similaire à celle du deuxième. Étant donné ces similitudes, il convient de vérifier les différences entre ces modèles.

Pour tester l'hypothèse selon laquelle le niveau d'adéquation du modèle théorique qui suppose l'indépendance des deux dimensions du questionnaire à l'étude est significativement différente du deuxième modèle qui suppose une dépendance entre les deux facteurs, les valeurs des chi-carrés de chacun des modèles sont comparées. Comme le souligne Byrne (1994), la différence entre deux distributions chi-carré suit elle-même une distribution chi-carré avec un nombre de degrés de liberté équivalant à la différence des degrés de liberté des deux modèles testés et peut, en conséquence, être testée statistiquement. Ainsi, les résultats de cette comparaison, qui apparaissent au tableau 4, suggèrent de rejeter l'hypothèse nulle selon laquelle les deux modèles testés sont identiques (p<0,01). Le premier modèle constitue donc une meilleure représentation des données que le deuxième.

Tableau 4

Comparaison des distributions du χ2 des modèles théoriques éprouvés

Comparaison des distributions du χ2 des modèles théoriques éprouvés

-> Voir la liste des tableaux

La solution standardisée du premier modèle est présentée à la figure 1. Elle montre notamment que l'item 6 (Quand un élève obtient une meilleure note que d'habitude, c'est généralement parce que j'ai trouvé des moyens plus efficaces de lui enseigner) et l'item 9 (Quand les notes de mes élèves s'améliorent, c'est habituellement parce que j'ai trouvé des méthodes d'enseignement plus efficaces) influencent le plus la dimension «sentiment d'efficacité personnelle», alors que l'item 12 (Si un élève ne se souvient pas des informations que j'ai transmises au cours précédent, je saurais quoi faire au cours suivant pour qu'il se les rappelle) est celui qui contribue le moins à ce facteur. En ce qui concerne le facteur «sentiment d'efficacité générale», seul l'item 15 (Même un enseignant qui possède des habiletés à enseigner peut n'exercer aucune influence sur de nombreux étudiants) se distingue des autres en ce sens qu'il s'agit de l'item contribuant le moins au facteur. Les autres items présentent une contribution équivalente.

Figure 1

Solution standardisée de l'analyse factorielle confirmatoire de l'échelle d'autoefficacité des enseignants

Solution standardisée de l'analyse factorielle confirmatoire de l'échelle d'autoefficacité des enseignants

-> Voir la liste des figures

Conclusion

Cette étude visait à traduire et à valider en langue française le Teacher efficacy scale (Gibson et Dembo, 1984). Les résultats indiquent que le modèle où les deux facteurs de premier ordre (sentiment d'efficacité personnelle et sentiment d'efficacité générale) sont indépendants représente le mieux la structure factorielle de l'échelle d'autoefficacité des enseignants. Les analyses factorielles réalisées sur les items de l'ÉAEE confirment dans une large mesure la validité de construit du test et mettent en relief le caractère bidimensionnel du concept d'autoefficacité, et ce, auprès d'étudiants en formation des maîtres et auprès d'enseignants en exercice. Ceci appuie le construit théorique de Bandura (1977, 1982, 1997) et les intentions de Gibson et Dembo (1984). En effet, les études qui vérifient la validité de la version anglaise (Coladarci et Fink, 1995; Gibson et Dembo, 1984; Saklofske et al., 1988, par exemple) n'effectuent pas d'analyse factorielle confirmatoire. Dans cette perspective, en suggérant que l'ÉAEE produit des résultats qui confirment la structure théorique de la version anglaise, les résultats de la présente étude ajoutent à la valeur métrologique de cette dernière version. D'un point de vue scientifique, parce qu'il offre de bonnes qualités métrologiques, ce questionnaire pourra contribuer à décrire empiriquement le sentiment d'autoefficacité des enseignants. Cette description s'inscrira toujours, comme Bandura, dans une perspective néo-béhavioriste. Il pourrait être intéressant d'examiner la contribution d'autres cadres théoriques à l'étude du concept d'efficacité professionnelle perçue par l'individu. L'utilisation de l'ÉAEE dans les futures études aboutira certes à l'avancement des connaissances sur l'autoefficacité des enseignants. En somme, cette étude donne une image probante des qualités psychométriques de l'ÉAEE. Cependant, d'autres études devront être conduites afin de poursuivre l'exploration de la validité prédictive de l'instrument, puisqu'un processus de validation n'est jamais terminé et que tout instrument doit sans cesse être éprouvé.