Article body

INTRODUCTION

L’observation a été pendant longtemps une méthode de recherche privilégiée. C’est l’activité fondatrice du savoir en psychologie (Mucchielli, 1996) et cette méthode marque les découvertes : Pfungst et l’observation du cheval Hans (Pfungst, 1911), Piaget et l’observation de ses enfants (Piaget, 1948), Harlow et l’observation des singes (Harlow, Dodsworth et Harlow, 1965; Harlow et Zimmerman, 1959). Le but de cet article est d’illustrer par un exemple pratique, les considérations théoriques et méthodologiques à retenir afin de mener une recherche par observation. Ce texte présente exclusivement une démarche d’observation et expose les défis méthodologiques rencontrés lors du développement d’une grille d’observation ayant pour but de recueillir des informations sur les interactions prenant place entre des enseignants et leurs élèves présentant une déficience intellectuelle (DI) lorsque ces derniers émettent des troubles du comportement (TC).

Les TC peuvent être définis comme « une action ou un ensemble d'actions qui est jugé problématique parce qu'il s'écarte des normes sociales, culturelles ou développementales et qui est préjudiciable à la personne ou à son environnement social ou physique » (Tassé, Sabourin, Garcin et Lecavalier, 2010, p. 68). Les enfants présentant une DI sont plus à risque de présenter des TC que les enfants typiques (Baker et al., 2003; De Ruiter, Dekker, Verhulst et Koot, 2007; Einfeld et Tonge, 1996; Eisenhower, Baker et Blacher, 2005; Wallander, Koot et Dekker, 2003; Will et Wilson, 2014). Les recherches démontrent qu’entre 10 % et 60 % des personnes présentant une déficience intellectuelle, tous âges confondus, présentent des TC (Emerson et Bromley, 1995; Fox, Dunlap et Cushing, 2002; L'Abbé et Morin, 2001; Willaye et Magerotte, 2008). Cet écart peut, entre autres, être expliqué par le fait que la terminologie utilisée pour ces comportements est variable, que les méthodes de mesure de ce concept sont diverses (McClintock, Hall et Oliver, 2003) et que les échantillons et les définitions utilisés sont différents (Benson et Brooks, 2008).

Que les troubles soient verbaux ou physiques, ils ont un effet sur le bon déroulement de la vie et le bien-être de la personne (Emerson, 2000; Emerson et Einfeld, 2011; Fox et al., 2002; L'Abbé et Morin, 2001). Ils représentent entre autres des obstacles majeurs pour son intégration sociale (Emerson et Einfeld, 2011; Reeve et Carr, 2000), entravent sérieusement le développement scolaire d’un enfant (French et Conrad, 2001, Westling, 2010) et ont donc d’importantes conséquences sur son évolution sociale et développementale (Embregts, Didden, Huitink et Schreuder, 2009; Hudson etal., 2003). Les recherches scientifiques démontrent aussi que les TC génèrent des situations difficiles à gérer pour les familles, les intervenants et les enseignants (Baker etal., 2003; Emerson et Einfeld, 2011; Fox etal., 2002; Hastings, 2002; L'Abbé et Morin, 2001; Male, 2003).

Certains chercheurs ont constaté que les interactions entre les intervenants et les personnes présentant une DI jouent un rôle dans le développement ou le maintien des TC (Embregts etal., 2009; Hastings et Brown, 2000; Hastings et Remington, 1994) et pourraient influencer la nature, la sévérité et la fréquence de l’émission de troubles du comportement (Hastings, 2005). Plusieurs écrits abordent cette thématique (Cudré-Mauroux, 2010; Lambrechts, Kuppens et Maes, 2009; Lambrechts, Van Den Noortgate, Eeman et Maes, 2010; Wanless et Jahoda, 2002; Zijlmans, Embregts, Bosman et Willems, 2012) mais seulement quelques recherches ont étudié (Alevriadou et Pavlidou, 2015; Kelly, Carey, McCarthy et Coyle, 2007; Male et May 1997a, 1997b; Rae et Murray, 2011; Westling, 2010) ou observé (Hastings, 1997, 2005; Mossman, Hastings et Brown, 2002) spécifiquement les interactions entre les enseignants et leurs élèves.

Les troubles de comportements auraient un impact négatif sur les enseignants (Kelly etal., 2007; Male, 2003; Male et May 1997a, 1997b). Kelly et ses collaborateurs (2007) démontrent que 93 % des enseignants travaillant avec des élèves présentant une DI et des TC vivent beaucoup de stress et souffriraient d’épuisement émotionnel. Ils n’auraient pas suffisamment de soutien psychologique, social et psychiatrique pour intervenir auprès d’élèves ayant un double diagnostic (DI et TC) (Kelly et al., 2007). Westling (2010) corrobore ces résultats et illustre que le niveau de stress des enseignants en classe spéciale augmente lorsqu’ils doivent faire face à des TC et que les enseignants rapportent ne pas avoir assez de formation pour intervenir. Également, la qualité de leur enseignement serait affectée, car la gestion des TC prend beaucoup de temps et nécessite des interventions fréquentes (Guikas, 2015; Westling, 2010).

Alevriadou et Pavlidou (2015) établissent, dans une étude menée auprès de 177 enseignants, que ceux-ci ressentiraient des émotions négatives et une réticence à soutenir leurs élèves lorsqu’ils estiment que la cause du TC est contrôlable par ces derniers. Or d’après les résultats de leur recherche, les enseignants considèreraient généralement que les élèves présentant une DI contrôlent leurs TC (Alevriadou et Pavlidou, 2015). Enfin, il a été illustré dans un contexte de classe ordinaire que les enseignants ont des interactions négatives avec les élèves ayant des TC durant 20 % du temps et seulement durant 5 % du temps des interactions positives (Jack etal., 1996) et que ce type de situation peut éveiller des émotions négatives (Tsouloupas, Carson, Matthews, Grawitch et Barber, 2010).

Sachant que peu de recherches ont étudié les interactions entre les enseignants et les élèves présentant à la fois une DI et des TC (Hastings, 2005; Male, 2003; Savoie et Gascon, 2008); qu’au Québec, environ 66 % des enfants ayant une incapacité, comme une DI, sont scolarisés dans des classes spéciales (Commission des droits de la personne et des droits de la jeunesse, 2007); et que l’intégration en classe ordinaire est contre indiquée lorsqu’un élève présente un risque pour lui-même ou pour son environnement (Ministère de l'Éducation, du Loisir et du Sport, 2011), l’intérêt d’observer précisément ce qui se passe dans un contexte de classe spéciale apparait pertinent (Alevriadou et Pavlidou, 2015). L’observation directe semble indiquée afin d’identifier les schémas comportementaux existant entre les enseignants et les enfants présentant une déficience intellectuelle et des TC. Ceci aiderait à mieux comprendre les comportements des enseignants (Dowdney, Mrazek, Quinton et Rutter, 1984; Gardner, 2000; Smit, Van de Grift, De Bot et Jansen, 2017; Walker, Colvin et Ramsey, 1995) et pourrait éventuellement aider à déterminer les effets d’une intervention qui serait mise en place (Blondin, 2005; Eddy, Dishion et Stoolmiller, 1998).

L’observation directe permet, en effet, de recueillir des données sur ce que font les individus en milieu naturel (Cohen, Manion et Morrison, 2013; Gillham, 2008) et elle donne accès à ce qui se passe au-delà du discours, à savoir aux comportements (Arborio et Fournier, 2005; Blondin, 2005; Cohen et al., 2013; Wragg, 2012). Bien que l’observation directe soit sujette à la désirabilité sociale (Norimatsu et Pigem, 2008) elle habilite le chercheur à dresser un portrait exhaustif d’une situation en milieu naturel et est particulièrement conseillée lorsque des interactions sociales sont le sujet d’intérêt (Gardner, 2000), ici, la rencontre entre les enseignants et les enfants présentant une déficience intellectuelle. Cette méthode aide le chercheur à décrire les comportements des protagonistes et à comprendre comment les actions d’un individu retentissent sur les actions de l’autre, permettant ainsi l’analyse d’échanges complexes entre deux personnes (Wragg, 2012).

De même, il a été démontré que l’observation directe est particulièrement utile lorsque les comportements agressifs ou antisociaux sont le sujet d’étude (Gardner, 2000). La connaissance de la fréquence des comportements offre la possibilité de déterminer l’évolution de ces comportements. Or, il peut être difficile pour les enseignants de rendre compte précisément de leurs actes à travers des questionnaires (Cohen etal., 2013; Margolin etal., 1998). Les évènements se succèdent rapidement et plusieurs comportements peuvent arriver en même temps (Elmes, Kantowitz et Roediger, 2003). Les enseignants peuvent ne pas se rappeler exactement des évènements, les sous-estimer ou les surestimer et la quantité de stimuli rend la transcription ardue (Gardner, 2000). Les émotions, les perceptions, la compréhension, la mémoire, etc. sont en effet des variables qui modifient la réalité et altèrent les propos de chacun (Cohen etal., 2013; Mucchielli, 1996).

Afin de mener à bien une étude utilisant l’observation, une réflexion poussée sur le sujet d’étude doit être initiée préalablement afin d’analyser la faisabilité du projet (Arborio et Fournier, 2005; Elmes etal., 2003; Falardeau et Simard, 2011; Hill, Charalambous et Kraft, 2012). Particulièrement, dans un contexte de classe, où les observables sont multiples, une définition des factuels est essentielle (Arborio et Fournier, 2005). Le défi du chercheur est donc de trier l’information recueillie, de repérer les enchaînements d’actions et de faire un choix des observables.

C’est dans cette perspective que cet article présente les considérations théoriques et méthodologiques entourant l’observation dans un contexte scolaire et décrit les étapes de développement d’une grille d’observation construite d’après le modèle de Strayer et Gauthier (1982). La grille mesure les comportements des enseignants face aux TC manifestés par des enfants présentant une déficience intellectuelle âgés de 4 à 8 ans dans un contexte de classe spéciale. L’article est divisé selon les phases de développement de la grille d’observation soit : a) phase descriptive; b) phase exploratoire; c) évaluation systématique. Les appuis théoriques, les procédures réalisées et les résultats découlant de la démarche d’expérimentation sont présentés pour chacune de ces phases.

MÉTHODE

Strayer et Gauthier (1982) proposent un modèle de développement des grilles d’observation du comportement humain inspiré de l’approche éthologique utilisée en sciences humaines (Connelly, 2006; Dufresne, 1991; Mertan et Nadel, 1991). Ils se basent sur une approche dite rationnelle combinant la théorie à la pratique et suggèrent un développement en trois temps, à savoir une phase descriptive, une phase exploratoire et une évaluation systématique.

Première étape de la recherche : la phase descriptive

Avant de commencer à observer officiellement, une première phase descriptive (Strayer et Gauthier, 1982) est préconisée afin de décrire le comportement de participants observés de façon informelle. Pour cela, Strayer et Gauthier (1982) recommandent de faire une recension des écrits sur l’objet d’étude et de mener des périodes d’observation non structurées. Cette démarche permet la description et l’identification du plus large éventail possible des gestes posés par les participants. C’est l’occasion pour le chercheur de se familiariser avec le milieu, de décrire le contexte social, l’environnement physique où aura lieu la recherche et de déterminer l’effet des variables environnementales. Ceci permet l’élaboration d’une liste descriptive des comportements et l’identification des critères d’inclusion.

Dans le cadre de la présente recherche, la recension des écrits a porté sur les comportements des intervenants envers les personnes présentant une déficience intellectuelle de tout âge. Tout type de méthode était inclus (questionnaires, entrevues ou mises en situation), le but étant de définir les comportements ciblés par les écrits scientifiques. Les écrits portant sur l’observation d’enfants sans DI dans divers milieux (école, milieu familial, milieu hospitalier, etc.) et dans diverses situations (observation naturelle versus observation en laboratoire) étaient également inclus. Les études observant des enfants à l’école et observant des enfants sans DI ayant des TC ont été privilégiées. La recension des écrits a permis d’élaborer une liste descriptive de comportements observables.

Des périodes d’observation non structurée ont ensuite été menées en milieu hospitalier et en milieu scolaire. Deux périodes d’observation de trois heures ont été faites dans une unité d’hospitalisation de long séjour qui accueille des enfants présentant une déficience intellectuelle ou un trouble du spectre de l’autisme (TSA) et qui présentent des TC. Une jeune de 8 ans présentant une déficience intellectuelle et des TC a été observée. Durant cette observation non structurée, les TC de la jeune et les réactions des intervenants étaient notés dans un journal de bord. Diverses notes et réflexions relatives au contexte de la recherche et aux situations observées ont été consignées. Subséquemment, deux périodes d’observation non structurée de trois heures chacune ont également été menées dans une classe spéciale et l’observation a été réalisée de façon similaire à celle utilisée en milieu hospitalier.

La combinaison théorique (comportements identifiés dans les écrits scientifiques; Forget, 1981; Forget et Otis, 1984; Harris, 1995; Harris, Cook et Upton, 1996; Kiernan et Kiernan, 1994 ; Klein-Tasman et Lee, 2017; Lambrechts et al., 2009; Lambrechts etal., 2010; Male, 2003; Poirier, 1996; Rivard, 2011; Soltau, Biedermann, Hennicke et Fydrich, 2015; Will et Wilson, 2014) et empirique (comportements observés et notés dans le journal de bord) a permis de décrire d’une part les comportements émis par des enseignants lorsqu’un enfant avec une DI manifeste des TC et d’autre part les TC des élèves. Ces comportements ont été classés en catégories et une première grille d’observation a été construite. La grille faisait état de 24 comportements divisés en deux catégories à observer chez les enseignants : comportements verbaux (par exemple : enseigne le bon comportement, réprimande) ou physiques (par exemple : donne quelque chose, fait une contention physique). En ce qui concerne les élèves, 16 comportements avaient été répertoriés en deux catégories, soit : agression envers autrui (par exemple : fonce sur autrui, tire les cheveux) et destruction des biens (par exemple : casse les objets, déchire).

Par la suite, cinq experts ont commenté et évalué la grille d’observation. Le comité d’experts était composé d’un professeur universitaire spécialisé en DI, d’un enseignant en classe spéciale, d’un psychologue scolaire et de deux étudiants du doctorat en psychologie, spécialisés en observation. Les experts avaient en main la grille à évaluer, le protocole de recherche et un canevas d’évaluation. Le canevas d’évaluation questionnait la clarté de la grille, les catégories de comportements, le format de la grille, le type de cotation, etc. Leurs commentaires ont permis de souligner l’importance de décrire plus précisément chaque comportement (définition précise du comportement accompagnée d’exemples et de contre-exemples), d’ajouter des comportements précurseurs aux TC (par exemple : ne suit pas les consignes) et de repenser le format de la grille. La structure de la grille a été complètement retravaillée suite aux commentaires des experts. Trois des experts ont ensuite été rencontrés afin d’affiner les modifications apportées à la grille. Le recours à un comité d’experts a contribué à la validité du contenu de la grille grâce à l’expertise de chacun des membres du comité.

Deuxième étape de la recherche : la phase exploratoire

Dans un deuxième temps, Strayer et Gauthier (1982) recommandent une phase dite exploratoire qui consiste à étudier la liste des comportements développée durant la phase descriptive. Pour réaliser cet objectif, le chercheur mène une observation souple (observation ad lib) concernant l’enregistrement et l’échantillonnage afin de recueillir des informations concernant les variables sélectionnées, les items comportementaux, le choix du type d’enregistrement à privilégier et la méthode de cotation qui sera utilisée pour l’étude. Cette phase fait référence à la pré-expérimentation de la grille. Cette étape aide à choisir le type d’observation qui sera utilisé, soit : faire de l’observation participante (Norimatsu et Pigem, 2008); faire de l’observation incognito (Arborio et Fournier, 2005); faire de l’observation en milieu naturel versus en laboratoire (Kohn et Nègre, 2003); et définir le type d’enregistrement (coter les comportements sur place ou filmer les situations). Le choix du type d’observation est crucial puisqu’il aura un effet direct sur les résultats des observations. Cette étape permet aussi de résoudre les difficultés techniques, et d’évaluer la faisabilité du projet (Van der Maren, 2014). Durant cette phase le chercheur a pour but de définir précisément les comportements à observer (proposition d’exemples et de contre-exemples) et de supprimer les comportements non pertinents afin d’élaguer la grille d’observation.

Observation libre. Dans le cadre de cette recherche, de l’observation libre a été menée dans quatre classes spéciales pour pré-expérimenter la grille. Quatre enseignants travaillant avec des enfants présentant une déficience intellectuelle et présentant des TC âgés entre 4 et 8 ans ont été observés. La chercheuse a mené une séance d’observation libre de trois heures auprès de chaque enseignant (total de 12 heures d’observation). Durant l’observation, la chercheuse a utilisé la grille et a consigné dans un journal de bord des réflexions, notamment en ce qui a trait aux comportements des enseignants et des élèves, à l’organisation de la classe, aux règles de chaque classe, etc. Cette pré-expérimentation a permis d’ajouter, de supprimer des comportements et de définir ce qui était observable et mesurable. Par exemple, des comportements tels que l’utilisation de contention chimique ou l’isolement sont des comportements qui ont été supprimés étant donné qu’ils n’étaient pas ou très peu utilisés en contexte scolaire.

Une fois la grille modifiée, celle-ci a été soumise à 12 étudiants de psychologie de niveau doctoral, spécialisés en DI et TC. La grille ainsi qu’un document incluant des questions quant à la clarté des définitions des comportements, des exemples donnés pour chaque comportement et de leur catégorisation ont été envoyés à l’avance par courriel. Une session de travail a suivi l’envoi et chaque comportement a été discuté et analysé. La rencontre a permis de détecter des chevauchements entre certains comportements et donc de préciser leurs définitions. La terminologie de certains comportements a été revue et certains comportements ont été retirés (par exemple, le comportement « offre de l’aide » considéré comme étant trop vague et difficilement cotable). Ceci a permis d’assurer une certaine validité de contenu pour la grille étant donné que l’atteinte d’un consensus entre les membres d’un comité permet de valider le processus (Muckler, 1992).

Type d’observation. Tel que l’expliquent Arborio et Fournier (2005), le type d’observation retenu doit tenir compte du sujet de recherche. Dépendamment du type d’observation choisi, l’observé peut plus ou moins réagir à l’observation et par conséquent moduler son comportement (réactivité de l’observé aussi appelé l’effet Hawthorne; Cohen, Manion et Morrison, 2002; Gardner, 2000; Harris et Lahey, 1982b; Mucchielli, 1996; Norimatsu et Pigem, 2008). En effet, un observateur ne peut être complètement extérieur à la situation et l’observation naturelle ou en laboratoire peut être intrusive pour les participants observés et entraîner des réactions qui leur sont inhabituelles. Les personnes observées peuvent être sensibles à la désirabilité sociale et peuvent se sentir jugées lors de l’observation (Desimone, 2009; Mucchielli, 1996) et être enclines à se comporter de manière conforme aux normes sociales, mais de façon non conforme à ce qu’elles font habituellement.

Pour pallier à cette situation, le chercheur peut faire de l’observation participante et ainsi endosser un rôle existant dans la situation donnée ou faire de l’observation incognito (Arborio et Fournier, 2005). Mais ces types d’observation ne sont pas une option dans un contexte de classe étant donné que tout membre extérieur est systématiquement remarqué. Afin de minimiser la réactivité de l’observé, le choix d’une méthode d’observation étant la moins intrusive possible est privilégié. Une façon de faire est de filmer (méthode choisie pour la présente recherche), ce qui permet d’avoir un médium entre l’observateur et l’observé. De plus il a été démontré que le recours à l’enregistrement vidéo est incontestable pour ce qui est de la finesse du recueil des données dans un contexte de classe (Brunvard, 2010; Clanet, 2005; Van der Maren, 2014). La vidéo donne en effet accès à l’intégralité des actions-réactions qui prennent place en classe (Clanet, 2005) et permet une observation « en profondeur » (Ulewicz et Beatty, 2001; Van der Maren, 2014).

Natta et ses collaborateurs (1990) proposent aussi d’instaurer une période d’acclimatation qui consiste, par exemple, à ne pas prendre en considération les cinq premières minutes de l’observation afin que les résultats ne soient pas biaisés par le stress que peut engendrer l’observation et pour permettre aux participants d’oublier la présence de la caméra. Il semblerait que plus les personnes observées sont jeunes, moins le problème de réactivité est aigu (Ketele, 1987; Schoggen, 1964). Aussi, Rankin et ses collaborateurs (2009) expliquent qu’il est difficile de ne pas se comporter de façon naturelle et de s’éloigner longtemps des attitudes et des patrons de comportements sociaux. De même, Harris et Lahey (1982b) expliquent qu’il y a un effet d’habituation avec le temps et la réactivité des participants diminue étant donné qu’ils oublient qu’ils sont observés (Gardner, 2000; Ketele, 1987). Pour que l’observation à découvert reflète la réalité, le temps d’observation doit donc être assez long afin que les comportements naturels reprennent place. Dans le cas présent, les trois premières heures de vidéos pour chaque enseignant n’ont pas été utilisées. De plus, l’observation libre menée pendant la phase exploratoire a permis aux enseignants de s’habituer à la présence de la chercheuse. Lors de la collecte de données, un nombre restreint d’observateurs a également été privilégié (quatre incluant la chercheuse et un seul observateur sur place à la fois). Les observateurs faisaient ainsi partie du quotidien, ce qui a favorisé un phénomène « d’habituation ».

Développement du système de codification. La pré-expérimentation de la grille d’observation permet aussi de s’assurer de l’utilité du système de codification (représentation de la réalité du milieu, codage clair et assez exhaustif). Le codage peut se faire manuellement ou informatiquement en utilisant des logiciels tels que The Observer, Mangold,Actogram-Kronos, Transana, etc., ce qui permet de tester la grille et de faire des ajustements au besoin. Lorsqu’un logiciel est utilisé, le codage se fait après la période d’observation. Ces outils informatiques habilitent le chercheur à faire des essais et à retravailler la grille autant de fois que nécessaire sans perdre de données, ce qui est impossible avec une observation en temps réel. De surcroît, même après le début du codage, le chercheur peut décider de rajouter un comportement auquel il n’avait pas pensé et recoder les vidéos (Casabianca etal., 2013). Pour la présente recherche, le logiciel The Observer XT (Noldus Information Technology, 2012) a été utilisé. Chaque vidéo a été numérisée et importée dans le logiciel et chaque unité de comportement de la grille a été enregistrée et programmée. Pour enregistrer les comportements, une clef de codage a été associée à chaque unité comportementale de la grille (voir Tableau 1 et Tableau 2). L’utilisation du logiciel offre la possibilité de mener des micro-analyses du comportement. Les comportements invisibles à l’oeil nu deviennent observables, l’image peut être visionnée au ralenti pour une cotation plus fine, la cotation peut être vérifiée et des corrections nécessaires peuvent être apportées (Norimatsu et Pigem, 2008; Ulewicz et Beatty, 2001; Van der Maren, 2014).

Il est aussi important de tester la codification afin de s’assurer de sa faisabilité tout en vérifiant la pertinence du type d’observation et des comportements retenus. Il faut également s’assurer que les catégories de comportements ne se recoupent pas. L’ensemble de la démarche permet aussi de vérifier que l’observation ne génère pas des résultats trop spécifiques et représente la réalité du milieu, soit les comportements présents au quotidien (Gardner, 2000).

Méthode de cotation. Il existe différentes façons d’observer un phénomène, dont l’observation par intervalle ou l’observation continue. L’observation par intervalle est utilisée lorsque les observables sont fréquents et que l’information sur la durée du comportement n’est pas nécessaire (Champoux, Couture et Royer, 1992). L’observation continue a été choisie pour la présente étude. C’est une observation sans interruption (Champoux et al., 1992; Gillham, 2008) utilisée lorsque les comportements sont plus rares. L’observation continue peut reposer sur un évènement, ici l’émission d’un TC et les séquences d’observation débutent au moment où un comportement ciblé est émis (Dowdney etal., 1984; Norimatsu et Pigem, 2008).

Dans la présente étude, le codage est amorcé dès qu’un élève émet un comportement répertorié dans la grille (voir Tableau 1 et Tableau 2). Par exemple, lorsqu’un enfant émet un comportement de type « endommage le matériel », alors une séquence d’observation est lancée. Le codeur inscrit le code associé au comportement « endommage le matériel » et enregistre ensuite la réponse de l’enseignant par exemple, « explique les conséquences ». Si le comportement de l’enfant est stoppé, le codeur met fin à la séquence d’observation. Si le comportement continue et que l’enseignant met en place d’autres interventions, le codeur les enregistre et consigne les actions subséquentes de l’enfant jusqu’à ce que le comportement s’arrête.

Dernière phase : l’évaluation systématique

L’évaluation systématique (Strayer et Gauthier, 1982) consiste en la mise en application de la grille auprès d’un échantillon suffisamment grand et diversifié pour pouvoir tester les hypothèses et généraliser les résultats. Pendant cette phase, le chercheur choisit un échantillonnage et un horaire d’observation (Blondin, 2005, Strayer et Gauthier, 1982) qui permet d’évaluer le degré de généralisation de l’objet d’étude. L’application de la grille d’observation pour la présente étude est présentée dans les prochaines sections. 

Dans notre étude, la grille définitive s’intéresse au contexte situationnel et propose trois catégories de comportements à observer chez l’enseignant et chez l’élève : les comportements physiques, verbaux et les autres comportements. Il faut mentionner que le nombre de comportements à observer est influencé par le type de support utilisé pour l’observation. L’observation en temps réel restreint le nombre de comportements observables par les coteurs. Dans la présente recherche, plusieurs comportements pouvaient être observés puisqu’ils étaient filmés et qu’un logiciel était utilisé pour en faire la cotation. Le Tableau 1 et le Tableau 2 présente les catégories et les comportements à observer tant chez l’élève que chez l’enseignant.

Participants. Dans la présente étude, l’observation a eu lieu dans des classes spéciales et les participants sont 8 enseignants et 12 élèves. Les huit enseignants sont majoritairement des femmes (n = 6) et leur âge varie entre 31,7 et 47,5 ans (M = 40,9, SD = 8,73). Les enseignants travaillent en éducation spécialisée en moyenne depuis 12,6 ans. Six sont titulaires d'un diplôme de premier cycle, un d’un diplôme de maîtrise et le dernier, d’un diplôme collégial. Sur les huit enseignants, sept enseignants (88 %) disent avoir reçu une formation en DI et cinq (63 %) ont été formés aux TC. Chaque enseignant avait une classe de neuf élèves en moyenne et ils rapportent avoir un à quatre élèves présentant des TC. Le critère d’inclusion pour permettre aux enseignants de participer à la recherche était d’avoir travaillé au moins trois mois avec le même groupe d'élèves.

Les 12 élèves (10 garçons) sont âgés entre 4,9 et 7,7 ans (M = 6,5, SD = 0,81). Ils ont une DI légère et présentent des TC. Quatre participants (33 %) présentaient un syndrome génétique, trois avaient un trouble de santé mentale (25 %) et 11 (82 %) pouvaient communiquer verbalement. Chaque élève avait un plan d'intervention individualisé à son dossier. Pour participer à la recherche, les élèves devaient remplir les trois critères d’inclusion suivants : (a) avoir un diagnostic de DI; (b) présenter des TC qui se manifestent envers les autres ou envers l'environnement et; (c) être âgé entre 4 et 8 ans. Le psychologue scolaire de l’école a été consulté afin de s’assurer que les participants répondaient bien aux critères. Les enfants ayant un TSA étaient exclus de l'étude étant donné que les services implantés auprès de ces jeunes diffèrent grandement de ceux des enfants présentant une déficience intellectuelle (type, fréquence ou de durée des interventions; Ministère de l'Éducation, du Loisir et du Sport, 2006).

Contexte et procédure. La recherche a été approuvée par le comité éthique de l’Université du Québec à Montréal. Au total, cinq écoles ont été sollicitées pour participer à la recherche et une seule a accepté de participer. Deux séances d’informations ont été données au psychologue de l’école et aux enseignants afin de leur expliquer le déroulement de l’étude et répondre à leurs questions. Huit enseignants spécialisés ont été sollicités et ont donné leur consentement à participer à la recherche. Les enseignants ont ensuite communiqué avec les parents de chaque élève présent dans leur classe afin de demander leur consentement pour que leur enfant soit filmé. Les enseignants ont fait parvenir une lettre présentant le projet et un formulaire de consentement à chaque famille. Ils ont contacté 53 familles au total et 52 familles ont donné leur consentement. L’équipe de recherche n'a pas filmé la classe lorsque l’élève dont la famille n’a pas donné de consentement pour participer à l’étude était présent. Les enseignants ont complété des fiches sociodémographiques pour eux-mêmes et leurs élèves.

Horaire d’observation. Les participants ont été filmés pendant 6 mois dans leur milieu naturel (classes spéciales) pour un total de 60 heures. Les moments d’observation et la durée des séances d’observation ont été variables. Étant donné que l'observation a été effectuée dans les classes, la chercheuse a dû adapter les périodes d'observation à l'horaire des enseignants. L’enseignant fournissait d’une semaine à l’autre les plages horaires où il pouvait accueillir un observateur dans sa classe. Lorsque des activités spéciales étaient organisées ou lorsque d’autres personnes ne participant pas à l'étude étaient présentes en classe (un stagiaire par exemple), les observateurs ne se présentaient pas en classe. De même, il arrivait que les enseignants annulent les séances d’observations prévues en raison d’imprévus ou d’évènements spéciaux de dernière minute. Cette conjoncture a entraîné de multiples changements dans le calendrier d'observation et a nécessité des ajustements constants. La chercheuse n’a donc pas pu contrôler complètement les conditions d’observation (moments d’observation, durée des séances, type d’activité observé). Tous les types d’activités menés en classe ont été filmés. Généralement les observations avaient lieu le matin et s’échelonnaient sur une période d’une à trois heures. Un seul observateur était présent en classe pour filmer. La chercheuse ou un(e) assistant(e) de recherche était présent à peu près deux fois par semaine.

Les défis de la cotation. Dans la présente recherche, le codage d’une heure de vidéo a nécessité en moyenne cinq heures de codage. Pour pallier à un éventuel problème de fidélité, diverses analyses d’accords inter-juges et intra-juges doivent être réalisées (Aspland et Gardner, 2003; Cohen etal., 2002; Cone, 1999; Gardner, 2000; Hintze, 2005). Un accord inter-juge de : k = 0,79 (Cohen, 1960) et un accord intra-juge, calculé à six mois d’intervalle, de k = 0,86 (Cohen, 1960), ont été atteints sur 10 % du matériel (soit six heures). La sélection des vidéos utilisées pour effectuer le calcul des accords a été faite au hasard. Une formation systématique a été donnée aux deux codeurs en l’occurrence deux étudiants de psychologie (un du premier cycle universitaire et un du troisième cycle universitaire). Dans un premier temps, une explication de la grille a été fournie aux codeurs. Ceux-ci ont dû mémoriser l’outil et une évaluation informelle a été réalisée où des questions portant sur le type de comportement et des exemples de situations ont été passés en revue. La chercheuse a ensuite présenté le matériel de recherche et procédé à la cotation avec les codeurs.

Tableau 1

Grille d'observation des comportements des enseignants

Grille d'observation des comportements des enseignants

-> See the list of tables

L’apprentissage du codage est un long processus. Sa durée est variable d’un observateur à l’autre. D’abord, le chercheur code les vidéos tout en expliquant la logique du codage à l’observateur. Ce dernier code ensuite à son tour tout en étant accompagné par le chercheur. Durant cette période le chercheur en profite pour questionner le codeur sur ses choix. Lorsque le codeur est prêt à observer seul, un accord inter-juge est calculé. Si l’accord est supérieur à 75 %, le codeur peut faire de l’observation de manière autonome (Cohen, 1960; Sattler, 1992). Dans le cas contraire, une analyse plus minutieuse est réalisée afin de déterminer et de travailler les points de discordance entre le chercheur et le codeur. Par exemple, dans le cas de la présente étude, un bon accord inter-juge a été plus difficile à atteindre concernant les comportements verbaux (distinction entre les comportements « fait du bruit » et « crie ») comparativement à la cotation des comportements physiques. En effet, les comportements physiques sont plus évidents et plus faciles à repérer que les comportements verbaux (l’intonation, le ton de la voix, etc. variant d’une personne à l’autre). Afin de traiter les unités de désaccords pour les comportements verbaux, la chercheuse a donné des exemples pour chaque unité comportementale et a visionné avec chaque codeur des moments où les comportements pouvaient être observés. Cet exercice a été perpétué jusqu’à ce qu’un accord satisfaisant soit atteint pour ces catégories de comportement.

Tableau 2

Grille d'observation des comportements des enfants

Grille d'observation des comportements des enfants

-> See the list of tables

Afin de coder adéquatement, il est aussi nécessaire de connaître les règles de l’environnement, soit dans le cas présent, le règlement de chaque classe. Par exemple, le comportement « ne suit pas les consignes » change d’une classe à l’autre dépendamment des règles instaurées par l’enseignant. Ainsi, le chercheur doit garder en tête la règle de départ et faire preuve de rigueur et de constance pour un codage de comportements humains où il y a place à la subjectivité.

Les recherches démontrent en effet que les attentes de l’observateur (notamment l’effet Rosenthal) peuvent influencer les résultats obtenus (Bell et al., 2012; Cohen et al., 2013; Droz, 1984; Harris et Lahey, 1982a; Malcuit, Pomerleau et Maurice, 1995). Par exemple, lorsqu’un codeur considère que les enseignants sont trop stricts avec leurs élèves, il est possible de penser que son codage pourrait être influencé par cette croyance. Pour remédier à cela, une formation avec une définition standardisée des comportements à observer doit être fournie aux observateurs afin qu’il y ait peu de place pour l’interprétation (Hill et al., 2012). Le chercheur définit les catégories à observer et donne des exemples et des contre-exemples des comportements appartenant à celles-ci. Ensuite, certaines situations sont présentées aux observateurs et il leur est demandé de déterminer la catégorie d’appartenance du comportement et d’expliquer pourquoi ils le classent ainsi.

Il semble aussi que les codeurs peuvent être enclins à changer graduellement la cotation préétablie (dérive) et qu’ils peuvent s’influencer mutuellement et présenter un décalage commun dans leur cotation (Harris et Lahey, 1982a). Par exemple, si un codeur s’interroge sur le comportement « fait du bruit » et questionne un des codeurs au lieu de se référer au chercheur ou aux descriptions fournies dans la grille, il se peut que l’interprétation qu’ils vont faire ensemble de la situation ne soit pas celle définie initialement. Par conséquent, ceux-ci vont mémoriser la nouvelle « définition » du comportement « fait du bruit », vont coter la même chose, mais ne coteront pas le comportement tel que statué. Ce type de dérive commune n’a pas d’effet sur l’accord inter-juge, mais pourrait avoir une influence sur la validité des analyses. Il est donc essentiel que chaque observateur travaille individuellement et ne soit pas en contact avec un autre observateur pendant la cotation. De surcroît, afin d’éviter une baisse de performance dans la cotation, le calcul d’accords inter-juges à différents moments de la collecte de données est nécessaire pour contrôler ce biais (Harris et Lahey, 1982a). Des accords inter-juges doivent être calculés au début du processus puis de façon aléatoire et finalement à la fin du processus. Ces considérations ont été intégrées dans la recherche afin d’accroître la fidélité.

De même, une des conditions de base pour que l’observation soit possible est une définition opérationnelle des comportements définissant les paramètres d’inclusion et d’exclusion de la manifestation d’un comportement (Cohen et al., 2013; Hill etal., 2012). Ceci permet de diminuer l’effet de l’erreur logique, à savoir, une mauvaise catégorisation des comportements à observer de la part des observateurs (Morissette, 1996). Il y a erreur logique lorsque les observateurs ont tendance à observer deux classes de comportements similaires de la même manière, bien que ceux-ci soient différents selon le concepteur de la grille d’observation. Donner une formation complète aux observateurs, tout en assurant la disponibilité du concepteur de la grille en cas d’interrogations, permet de remédier à cette limite. La catégorisation des comportements de la grille doit être finement définie grâce à des exemples et contre-exemples. Par exemple, dans la présente recherche le codeur devait noter le comportement « répète les consignes » seulement lorsque l’enseignant intervenait suite à un comportement déviant de l’élève. Ici, ce comportement ne fait pas référence à la répétition d’une consigne lorsque celle-ci a un but pédagogique, mais à une intervention au niveau comportemental. Pendant la formation, une présentation des cotations erronées des comportements (des contre-exemples) peut aider les observateurs à éviter des erreurs.

RÉSULTATS ET DISCUSSION

Cet article visait à présenter les considérations théoriques et méthodologiques à retenir lors du développement d’une grille d’observation dans un contexte de classe spéciale. Les procédures suivies pour le développement de l’outil et le produit final ont été présentées. L’article soumet une grille d’observation où les comportements à observer chez les enseignants et chez les élèves sont divisés en trois catégories : les comportements physiques, verbaux et les autres comportements. La grille est constituée de 15 comportements pour les enseignants et de 9 comportements pour les élèves. La grille d’observation permet de décrire les interventions utilisées par les enseignants lors de l’émission de TC de la part de leurs élèves. Dans le cadre d’une recherche exploratoire sur les attitudes des enseignants envers les TC de leurs élèves, l’utilisation de la grille a, entre autres, permis de constater que les enseignants privilégient les interventions verbales de type « interpelle » et « répète les consignes » lorsque leurs élèves émettent des comportements déviants et n’interviennent pas (intentionnellement ou pas) dans 22% des cas (Guikas, 2015).

La grille présente de bonnes qualités psychométriques avec une fidélité supérieure au taux recommandé par les études. Un accord inter-juge de : k = 0,79 (Cohen, 1960) et un accord intra-juge de k = 0,86 (Cohen, 1960), ont été atteints sur 10 % du matériel. En ce qui a trait au choix des observables pour les élèves, la grille propose différents comportements externalisés, ce qui correspond aux comportements les plus rapportés par les enseignants dans la littérature (Harris, 1995; Klein-Tasman et Lee, 2017; Male, 2003; Soltau etal., 2015; Will et Wilson, 2014). Concernant le choix des observables pour les enseignants, la grille propose également des comportements décrits dans les recherches étudiant les comportements des professionnels face aux TC (Harris et al., 1996; Kiernan et Kiernan, 1994; Lambrechts etal., 2009; Lambrechts et al., 2010; Male, 2003).

L’expérimentation met en évidence l’importance de la co-construction, autant sur le plan méthodologique (approche empirique et théorique) que sur le plan humain (privilégier le co-développement et consulter des experts du sujet d’étude). De même, il est recommandé d’associer l’observation libre à une recension des écrits afin de s’assurer de la validité de l’outil. Afin d’obtenir une bonne fidélité, il est préconisé de donner une formation approfondie aux observateurs et de mesurer fréquemment, et de façon aléatoire, les accords inter-juges et intra-juges.

Malgré les bonnes qualités psychométriques de la grille, certaines recommandations peuvent être émises afin de l’améliorer. Il est dénoté lors de la cotation que la catégorie comprenant les comportements verbaux des élèves pourrait être révisée. En effet, il a été plus difficile d’atteindre un bon accord inter-juge concernant les comportements « fait du bruit » et « crie ».

Également, l’observation requiert que le chercheur fasse des choix concernant l’observable (Hill et al., 2012; Smit etal., 2017) et cette observation reste partielle (Mucchielli, 1996). Ainsi, la grille d’observation offre des données seulement sur des comportements prédéterminés et ne peut faire état du contexte dynamique de la classe (Smit etal., 2017). Mais, tel que l’explique Bautier (2006), les variables à considérer pour contextualiser le travail de l’enseignant et donc les interactions sont si nombreuses qu’il est difficile d’atteindre un tel objectif.

Enfin, la grille met seulement à disposition le résultat final d’une démarche et ne fournit pas de données sur ce qui mène à une conduite ou sur les raisons pour lesquelles un individu s’engage dans un comportement. Par ailleurs, sous son format actuel, la grille requiert un logiciel pour la cotation ce qui implique un coût monétaire élevé et nécessite une certaine connaissance du support informatique pour pouvoir l’utiliser.

CONCLUSION

L’observation est, selon le sujet d’étude, une méthode de recherche incontournable. Cette méthode requiert un processus rigoureux et est un outil de cueillette de données exigeant (Becker, 2002). Elle est coûteuse pour un chercheur (temps, déplacement, appareillage électronique sophistiqué) et produit des données difficiles à traiter. Mais il a été démontré que l’observation est particulièrement conseillée lorsque des interactions sociales sont le sujet d’intérêt (Dowdney etal., 1984; Gardner, 2000; Iacobucci et Wasserman, 1988; Mouchtouris, 2012) étant donné qu’elle permet l’analyse d’échanges complexes, de documenter les réactions de chacun face à un déclencheur et d’identifier la constance des conduites sociales. Sachant que les actions des enseignants influencent la nature, la sévérité et la fréquence des TC émis par les enfants présentant une déficience intellectuelle (Hastings, 2005); que la gestion de TC par les enseignants est difficile et entrave le temps consacré à l’enseignement (Guikas, 2015; Westling, 2010) et que l’apprentissage est beaucoup plus difficile dans un environnement chaotique (Van Tartwijk et Hammerness, 2011), nous avons besoin d’outils pour comprendre ce qui se passe en classe et soutenir les enseignants dans leurs interventions (Papaeliou et al., 2012; Sattler, 2014 ; Smit etal., 2017).

Ainsi, il serait intéressant que la grille soit utilisée dans des recherches futures afin de définir les modes d’interventions physiques et verbaux de l’enseignant, afin de discerner des patrons de comportements et de mettre en place des interventions qui diminueraient les TC. Plus particulièrement, l’utilisation de la grille dans une recherche longitudinale permettrait de décrire l’évolution des TC dans le temps et de déterminer les interventions les plus effectives dans un contexte pédagogique.

De même, il serait intéressant d’ajuster et d’utiliser cet outil pour des fins cliniques afin d’avoir une rétroaction sur la pratique et une remise en question des interventions habituellement utilisées. Tel qu’énoncé par Smit et ses collaborateurs (2017) les enseignants gagnent à observer leurs gestes afin d’identifier les changements à implanter dans leur enseignement. Pareillement, Richardson et Heckman (1996) expliquent que l’utilisation de rétroactions vidéo dans le cadre de perfectionnement professionnel des enseignants, permet à ces derniers de développer un regard sur leurs actions et de se questionner face à leurs actes. Une adaptation de la grille pourrait ainsi soutenir les enseignants dans leur travail tout en définissant les attitudes qu’ils entretiennent envers leurs élèves. Sachant que les dires des enseignants quant à leurs interventions envers les TC, ne concordent pas nécessairement avec les gestes qu’ils posent en temps réel (Cohen etal., 2013; Guikas, 2015), analyser leur comportement grâce à la grille et au support vidéo les aiderait à objectiver leurs pratiques pédagogiques (Coulibaly et Deman, 1978; Hill, et al., 2012) ce qui favoriserait le développement des élèves.