Article body

1. Introduction

« Mon corps est et sera neutre ». Ainsi répondait un enseignant-stagiaire en sciences de l’ingénieur à une enquête menée en 2018 sur la place du corps dans l’enseignement, là où un autre enseignant, du premier degré, affirmait que l’usage du corps « relève plus de l’inné ou de l’acquis au cours de la vie de tous les jours que d’une formation qui à mon avis serait infructueuse » (Azaoui et Tellier, 2018). Ces propos confirment à quel point la question du corps, considéré comme mode sémiotique (New London Group, 1996), mérite d’être inlassablement débattue et étudiée afin d’être rendue encore plus visible et « évidente » en didactique, notamment dans le domaine de la formation. C’est l’effort à consentir pour déconstruire certaines représentations sur une soi-disant neutralité du corps et innéité dans son usage en classe.

Au risque de surinterpréter les phénomènes non verbaux, les « images » du corps, les gestes manuels[1], nos déplacements, ou la distance interindividuelle ne sont pas plus séparables des paroles prononcées que dans le cadre de films ou capsules vidéos. Ainsi en est-il en classe. Le message multimodal que tout enseignant émet à destination des élèves pour construire les relations interpersonnelles, faire savoir, apprendre ou comprendre repose en partie sur le corps (voir notamment Azaoui, 2014, 2019a, 2019b, 2021b; Sime, 2006, 2008; Tellier et Cadet, 2014). Donc, neutre, il ne peut pas l’être, tout comme son usage ne peut être considéré comme relevant de l’inné, sauf à croire que la fée pédagogique se soit penchée sur le berceau des enseignants pour leur dire comment utiliser leur corps (Tellier et Cadet, 2014). Il est vecteur d’informations (en lien avec la relation et le contenu pédagogiques), d’indices parfois impensés dont se saisissent les élèves pour construire le sens de l’énoncé. Doit-on alors supposer ou accepter sans réserve une éventuelle transparence sémantique dans la réception des signes corporels ?

La présente contribution cherche à répondre à une question que nous pourrions formuler ainsi : comment construire chez les élèves des compétences multimodales en réception pour qu’ils puissent reconstruire le sens de l’information transmise gestuellement par l’enseignant ?

Nous nous proposons donc de discuter de la place du corps dans les compétences multimodales en réception en prenant pour cadre de réflexion les travaux sur la pédagogie des plurilittératies (voir Cope et Kalantzis, 2015). Le terme multimodal renverra dans nos propos à l’existence d’une pluralité de modalités/ressources sémiotiques. Nous considérons qu’il n’inclut pas nécessairement une mise en dialogue ou interaction entre ces modalités contrairement à l’intermodalité (Azaoui, 2019c).

Notre discussion ne s’appuiera pas sur un corpus spécifique; elle croisera des éléments de plusieurs projets précédents que nous avons réalisés et qui ont mis le corps au coeur de leur questionnement. Les données rassemblées, constituées de plusieurs heures d’enregistrements vidéos et d’observations, le furent sur divers terrains scolaires français en école maternelle (Azaoui, 2021a), au collège et au lycée (Azaoui, 2019a, 2019b). Le logiciel libre d’accès ELAN (Sloetjes et Wittenburg, 2008) a été utilisé pour transcrire les interactions des classes de collège/lycée afin d’affiner l’analyse en étudiant, notamment, la répartition typologique et fonctionnelle des gestes (McNeill, 1992; Tellier, 2006), la coïncidence entre la production gestuelle ou proxémique et les réalisations verbales des interactants, ainsi que la construction de sens qui en découlait.

Nous montrerons comment les élèves – de la maternelle au lycée – se saisissent du corps de l’adulte pour construire le sens de l’énoncé multimodal. Que ce soit le corps d’une mère conteuse ou celui d’un enseignant de français langue maternelle et seconde, l’élève le voit et le perçoit tout autant qu’il écoute la parole qui l’accompagne. Savoir lire ces images du corps, qu’il soit appréhendé dans une conception sémiotique ou dans son lien aux réalisations verbales (McNeill, 2005), apparait dès lors comme une réflexion à mener et une formation à considérer si l’on souhaite échapper au piège d’une soi-disant transparence sémantique du corps (Azaoui, 2019a). Nous sommes alors confrontés à la nécessité de s’interroger aussi sur la prise en charge didactique d’une telle question concernant les compétences à développer chez les élèves. Une littératie multimodale contemporaine (Kress, 2010) ne peut faire l’économie d’un tel travail au risque de marginaliser certains modes sémiotiques et vider de son sens le projet d’une approche complexe des plurilittératies porté par le New London Group dès les années 1990 (New London Group, 1996).

2. Corps et langage : un métissage théorique cohérent et nécessaire

Dans son ouvrage Le discours en interaction (2005), Kerbrat-Orecchioni soumettait l’idée qu’un métissage théorique s’avérait nécessaire pour qu’une véritable étude discursive puisse être réalisée. L’objectif était de mettre de côté les dissensions territoriales pour croiser les outils que l’analyse du discours et de l’analyse conversationnelle offraient au service de l’étude d’un phénomène.

De même, il nous semble cohérent et nécessaire de promouvoir un métissage théorique entre différentes approches liées à la multimodalité. Plutôt que de nous enfermer dans un modèle théorique, nous sommes convaincu que chacun à sa façon apporte un éclairage sur une même réalité et permet d’affiner notre compréhension sur le fait que le langage est multimodal. Ainsi, nous présenterons la multimodalité selon une approche sociosémiotique, telle que promue par le New London Group et ses principaux théoriciens (notamment Kress, Cazden, van Leeuwen, Jewitt). Dans un second temps, nous nous intéresserons à la façon dont les Gesture studies appréhendent cette question de la multimodalité; cela nous conduira à resserrer notre focal pour nous intéresser spécifiquement aux gestes coverbaux (McNeill, 1992), un des modes sémiotiques qui contribuent à la construction du sens.

2.1. Plurilittératies et multimodalité : comment le sens se construit selon l’approche sociosémiotique

Lorsque le New London Group se réunit en 1994, il s’agit de faire le point sur la pédagogie des plurilittératies (« pedagogy of multiliteracies »; New London Group, 1996). Les dix membres de ce groupe considèrent que l’approche de la littératie d’alors est désuète et ne permet plus de répondre à la réalité sociale de l’époque marquée d’une part par de nouveaux besoins éducatifs, exacerbés par la diversité culturelle qui induit des manières d’appréhender et de construire les significations différentes, et par l’évolution des technologies qui diversifient davantage les ressources de communication d’autre part. Une rupture avec la conception restreinte de la littératie entendue comme la capacité à lire et à écrire (Gee, 2008, p. 31) s’avère donc nécessaire. Dans une approche traditionnelle des pratiques pédagogiques de la littératie, l’élève devait apprendre à lire et à écrire, sur papier, la variante normée de la langue nationale (New London Group, 1996, p. 61). La littératie était considérée au singulier (Cope et Kalantzis, 2015, p. 1). Or, vu la diversité socioculturelle et communicationnelle qui constitue les sociétés, les tenants de cette conception soutiennent qu’il s’avère à présent plus approprié que la littératie prenne en compte la multiplicité des modes de communication et des groupes socioculturels. Pour assurer une équité sociale, c’est à l’école qu’il revient de prendre en main cette éducation aux nouvelles littératies, ou plurilittératies (« multiliteracies »; New London Group, 1996, p. 63).

Selon ces membres, qui prennent appui sur l’approche fonctionnelle de la langue proposée par Halliday (Halliday et Matthiessen, 2014), le sens se construit grâce à une multiplicité de modes (New London Group, 1996, p. 81), dont les gestes ou ce qui pourrait relever de l’organisation spatiale. La communication, et le langage plus généralement, sont donc foncièrement une réalité multimodale : tout mode constitue une ressource sur laquelle peut s’appuyer l’interlocuteur pour interagir avec son monde et lui attribuer du sens. Ce dernier n’est toutefois pas un « donné ». Tout individu est acteur dans l’attribution de sens, selon ses pratiques et expériences culturelles, linguistiques, sociales, etc. Or, jusqu’alors, parce que le mode est un construit social et culturel, seuls les plus aisés pouvaient appréhender ces signes traditionnellement façonnés selon le modèle dominant : la variété normée de la langue, la primauté accordée à certains supports de communication au détriment des autres relégués aux classes sociales marginalisées. Les plurilittératies visent donc à déconstruire ce rapport dominant/dominé en ouvrant un espace aux variétés linguistiques et, plus largement, à la diversité communicationnelle, au service de tous. Il s’agira d’enseigner à savoir négocier les registres plurisémiotiques selon le contexte d’énonciation.

2.2. Construction du sens multimodal : comment le corps y contribue

Tout comme les autres signes, le corps est, au moins partiellement, un produit social (Bourdieu, 1977; Mauss, 1934) qu’il faut apprendre à déchiffrer d’autant qu’il existe des « différences dans la manière de porter le corps, de se porter, de se comporter où s’exprime tout le rapport au monde social » (Bourdieu, 1977, p. 51). Or, parce que le corps est une « forme perceptible » produisant une impression (Bourdieu, 1977, p. 51), il convient de s’y attarder d’une part pour comprendre en quoi le corps – de l’enseignant notamment – constitue un mode sociosémiotique à part entière et d’autre part pour répondre au mieux à notre problématique liée aux compétences multimodales en réception. S’y pencher permet également de changer d’échelle. Si le cadre général proposé par l’approche sociosémiotique – considérée par Kress comme une sorte de théorie englobante (Kress, 2010, p. 5) – permet de souligner la place que tiennent tous les modes sémiotiques dans la communication, le détour par le champ des études sur la gestuelle (Gesture studies) nous offre la possibilité d’affiner notre compréhension du rôle que joue le corps dans l’interaction.

Les Gesture studies considèrent qu’il existe un lien entre les réalisations corporelles et la parole sur le plan sémantique et temporel (McNeill, 1992, 2005). Ce champ d’étude conforte la nécessité de nous dégager d’une forme de logocentrisme afin de reconnaitre la multimodalité du langage : les actions corporelles servent en effet des fonctions sémantiques et pragmatiques complémentaires ou redondantes avec la parole (Kendon, 2004). Étudier le discours dans sa réalisation voco-verbale uniquement reviendrait à amputer une partie de la réalité communicationnelle et de notre compréhension des apprentissages. Comment comprendre les stades du développement langagier si nous évacuons le rôle crucial que joue le geste de pointage dans l’acquisition (Batista et al., 2019; Butterworth, 2003) ? Quelle connaissance aurions-nous du processus de la réception ou mémorisation d’un message en langue étrangère si les gestes ne sont pas pris en compte (Macedonia, 2014; Tellier, 2008) ? De même – et même si les études de l’anthropologue Hall ne s’inscrivent pas dans les Gesture studies – il a été montré, au moins depuis ses travaux (1966/1971), comment la proxémie participe à l’interaction, voire la construit, tout comme elle contribue à la construction des savoirs à l’école (Azaoui, 2019b; Forest, 2006). Par ailleurs, des variations socioculturelles ou linguistiques existantes (Müller et al., 2014), nous pensons qu’il n’existe aucune raison de supposer qu’un geste produit dans une culture ou dans une langue étrangère trouve son équivalent ou vise exactement les mêmes intentions communicationnelles ailleurs. Pourtant, l’école, en faisant peu cas des compétences multimodales en réception, fait comme si ces variations gestuelles n’existaient pas. Comme si une forme de transparence sémantique (Azaoui, 2019a) définissait les gestes et toute autre ressource corporelle mobilisés par l’enseignant. Or, c’est tout l’inverse.

Pour contribuer à la réflexion sur l’importance de développer des compétences multimodales en réception, nous verrons tout d’abord que voir, percevoir et comprendre le corps enseignant, de la maternelle à l’université, n’est pas une activité si évidente. Cela nous amènera dans un second temps à discuter des possibles contenus et des modalités à retenir pour développer ces compétences.

3. Voir, percevoir et comprendre de la maternelle à l’université

La compréhension d’un énoncé en langue étrangère, seconde, régionale, ou en français par des enfants francophones, mobilise chez l’interlocuteur des stratégies avancées, et parfois non conscientes, pour notamment découper cette chaine sonore en segments signifiants. Il utilise des sources d’informations transmises par l’input linguistique et ses propres connaissances pour encoder le message, auxquelles viennent s’ajouter des renseignements contextuels et non verbaux, tels que les gestes. D’ailleurs, Colletta rappelait en 2004 que :

Lorsque vous percevez une conduite langagière, vous percevez celle-ci dans les différentes modalités sensorielles dont vous êtes équipés. Autrement dit, non seulement vous reconnaissez les mots prononcés, mais vous entendez en même temps leur musique (ce qu’on appelle la prosodie), et vous percevez en même temps les gestes, les mimiques, les regards… l’ensemble des mouvements corporels produits par le locuteur.

p. 15

Que perçoivent les élèves des gestes ? Comment les intègrent-ils aux diverses données à assimiler ? Quel est l’effet sur la compréhension du message ?

3.1. Évaluer le degré de réception : compréhension et mémorisation

Plusieurs études ont cherché à évaluer l’effet des gestes coverbaux sur la compréhension des messages en langue étrangère et à la mémorisation d’items lexicaux.

Tellier a réalisé plusieurs expérimentations pour évaluer l’impact du geste sur la compréhension. Dans son travail doctoral (Tellier, 2006), elle rapporte l’expérimentation menée avec un groupe de 19 élèves de 4-5 ans confrontés à une nouvelle langue. Une histoire en anglais leur est racontée, en utilisant « des gestes bien choisis » (p. 147). La majorité des enfants ont compris l’histoire et les gestes iconiques ont facilité ce travail. Une étude d’Azaoui (2021a), menée en contexte écologique avec des enfants de maternelle âgés de 4-5 ans, donne à voir l’importance que ces derniers accordent aux gestes dans leur écoute d’un conte, parfois dans une langue avec laquelle ils sont plus ou moins familiers[2]. Durant une des histoires racontées en arabe tunisien, deux gestes sont notables : celui qui indique le chiffre sept, correspondant au nombre de filles de la mère dans le conte, et celui qui représente le voile que porte cette même mère. Les deux gestes, à leur façon, sont des gestes culturels. Le premier représente le chiffre sept et est considéré comme un emblème, geste marqué culturellement et possédant un caractère conventionnel parfois propre à de nombreux pays. Sa reprise spontanée par une élève (voir illustration 1) témoigne de l’interaction entre l’enfant et cet indice sémiotique.

Illustration 1

L’élève reprend spontanément le chiffre 7 produit par la mère

L’élève reprend spontanément le chiffre 7 produit par la mère

-> See the list of figures

Le second peut être considéré comme un « geste à charge culturelle partagée », en référence à la notion de « charge culturelle partagée » proposée par Galisson (1987). En effet, le geste iconique réalisé par la mère (voir illustration 2) symbolise le voile que porte la mère du conte et entretient un lien sémantique avec le signifié concret auquel il renvoie.

Illustration 2

L’élève reproduit le geste de la mère pour étayer son intervention

L’élève reproduit le geste de la mère pour étayer son intervention

-> See the list of figures

Il possède par ailleurs une dimension culturelle forte : il ne semble pouvoir être saisi que si l’élève partage avec la mère conteuse des références culturelles et religieuses[3]. C’est le cas de cet élève-ci dont la mère porte un hijab. Il mobilise spontanément son réservoir sémiotique pluriculturel pour attribuer du sens au signe produit, donc à des éléments de l’histoire. Cela l’amène spontanément à préciser les raisons de sa réponse ainsi :

Professeur : comment tu sais que c’était un foulard?
Elève : parce que la maman elle a fait comme ça (+ reproduit le geste)

En contexte universitaire, Sime (2008) rapportait l’importance que des étudiants accordaient aux gestes de l’enseignant dans leur compréhension du message en langue étrangère. Selon eux, l’aide apportée se situe à plusieurs niveaux : les gestes illustrent le mot ou l’idée, ils soulignent les mots importants et permettent de visualiser les comparaisons et oppositions. C’est ce que nous retrouvons dans une récente étude sur la compréhension de l’activité enseignante par des collégiens allophones, apprenants étrangers scolarisés en France (Azaoui, 2020).

Pour ce qui est de la mémorisation du lexique dans une langue étrangère, Tellier (2008) a montré de manière significative que les gestes, lorsqu’ils sont reproduits par l’enfant, favorisent davantage la mémorisation que l’observation de l’image seule. Macedonia (2014) rapporte plusieurs études menées à l’université qui ont confirmé l’importance de la modalité sensorimotrice dans l’apprentissage des langues. La production de gestes iconiques par les apprenants a favorisé la mémorisation du lexique à court et long termes, aussi bien chez des enfants que chez des étudiants.

3.2. L’activité métagestuelle comme rejeu de la réception

Traditionnellement, une autre manière d’évaluer l’intérêt que les élèves portent aux gestes produits par l’enseignant est de s’intéresser à leur discours sur ces gestes (Azaoui, 2014; Sime, 2006; Tellier, 2006). Ces approches ont permis de conforter l’importance des gestes dans la compréhension d’un message, mais également de mettre le doigt sur une illusoire transparence sémantique des gestes. En 1986, Chiss et Fillolet ont montré qu’il existait un « masque de la transparence sémantique » sur le plan linguistique dans les situations endolingues. Cette illusoire transparence se retrouve appliquée à d’autres modes sémiotiques, tels que les gestes. En effet, en recueillant les propos de collégiennes âgées de 11 ans, Azaoui (2019a) a montré que même au sein d’une même communauté de pratique linguistique, les gestes à priori partagés culturellement pouvaient faire l’objet de malentendu du fait de l’influence de la culture éducative.

Dans une approche multimodale, il est évidemment pertinent de s’intéresser à ce que les gestes que les élèves produisent durant leurs commentaires sur la pratique enseignante « disent » de leur perception. La notion de « rejeu » que propose Marcel Jousse (1969) apporte un éclairage intéressant pour notre compréhension. Selon cet anthropologue du geste, le rejeu correspond au « mimisme » des gestes observés. Jeu et rejeu sont impliqués dans la connaissance : « l’homme ne connait que ce qu’il reçoit en lui-même et rejoue » (Jousse, 1969, p. 56).

Selon nous, l’étude de ces « gestes sur gestes » (Cicurel, 1985) est à même de nous renseigner sur la manière dont les gestes de l’enseignant ont été perçus et incorporés par les élèves. Parce que cette activité gestuelle prend pour objet la gestuelle produite dans un échange, nous emploierons le terme de métagestualité ou activité métagestuelle pour la nommer.

Prenons l’exemple de ce geste (voir illustration 3) produit spontanément par une enseignante pour symboliser le terme « accro » dans « être accro » :

Illustration 3

Geste de l’enseignante pour symboliser « accro »

Geste de l’enseignante pour symboliser « accro »

-> See the list of figures

Deux entretiens avec des élèves âgés de 11 ans, inscrits dans la même classe, ont été réalisés pour recueillir leur discours sur la pratique de leur enseignante : d’abord avec un groupe de filles, puis un groupe de garçons[4]. Suite à l’entretien hétéroscopique avec ces six élèves, réunis en deux temps distincts, l’observation de leur activité métagestuelle (voir illustration 4) a permis de relever trois réceptions de la gestuelle de l’enseignante. Nous postulons qu’elles reflètent autant de conceptions – non exclusives – de la réalisation du geste et peuvent privilégier :

  • la forme : position des mains, des coudes et flexion des doigts;

  • le mouvement : perception statique vs dynamique;

  • le lien des modalités kinésiques entre elles : association de plusieurs modalités vs dissociation.

Illustration 4

Élèves reproduisant le geste « accro » de l’enseignante

Élèves reproduisant le geste « accro » de l’enseignante

-> See the list of figures

Alors que ces élèves ont vécu une première fois ce geste en même temps in situ, puis l’ont observé à postériori une seconde fois durant l’entretien (à leur propre initiative puisqu’ils ont spontanément stoppé la vidéo à cet endroit), plusieurs éléments distinguent la manière de rejouer ce geste particulier. Tout d’abord, ils ne situent pas la hauteur des mains au même niveau : à hauteur de poitrine (voir illustrations 4b, 4c et 4d), d’épaules (voir illustration 4e) et du visage (voir illustration 4a), ni à la même distance du corps : proche (voir illustrations 4a et 4e) ou éloigné (voir illustrations 4b, 4c et 4d). Du côté des garçons, les coudes peuvent être posés sur la table, orientés vers l’extérieur, écartés du corps de l’élève. L’orientation des mains n’est pas non plus similaire. Si l’on retient le corps comme point de référence, les mains peuvent être placées sur un axe vertical, parfois en prenant la table pour support (voir illustrations 4a et 4e), en diagonale (voir illustration 4c) ou à l’horizontale (voir illustrations 4b et 4d) par rapport au corps. Il en est de même pour la flexion des doigts; ils apparaissent plus ou moins recroquevillés selon les élèves. Notons que la localisation de l’élève dans le groupe constitué pour le bien de ces entretiens pourrait constituer un facteur contraignant. Apparait également une différence de perception en termes de mouvement du geste. Bien que la majorité des élèves aient conservé le caractère statique du geste en question, un seul élève (voir illustration 4b) lui attribue une dynamique. Enfin, à travers leur activité métagestuelle, les élèves signalent la conception qu’ils ont de la multimodalité et des liens que les divers modes entretiennent entre eux. En effet, si nous prêtons attention aux visages (mimiques et position) ou à la hauteur des épaules, nous pouvons observer qu’ils ne sont nullement identiques : un élève (voir illustration 4c) fait ressortir les dents comme un élément du geste produit par l’enseignante, là où un autre haussera les épaules (voir illustration 4e) ou avancera légèrement la tête (voir illustrations 4c et 4e). Le geste des mains est donc considéré, selon les cas, comme dissocié ou non des autres modalités non verbales.

Si aucun sens n’a pu être attribué à ce geste de l’enseignante par le groupe de filles lors de l’entretien, il a néanmoins fait l’objet d’un débat dans le groupe des garçons. L’élève qui avait accompagné son geste d’un mouvement (voir illustration 4b) s’avère proposer un contresens puisqu’il prête désormais au geste la signification « à peu près ». Aucun des groupes n’a toutefois fait part d’un possible lien avec la parole de l’enseignante.

L’étude du rejeu d’un même geste par des élèves de cette même enseignante révèle que l’accès au sens du mot « accro » n’a pas été facilité par la gestuelle de l’enseignante, voire qu’elle a ajouté une certaine confusion.

4. Développer des compétences multimodales en réception

Les études et exemples cités précédemment rappellent que, quel que soit l’âge, les apprenants reçoivent et s’approprient la production multimodale de l’adulte référent selon leurs propres critères, leur position dans la pièce, leur attention, leur sensibilité à la diversité des modalités communicationnelles, ou encore selon leur éducation. L’existence possible d’une diversité de réceptions est susceptible de fausser le sens du message tel que visé par l’enseignant. Si cela interroge la formation solide des enseignants à l’usage de leur corps pédagogique, il nous semble également qu’il s’agirait de construire chez les élèves des compétences multimodales en réception pour qu’ils puissent reconstruire le sens de l’information transmise sur le mode gestuel par l’enseignant.

4.1. Développer des compétences multimodales en réception : pourquoi ? Dans quel but ?

Comme le rappellent certains enseignants que nous accueillons dans des ateliers corps et voix à l’université de Montpellier, selon l’âge et l’éducation, notamment, les élèves n’ont pas la même capacité à interpréter les gestes de leur enseignant[5]. D’ailleurs, la variation observée dans le dernier extrait rappelle que la multiplicité des perceptions est une réalité et qu’elle n’est pas nécessairement signe de richesse. Dans une conception sociosémiotique des plurilittératies, elle peut même s’avérer facteur et révélatrice d’inégalités socioculturelles.

Nous rappelions plus haut qu’il existe un masque de la transparence sémantique des gestes même en contexte endolingue. Cette illusion conduit à croire que l’appréhension des gestes relèverait de l’évidence, du naturel. Or, non seulement la contigüité entre le geste et le signifié auquel il renvoie ne va pas toujours de soi, mais il convient aussi d’ajouter que, comme tout discours, les gestes comportent une dimension dialogique (Azaoui, 2018) qui en complexifie la lecture. Ils sont en effet traversés par d’autres gestes passés ou à venir et par des interactions antérieures qu’il s’agit de savoir déchiffrer. Il existe par ailleurs un code gestuel (Tellier, 2006), voire des emblèmes pédagogiques (Azaoui, 2014) construits entre enseignants et enseignés auxquels s’ajoutent aussi les emblèmes gestuels liés aux cultures éducative et nationale. L’opacité sémantique potentielle de tels gestes pour des élèves lambda, scolarisés régulièrement dans un pays donné, se retrouve accentuée lorsque nous considérons les élèves allophones, voire un public peu/non scolarisé. C’est le cas de certains élèves issus de familles en situation de grande précarité, qui s’avèrent en fait peu acculturés à certaines ressources sémiotiques propres au contexte de classe.

Ajoutons à cela que les enseignants ne sont pas véritablement formés à l’utilisation de leur corps dans une fonction pédagogique (Azaoui, 2021b; Cadet et Tellier, 2007). Pour l’essentiel, les gestes produits sont impensés : l’enseignant est agi par son corps plus qu’il n’est en mesure d’agir sur lui, surtout lorsque celui-ci est débutant et ne peut s’appuyer sur une expérience préalable. Il est ainsi attendu des élèves qu’ils soient en mesure de comprendre des gestes qui ne sont pas pensés pour eux, qui ne leur sont pas nécessairement adressés, mais auxquels ils ont accès par la force des choses. De cela découle l’intervention d’une élève lors d’un entretien hétéroscopique : « dès qu’elle dit un mot y’a peut-être un geste dans sa tête […] elle se dit ça va bien aller si je fais ça et pas ça » (Elodie, 11 ans). Aucune fonction pédagogique du geste n’est envisagée par cette élève pas plus que par ses camarades. Former à l’acquisition de compétences à observer et à interpréter les gestes de l’enseignant contribuerait non pas à une éventuelle uniformisation des perceptions, mais bien à éviter qu’un pan de l’information n’échappe à certains élèves et à prévenir certaines incompréhensions, voire des malentendus interculturels. Les raisons de construire ces compétences sont donc principalement socioscolaires : s’assurer que tous les élèves, quelle que soit leur origine ethnique ou sociale, soient conscients de l’importance de prêter attention à ce mode qui participe tout autant que les autres à la signification du message pédagogique transmis. S’assurer que tous les élèves d’une même classe retirent (à peu près) la même information des gestes de leur enseignant.

En outre, construire des compétences multimodales en réception participe à la mise en place d’une même communauté de pratiques multimodales en quelques sortes. Pour reprendre l’idée avancée par Kress et van Leeuwen (2001, p. 30, traduction libre) : « la pratique discursive dans un environnement multimodal consiste en la capacité à savoir sélectionner les discours qui sont “en jeu” dans une situation particulière ». Ainsi, tout élève d’un même enseignant est censé être en mesure de repérer, de traiter et d’intégrer les informations redondantes, complémentaires, voire contradictoires étant transmises gestuellement par l’enseignante.

In fine, il semble qu’il s’agit véritablement de développer une posture réflexive sur les intentions discursives et plus spécifiquement pédagogiques de leurs enseignants. Ainsi, en devenant un objet d’observation, d’analyse et de discussion plutôt qu’un objet vécu, la pratique multimodale enseignante est objectivée. Mais comment procéder avec les élèves ? Quelles compétences développer ?

4.2. Développer des compétences multimodales en réception : lesquelles ? Comment ?

Il est assez compliqué de définir des compétences multimodales en réception à propos des gestes. La difficulté réside notamment dans l’absence de répertoire gestuel défini. Il existe certes des ouvrages qui présentent certains gestes culturels, tels que le « mini-dictionnaire » Des gestes et des mots pour le dire, coordonné par Calbris et Montredon (1986) ou encore Le langage des gestes, le « premier guide international des gestes » (quatrième de couverture) de Morris (1997). S’ils ont l’intérêt d’exister pour lever les ambigüités des interactions exolingues quotidiennes liées aux emblèmes gestuels, ils ne peuvent véritablement servir dans le cadre scolaire (hormis éventuellement en classe de langue). La majorité des gestes de l’enseignant de français langue maternelle ou seconde, par exemple, ne sont en effet pas des emblèmes (Azaoui, 2014). La majorité des gestes relèvent de la catégorie déictique, iconique ou métaphorique, ces deux derniers étant des gestes spontanés possédant un lien plus ou moins contigu avec le signifié concret ou abstrait auquel ils renvoient (McNeill, 2005). Ils sont par ailleurs très fortement indexés au contexte d’énonciation et à l’énoncé même. Pour cette même raison, les postures et le comportement proxémique ne sont pas plus répertoriables, même si Hall (1966/1971) a pu proposer une typologie pour la proxémie qui n’avait, rappelons-le et selon les mots mêmes de l’anthropologue, aucun caractère généralisant.

Cela étant dit, pour penser la construction de compétences gestuelles en réception, il nous semble que les processus d’apprentissage (« knowledge processes ») comme envisagés par Cope et Kalantzis (2015, p. 4) à partir de travaux de Kress peuvent constituer une base intéressante de travail. Les auteurs retiennent quatre étapes : l’expérienciation (« experiencing »), la conceptualisation (« conceptualizing »), l’analyse (« analyzing ») et enfin la mise en pratique (« applying ») (Cope et Kalantzis, 2015, p. 4) qu’ils définissent par :

  • l’expérienciation : la cognition humaine et le sens sont des phénomènes situés, ancrés dans un contexte propre, qu’il convient de mettre en lien avec les expériences personnelles hors contexte;

  • la conceptualisation : le processus de conceptualisation ne se nourrit pas uniquement des connaissances académiques suivant une dynamique descendante. Tout élève y participe activement lorsqu’il cherche à mettre au jour l’implicite ou lorsqu’il s’engage dans une démarche inductive;

  • l’analyse : elle vise à développer chez les élèves l’esprit critique en les amenant à interroger par exemple les relations de pouvoir dans toute situation de communication;

  • la mise en pratique : elle implique la capacité à utiliser les nouvelles connaissances dans des situations concrètes proches ou à transférer ces connaissances à d’autres contextes.

Adapté à la question des gestes, ce processus pourrait prendre la forme suivante. Nous pourrions envisager par exemple qu’un travail avec les élèves s’appuie sur des corpus vidéo de l’enseignant en classe, tel que nous l’avons esquissé ailleurs (Azaoui, 2020).

Prenons appui sur un exemple concret issu d’un travail de recherche antérieur (Azaoui, 2014). Des élèves avaient été invitées à visionner un extrait vidéo d’une séance de cours et à parler de la pratique multimodale de leur enseignante. Spontanément, elles ont focalisé sur un geste produit préalablement par l’enseignante simultanément à l’explication adressée à un élève. Il s’agit de l’emblème dit « doigts en forme d’anneau » (Monique reproduit ici le geste de l’enseignante, voir illustration 5) auquel Calbris et Montredon (1986) attribuent la valeur de précision ou d’exactitude.

Extrait de corpus
Elodie : les eaux elle fait comme ça euh:::: si elle parlait pas ben je comprendrais pas ce que ça veut dire ça (l’élève reproduit un autre emblème, la main droite effectue un mouvement sec et répété de bas en haut). Y’a aussi ça
ENQ. : Alors c’est quoi ça c’est quoi ça?
Elodie : je sais pas
Monique : en général, c’est quand les parents ils veulent nous punir ils disent tu arrêtes tout de suite de faire ça (voir illustration 5)
Linda : non, là c’est pour le corriger « non c’est pas comme ça » (l’élève glose le geste)

Azaoui, 2014, p. 338

Illustration 5

Monique reproduit le geste « doigts en forme d’anneau » produit par l’enseignante

Monique reproduit le geste « doigts en forme d’anneau » produit par l’enseignante

-> See the list of figures

En suivant les étapes décrites précédemment, le travail mené avec des élèves pourrait avoir le format suivant :

  • L’expérienciation : elle est autorisée par l’utilisation d’un extrait vidéo d’un cours vécu. Cela peut constituer l’occasion de partager, au départ, des ressentis liés à ce moment. Progressivement, il conviendrait d’amener les élèves à réagir sur les gestes de l’enseignant, comme dans l’exemple ci-dessus;

  • La conceptualisation : il s’agit ici de soumettre une catégorisation, une classification argumentée, mais pas nécessairement « vraie ». Il peut être attendu un début de traitement raisonné du possible lien avec la parole émise qui vise à mettre au jour l’implicite;

  • L’analyse : il est possible d’envisager, par exemple, de demander aux élèves de proposer une explication, une fonction du geste et d’en débattre. L’intervention de Linda serait en cela un point de départ tout à fait intéressant, car elle met le doigt sur un début d’explication rattachée au contexte d’énonciation sur lequel il aurait été riche de poursuivre le débat (engagé par Linda lorsqu’elle s’oppose à Monique);

  • La mise en pratique : elle pourrait consister en la mise en scène de situations où le geste est utilisé dans la fonction visée par l’enseignante. Elle pourrait par ailleurs donner lieu à la création de jeux de rôle impliquant d’autres situations; cela offrirait l’occasion aux élèves de construire un répertoire fonctionnel du même geste selon des contextes énonciatifs différents.

Si ces étapes peuvent tout à fait être révisées, renommées, l’essentiel serait de conserver l’objectif auquel elles mènent : construire un esprit critique. Car il s’agit bien de s’inscrire dans une pédagogie critique héritée de Freire (Cope et Kalantzis, 2015, p. 11) qui vise au final la construction d’un citoyen éclairé, encapacité. Une pédagogie qui offre un espace aux élèves pour qu’ils y déploient leur compétence d’observation et mobilisent leurs connaissances personnelles.

Selon le niveau scolaire et linguistique des élèves, ce type de démarche aurait plusieurs intérêts. Tout comme ces « évidences invisibles » dont parlait Carroll dans son étude d’interactions franco-américaines (citée par Kerbrat-Orecchioni, 2016), les gestes sont omniprésents dans les interactions, et pourtant, leurrés par le masque de la transparence sémantique évoquée précédemment, nous leur prêtons peu d’intérêt, les interrogeons peu, pas plus que les futurs enseignants ne sont réellement formés à leur utilisation dans le cadre pédagogique. Cela offrirait donc l’occasion de mettre la focale sur un mode sémiotique « naturalisé » pour apprendre à penser l’invisible de nos actions. Dans un deuxième temps, comme nous le disions plus haut, cela participerait à la construction d’une posture réflexive chez les élèves qui les amènerait, plus globalement, à apprendre à objectiver l’action de classe et la pratique enseignante, à l’observer avec un regard critique. En poussant plus loin le bénéfice d’une telle démarche, il y aurait là une opportunité offerte aux élèves d’interroger l’identité d’enseignant en se posant des questions présentes dans tout type d’échange (Kerbrat-Orecchioni, 2016) : comment est-ce que je te vois ? Qui es-tu pour moi ?

Si nous considérons le public plus spécifique des élèves allophones, cela permettrait de les acculturer aux interactions de classe « ordinaire » et de les amener à savoir s’appuyer sur le corps de l’enseignant pour reconstruire le sens de l’action pédagogique, pour lever l’ambigüité éventuellement présente dans l’énoncé verbal, ou pour en comprendre les intentions, les implicites dans un contexte donné. Même au niveau universitaire, ce travail peut être envisagé avec des étudiants internationaux afin de les familiariser avec une gestuelle pédagogique qui comporte parfois une dimension dialogique potentiellement opaque ou ignorée (Azaoui, 2018).

Enfin, et plus largement, si tant est qu’un tel travail puisse être réalisé régulièrement à partir d’extraits vidéos divers, selon une progression qu’il conviendrait d’établir, cela permettrait de dépasser le caractère situé du geste observé dans un contexte précis pour repérer ses invariants sémantiques et fonctionnels, et ce qui relève, au final, d’une forme de typification. Cela aurait alors le mérite de former les élèves à considérer la communication comme foncièrement multimodale, à leur faire prendre conscience de son importance dans l’ironie, les implicites. Bref, à les familiariser avec la place et la fonction des gestes dans l’économie de l’échange. Il va de soi toutefois que cette (sur)focalisation sur la gestuelle ou le corps ne peut être que temporaire dans la mesure où il s’agit d’un travail plus global sur la communication et le discours enseignant en particulier. La finalité serait de prendre progressivement de la hauteur afin de reconstituer l’ensemble de cette communication en considérant, certes, chaque mode pour ce qu’il apporte à l’échange, mais aussi en prenant en compte l’interaction entre ces modes, comme nous y engageaient déjà Watzlawick et al. (1972, p. 47).

5. Conclusion

Au terme de cette discussion, il nous semble encore plus évident que négliger le besoin d’éduquer à la compréhension des ressources multimodales mobilisées dans toute interaction didactique, au nombre desquelles il est essentiel d’inclure les gestes et le corps dans son ensemble, est une gageüre de l’institution.

Nous avons montré en quoi les compétences multimodales en réception sont un contenu pédagogique à considérer. Cela étant, une question demeure : quelle place ce contenu peut-il tenir dans les programmes, souvent déjà bien surchargés en France ? De toute évidence, une approche intégrée serait l’option la plus intéressante à considérer pour que cette réflexion dépasse les questions disciplinaires. Une des limites possibles serait toutefois la question de la formation des enseignants – toutes disciplines confondues – à ces phénomènes, afin qu’ils soient en mesure de mener de telles activités en classe. Notons toutefois que les programmes de l’école primaire et secondaire évoquent, pour les disciplines « Français » et « Langues vivantes », la nécessité de sensibiliser les élèves aux « ressources de la voix et du corps pour être compris » (Ministère de l’Éducation nationale, 2015, p. 102) et aux « auxiliaires[6] visuels, dont la gestuelle, pour déduire le sens d’un message oral et réagir » (Ministère de l’Éducation nationale, 2015, p. 137). Bien que cela soit lié avec la présente discussion, la question spécifique de la multimodalité du discours enseignant, qui constitue la trame de notre réflexion, n’est pas évoquée dans ces programmes.

Si l’on esquisse des possibilités de l’y intégrer, les heures de vie de classe, instituées depuis 1999 en France pour que les élèves de collège puissent aborder plus facilement « leur quotidien dans l’établissement, faire part des difficultés rencontrées, prévenir d’éventuels problèmes de comportement. Ce temps d’échange apprend aux élèves à vivre ensemble et à se confronter au débat d’idées »[7], constitue un espace pouvant accueillir ce genre d’activité. Une autre possibilité serait d’utiliser un créneau sur les enseignements d’éducation morale et civique (EMC), et en particulier sur la partie dédiée à la « culture » dont le but est de « donner sens à certaines de nos expériences, d’en identifier et d’en comprendre les enjeux et la portée, et de les comparer à l’expérience d’autrui »[8]. Cet espace se prêterait en effet à une formation aux compétences multimodales en réception; cela ajouterait néanmoins un point supplémentaire à traiter en EMC, déjà victime de l’étendue de son action.

Que cela soit intégré à l’enseignement de l’oral en français, en langues vivantes ou ailleurs, la formation à ces compétences multimodales en réception aurait sans nul doute un effet sur la qualité de la production multimodale des élèves, attendu des programmes également, dans le sens où elle développerait, en miroir, une conscience accrue de soi, de l’autre et de la ressource communicationnelle que constitue le corps. Une vision plus hétérogène de la réalité communicationnelle serait acquise et mise en oeuvre au service d’une meilleure acceptation de la diversité des pratiques langagières et des personnes.