Corps de l’article

Introduction

Au Canada[1], environ un quart des adultes éprouvent de graves difficultés à lire un texte simple pour la compréhension (Statistique Canada, 1996 ; 2002). L’origine de ces difficultés remonte souvent aux premiers apprentissages scolaires (Rayner, Foorman, Perfetti, Pesetsky et Seidenberg, 2001 ; Stanovich, 1992). Toutefois, le dépistage précoce des difficultés de lecture en français au Canada représente un défi de taille parce que les outils d’évaluation standardisés sont encore peu nombreux. Le Test de rendement pour francophones (1994), un des rares tests normalisés au Canada français, permet de mesurer la compréhension de texte, l’étendue du vocabulaire et la maîtrise de l’orthographe, mais il peut difficilement être utilisé auprès des enfants en début de scolarisation. Plus souvent qu’autrement, la détection précoce des troubles de lecture en français repose sur les observations informelles des enseignants ou sur les données issues d’instruments de mesure non standardisés dont l’usage est restreint à une école ou à une commission scolaire (Garcia et Desrochers, 1997). L’objectif du présent article est a) de décrire le cadre conceptuel et les dimensions d’une nouvelle batterie de tests pour l’évaluation de la compétence en lecture, b) de présenter les premiers résultats afférents aux niveaux de performance atteints par les élèves de la maternelle à la sixième année du cycle primaire, c) de rapporter quelques propriétés psychométriques de certaines échelles de mesure composant la Batterie d’épreuves multidimensionelles d’évaluation de la lecture (dorénavant appelée BÉMÉL).

Cadre théorique du BÉMÉL

La lecture est une activité cognitive complexe qui met en interaction plusieurs domaines de connaissances déclaratives et procédurales (Coltheart, Rastle, Perry et Ziegler, 2001 ; Frederiksen, 1981 ; Harm et Seidenberg, 1999 ; Rumelhart, 1977). Certains de ces domaines de connaissances sont spécifiques à la langue parlée ou écrite (par exemple, la phonologie, l’orthographe, le vocabulaire, la grammaire, la sémantique, l’organisation du discours), alors que d’autres sont extra-linguistiques (par exemple, les connaissances générales ou encyclopédiques). Dans l’élaboration du BÉMÉL, nous avons ciblé les composantes jugées centrales dans la maîtrise de la lecture. Cette approche multi-componentielle ou multidimensionnelle a également servi à guider l’élaboration de batteries similaires en Europe (par exemple, De Partz, 1999 ; Khomsi, 1999 ; Mousty, Leybaert, Alegria, Content et Morais, 1994). Des recherches ultérieures sur le BÉMÉL permettront d’étayer davantage ses composantes constitutives et les caratéristiques de leur acquisition.

Notons que le BÉMÉL permettra d’estimer cinq domaines de connaissances pertinentes à la lecture lorsqu’il sera dans son état définitif. Ces domaines sont a) la sensibilité phonologique, b) les connaissances alphabétiques, c) l’identification des mots, d) la sensibilité grammaticale, e) la compréhension de phrases et de textes. Bien que la nature spécifique des interactions entre ces domaines de connaissances soit encore mal connue, les recherches actuelles donnent à penser que la sensibilité phonologique et les connaissances alphabétiques fournissent des points d’appui importants à l’identification des mots (Rayner et al., 2001) et que la sensibilité grammaticale intervient dans l’identification de mots (Duncan et Seymour, 2003 ; Plaza et Cohen, 2003) et dans la compréhension de texte (Demont et Gombert, 1996). Réciproquement, les connaissances orthographiques pourraient exercer une influence sur la sensibilité phonologique (Castles, Holmes, Neath et Kinoshita, 2003) et la compréhension sur la maîtrise de la grammaire (Fayol, David, Dubois et Rémond, 2000). L’expansion de ces domaines de connaissances pourrait donc ne pas être strictement linéaire.

Les travaux actuels donnent à penser que les domaines de connaissances qui sous-tendent l’apprentissage de la lecture passent par des périodes de croissance rapide à divers moments dans le temps et des périodes de croissance plus lentes ou, peut-être, de réorganisation. Siegler (2002) utilise, dans d’autres domaines du développement cognitif, le terme « vagues successives » pour désigner ces pics de croissance. Les enfants arrivent à l’école – et à l’apprentissage formel de la lecture – avec un vocabulaire phonologique important, ainsi que des acquis au point de vue des distinctions phonologiques, de la connaissance des lettres de l’alphabet et des règles tacites de grammaire de la langue parlée. La scolarisation leur permettra d’associer les graphèmes aux phonèmes et d’élargir leur vocabulaire orthographique. Ces bases faciliteront, au cours de la deuxième moitié du cycle primaire, l’assimilation de la morphologie, des marqueurs grammaticaux, de la syntaxe et de la compréhension de phrases et de textes. Seymour (1999) avance l’idée d’une intégration progressive et hiérarchique (en stades de développement) des connaissances phonologiques, alphabétiques, orthographiques et morphologiques. Cette représentation de la structuration des connaissances, en vagues successives, permet de formuler des hypothèses sur les courbes de performance attendues dans l’évaluation des composantes de la lecture à l’aide du BÉMÉL et d’explorer les parcours particuliers empruntés par certains enfants dans leur apprentissage de la lecture.

Domaines de connaissances pertinents à la lecture

Faisons maintenant un retour sur les cinq domaines de connaissances que nous avons énumérés. Nous présentons d’abord les domaines qui jouent un rôle précurseur dans la lecture des mots isolés, c’est-à-dire la sensibilité phonologique et les connaissances alphabétiques. Ensuite, nous traitons l’identification des mots isolés puisqu’elle constitue un déterminant important dans la compréhension de l’écrit. Enfin, nous abordons la sensibilité grammaticale et la compréhension de texte. Nous décrivons brièvement chaque domaine de connaissances et nous relevons les considérations théoriques et empiriques qui justifient leur inclusion dans la batterie. Une description des tests dérivés du cadre conceptuel est offerte dans la section consacrée à la méthode.

Sensibilité phonologique

La sensibilité phonologique met en jeu une double habileté : celle de différencier les sons de la langue parlée et celle de les manipuler oralement (Stanovich, 1992). Les sons de la parole sont arrangés en une séquence linéaire et on peut faire subir à cette séquence diverses transformations. Par exemple, le locuteur peut dénombrer les unités constitutives de cette séquence (ex. : les syllabes ou les phonèmes), ajouter, soustraire ou remplacer une de ces unités. Il peut également identifier l’unité qui occupe un rang particulier dans la séquence (ex. : au début, au milieu ou à la fin). Wagner, Torgesen et Rashotte (1994) ont montré que les enfants qui démontrent une sensibilité phonologique supérieure apprennent plus facilement à lire des mots à voix haute. Parallèlement, les enfants chez qui la sensibilité phonologique est déficiente éprouvent plus de difficulté à apprendre à lire les mots à voix haute et semblent mettre en oeuvre des stratégies d’identification qualitativement différentes des autres apprentis-lecteurs (De Jong, Seveke et Van Veen, 2000 ; Snowling, Goulandris et Defty, 1998). L’importance de la sensibilité phonologique dans l’examen de la lecture tient en partie au fait que, dans les langues alphabétiques, les graphies visent à représenter les sons de la parole (Diringer, 1968 ; Jaffré et Fayol, 1997). La différenciation des phonèmes constitue donc une condition essentielle à la formation des correspondances entre les graphèmes du système d’écriture et les sons de la parole.

La taille de l’unité phonologique ciblée dans l’évaluation de la sensibilité phonologique semble déterminer le niveau de performance des enfants. On a montré, par exemple, que l’élision d’une syllabe dans un mot (ex. : « bateau » → « tôt ») est significativement plus facile que celle d’un phonème (ex. : « crayon » → « rayon »). Outre le fait que la syllabe semble généralement plus saillante que le phonème, plusieurs chercheurs argumentent que cette première unité a un statut privilégié en français, en raison de la régularité des frontières syllabiques dans cette langue (Bruck, Genesee et Caravolas, 1998 ; Cutler, Mehler, Norris et Segui, 1986 ; Sprenger-Charolles et Siegel, 1997). Deux épreuves de sensibilité phonologique sont présentement incluses dans le BÉMÉL : une d’élision syllabique et une autre d’élision phonémique.

Les connaissances alphabétiques

L’alphabet du français comprend 26 lettres et l’ensemble de ses graphèmes s’élève à environ 130 unités (Catach, 1980). La maîtrise de l’alphabet et des correspondances entre les graphèmes et les phonèmes constitue une habileté fondamentale dans l’apprentissage de la lecture du français, car elle assure le transfert des informations du code orthographique vers la langue orale et, inversement, de la langue parlée vers l’orthographe (Ehri, 1998 ; Seymour, Aro et Erskine, 2003 ; Treiman, Tincoff, Rodriguez, Mouzaki et Francis, 1998).

L’appariement entre les graphèmes et les phonèmes du français représente un système complexe. Si certaines lettres renvoient à un seul phonème (ex. : « b » → /b/ ; « p » → /p/), d’autres peuvent être prononcées de plusieurs façons (ex. : « c » → /s/ ou /k/). Par ailleurs, tous les phonèmes du français ne peuvent pas être représentés par une seule lettre de l’alphabet. Certains d’entre eux sont représentés par des groupes de lettres (ex. : « ou », « ch », « ph »). Ce jeu de correspondances complexe entraîne des ambiguïtés en lecture orale (ex. : « g » → /g/ ou /¥/) et en orthographe (ex. : /f/ → « f » ou « ph »). On ne s’étonnera donc pas de constater que la capacité de nommer les lettres de l’alphabet et celle de fournir le son des graphèmes sont positivement corrélées au taux de réussite dans les épreuves de lecture orale et d’orthographe (Compton, 2000 ; McBride-Chang, 1999 ; Sprenger-Charolles, Siegel et Bonnet, 1998). Nous avons intégré trois épreuves relatives aux connaissances alphabétiques dans le BÉMEL : la reconnaissance visuelle des lettres, la dénomination des lettres et le décodage grapho-phonologique des graphèmes les plus courants.

L’identification des mots réels ou inventés

Une des conditions nécessaires à la lecture est l’identification des mots écrits. Ehri (1998) distingue cinq stratégies pour identifier et prononcer un mot écrit : a) l’assemblage des graphèmes, b) le groupement des blocs orthographiques (ex. : des syllabes), c) la récupération d’une représentation du mot intégral en mémoire lexicale, d) l’analogie à des mots connus, e) l’utilisation des indices contextuels pour inférer le mot présenté. Ces stratégies s’appuient sur des processus différents et elles n’émergent pas au même moment dans le développement de la lecture. La plus élémentaire est l’assemblage des graphèmes, alors qu’un procédé plus évolué consiste à évoquer une représentation orthographique du mot intégral. Coltheart et al. (2001) associe ces deux stratégies à des mécanismes distincts. Le premier, appelé assemblage, permet de transcoder des graphèmes en phonèmes à l’aide d’un ensemble de règles de correspondance et d’enchaîner les phonèmes résultants. Le deuxième mécanisme, appelé adressage, permet de récupérer la représentation phonologique intégrale du mot entier et d’en fournir une prononciation en accord avec l’usage.

La mise en oeuvre de l’assemblage et de l’adressage dépend en partie des caractéristiques des chaînes de lettres. Si elles forment un mot nouveau ou inventé (ex. : barutie), la prononciation s’appuiera principalement sur l’assemblage. Si, par contre, les chaînes de lettres constituent un mot réel, mais dont les graphèmes n’obéissent pas strictement aux règles de correspondance, alors une prononciation juste ne pourra être assurée que par l’adressage. On a attribué différents troubles de lecture orale à une perturbation de ces mécanismes (ex. : Coltheart, Curtis, Atkins et Haller, 1993 ; Dérouesné et Beauvois, 1985 ; Patterson et Morton, 1985 ; Temple, 1985). Même si cette explication ne suffit pas à rendre compte de la diversité des diagnostics en trouble de lecture (Sprenger-Charolles, Colé, Lacert et Serniclaes, 2000 ; Stanovich, Siegel et Gottardo, 1997), l’utilité diagnostique de la lecture orale des mots réels et des mots inventés est bien attestée dans les travaux sur l’évaluation de la lecture (De Partz, 1999 ; Khomsi, 1999 ; Mousty et al., 1994). Le BÉMÉL comprend une épreuve de reconnaissance visuelle des mots, une épreuve de lecture orale de mots réels, orthographiquement réguliers ou irréguliers, et une épreuve de lecture orale de mots inventés.

La sensibilité grammaticale

La sensibilité grammaticale englobe deux aspects particuliers de la langue, notamment la morphologie grammaticale et la syntaxe. La morphologie grammaticale se rapporte aux aspects de la forme des mots qui ont une fonction grammaticale. En français, la pluralisation, le genre grammatical et le temps des verbes sont typiquement signalés par le jeu des affixes à la fin des mots. La taille de ces affixes peut varier entre une et plusieurs lettres (ex. : Les chevaux seront vendus à l’enchère). Le développement de la morphologie grammaticale est probablement relié à celui de la morphologie dérivationnelle, car la mise en oeuvre de certains affixes peut entraîner une modification des formes orthographique et phonologique du mot (ex. : « il fait » → « il fera »). Plusieurs études auprès d’enfants de langue maternelle anglaise donnent à penser que la sensibilité morphologique pourrait procéder en trois vagues successives, celle des radicaux, puis celle des affixes flexionnels et, enfin, celle des suffixes de dérivation (Carlisle, 1996 ; Green et al., 2003). La généralisation de ce décours au français reste, pour le moment, une question ouverte.

La syntaxe, quant à elle, renvoie aux principes qui régissent les combinaisons de mots. La phrase simple typique est constituée d’un sujet, d’un verbe et d’un complément. En opérant certaines transformations, on pourra reformuler cette phrase simple en une phrase négative, passive ou interrogative. Lecocq (1996) rapporte des résultats indiquant clairement que les éléments constitutifs de la sensibilité grammaticale présentent une très grande variabilité dans leur acquisition en français.

Le rôle de la sensibilité grammaticale a encore reçu peu d’attention de la part des chercheurs intéressés à l’apprentissage de la lecture. Quelques travaux ont toutefois établi une relation entre cette composante et la lecture orale (Plaza et Cohen, 2003, 2004) ou la compréhension (Demont et Gombert, 1996 ; Gaux et Demont, 1997 ; Gaux et Gombert, 1999 ; Gottardo, Stanovich et Siegel, 1996). Le développement de ce domaine de connaissances demeure encore à peu près inexploré. Nous nous proposons de faire une analyse détaillée des facettes de la sensibilité grammaticale et de construire des épreuves pour en faire l’évaluation au cours de l’élaboration du BÉMÉL.

La compréhension des phrases et des textes

L’issue ultime de la lecture est la compréhension des phrases et des textes. Il s’agit là d’une des réalisations cognitives les plus évoluées (Perfetti, 1985), car elle s’appuie sur une grande variété de processus langagiers (ex. : le traitement phonologique, l’identification lexicale, l’analyse syntaxique, l’extraction du sens des mots) et extra-langagiers (ex. : le stockage de l’information en mémoire de travail, le raisonnement). Dans les modèles actuels de la compréhension, on fait typiquement le postulat que les idées évoquées par les phrases d’un texte sont représentées cognitivement par des propositions, constituées de prédicats et d’arguments (ex. : Coirier, Goanac’h et Passerault, 1996 ; Denhière et Baudet, 1992 ; Kintsch, 1998 ; Singer et Kintsch, 2001). Ces propositions peuvent être dérivées du texte ou des représentations que le lecteur se fait de l’univers du discours (ex. : ses souvenirs, ses connaissances générales, ses croyances). Les capacités langagières ne constituent donc pas le seul point d’appui de la compréhension des phrases et des textes.

On avance également l’idée qu’une des opérations mentales centrales de la compréhension consiste à construire une structure qui coordonne un ensemble de propositions. Cependant, la forme de cette structure varie dans les modèles actuels. Certains théoriciens se la représentent comme un réseau de propositions (Kintsch, 1998), d’autres comme un système de production (Anderson, 1993) ou un modèle mental (Johnson-Laird, 1983). Chaque modèle est assorti d’un ensemble de mécanismes pour vérifier ou restituer la cohérence de cette structure et pour élaborer des inférences. Sur le plan de la langue, la compréhension en lecture se joue à plusieurs niveaux : celui des morphèmes, celui des mots et des expressions, celui des syntagmes et des phrases, celui de l’ensemble du texte. Dans l’élaboration du BÉMÉL, nous nous proposons de distinguer ces niveaux d’analyse et de construire des épreuves pour évaluer les capacités qui président à la compréhension des phrases et des textes.

Récapitulation et remarques

Dans son état définitif, le BÉMÉL prendra en compte cinq domaines de connaissances : la sensibilité phonologique, les connaissances alphabétiques, la lecture des mots réels et inventés, la sensibilité grammaticale et la compréhension de phrases et de textes. La population visée par cette batterie comprendra les enfants canadiens d’expression française, résidant au Québec ou hors-Québec, de la maternelle à la sixième année du cycle primaire. Nous souhaitons en faire un outil pour l’évaluation des troubles de lecture autant qu’un outil de recherche sur le développement des capacités en lecture. Les utilisateurs visés comportent les spécialistes de l’évaluation en milieu scolaire et les chercheurs intéressés au développement de la lecture chez l’enfant.

L’élaboration des épreuves afférentes à chaque domaine de connaissances nous confronte à plusieurs défis conceptuels ou techniques. Sur le plan pratique, elles doivent permettre la différenciation fine des enfants sur la base de leurs capacités en lecture, fournir une caractérisation utile des élèves aux prises avec des troubles de lecture et guider l’élaboration des programmes d’intervention en lecture. Sur le plan théorique, ces épreuves doivent fournir une mesure valide et fiable des concepts à l’origine de leur construction et appuyer la recherche sur le développement des capacités en lecture. La recherche conduira à préciser les relations entre les cinq domaines de connaissances énumérés plus haut (Demont et Gombert, 1996 ; Spooner, Baddeley et Gathercole, 2004) et mieux caractériser la trajectoire de développement des capacités en lecture (Seymour, 1999 ; Siegler, 2002). À ce stade, nous avons complété l’élaboration et la mise à l’épreuve d’un ensemble de tests pertinents à la sensibilité phonologique, à la maîtrise de l’alphabet et au décodage des mots réels ou inventés. Nous rapportons les détails de cette étude dans la prochaine section.

Méthode

Description des échelles

La batterie de tests mise à l’épreuve dans la présente étude comprend huit échelles. Il s’agit spécifiquement de deux échelles de sensibilité phonologique (l’élision d’un phonème, l’élision d’une syllabe), de trois échelles de connaissances alphabétiques (la reconnaissance des lettres, la dénomination des lettres, la prononciation des graphèmes) et de trois échelles de traitement des mots isolés (la reconnaissance de mots communs, la lecture orale de mots réels, la lecture orale de mots inventés).

La stratégie générale utilisée dans l’élaboration de cette version de la batterie a consisté à suréchantillonner les items de chaque échelle pour ne conserver ultérieurement que ceux qui présentent les meilleures propriétés psychométriques. Par ailleurs, nous avons fait le choix, dès le départ, de construire deux formes (A et B) équivalentes de chaque échelle afin que l’instrument puisse être utilisé dans l’évaluation des programmes d’intervention en lecture. Dans cette application, les mesures prises au prétest et au post-test doivent être équivalentes, mais il est préférable qu’elles s’appuient sur des items différents afin d’éviter de confondre l’effet de l’intervention avec la familiarisation aux items présentés au prétest. Les résultats que nous avons obtenus étant très similaires pour les deux formes, nous ne rapportons ici que ceux relatifs à la forme A.

L’élision phonémique

Cette échelle est inspirée des travaux de Cormier et al. (1994, 1995) et Sénéchal (2000a, 2000b). Elle comprend 40 items dont la difficulté varie selon la position des phonèmes à retrancher et leur contexte phonologique dans la chaîne sonore. L’évaluateur présente un mot oralement et indique le phonème qui doit être retiré. L’enfant a pour tâche de retrancher le phonème-cible du mot, de réassembler les phonèmes restants et d’indiquer oralement ce qui reste de la chaîne sonore (ex. : « crayon » → en enlevant /k/ → donne « rayon »). Le stimulus et la réponse attendue forment toujours des mots réels. Les essais expérimentaux sont précédés de quatre essais d’entraînement.

L’élision syllabique

Cette échelle est une variante de la première et elle est dérivée des mêmes travaux antérieurs. Elle comprend également 40 items dont la difficulté varie selon la position de la syllabe à extraire et du nombre de syllabes dans la chaîne sonore. La tâche est similaire à l’élision phonémique. Dans ce cas, il s’agit d’extraire une syllabe de la chaîne sonore (ex. : « paradis » → en enlevant /pa/ → donne « radis »). Comme dans l’échelle précédente, le stimulus et la réponse attendue forment toujours des mots réels et les essais expérimentaux sont précédés de quatre essais d’entraînement.

La reconnaissance des lettres

On demande à l’enfant de placer son doigt, tour à tour, sur deux lettres nommées par l’évaluateur parmi un ensemble de quatre lettres par essai. La tâche comporte quatre ensembles de stimuli pour un total de huit réponses.

La dénomination des lettres

L’enfant doit nommer successivement les 26 lettres minuscules de l’alphabet présentées aléatoirement en cinq groupes de quatre lettres et deux groupes de trois lettres sur des pages séparées.

Le son des graphèmes

L’enfant doit produire le son associé à chacun de 40 graphèmes fondamentaux du français présentés selon le même mode que dans l’épreuve précédente.

La reconnaissance des mots communs

On demande à l’enfant de placer son doigt, tour à tour, sur deux mots prononcés par l’évaluateur parmi un groupe de quatre mots courants dans la littérature enfantine (Arabia-Guidet, Chevrie-Muller et Louis, 2000). L’enfant reçoit quatre ensembles de stimuli différents, ce qui donne un total de huit réponses.

La lecture orale de mots réels

Cette échelle comprend 128 mots dont la difficulté varie selon leur fréquence d’occurrence (Imbs, 1971 ; Lambert et Chesnet, 2001), la régularité des correspondances graphème-phonème (Peereman et Content, 1999 ; Véronis, 1986) et le nombre de syllabes. Les mots sont présentés en ordre aléatoire, en groupe de quatre sur une page, et l’enfant fait de son mieux pour les lire à voix haute tour à tour. Quatre essais d’entraînement précèdent les essais expérimentaux.

La lecture orale de mots inventés

Cette échelle est constituée de 36 mots inventés (ex. : lafise) dérivés de mots réels dont la structure syllabique et la longueur varient. Les mots inventés respectent les règles orthographiques du français et peuvent être prononcés. Les essais expérimentaux sont précédés de quatre essais d’entraînement.

Procédure

L’administration des huit échelles composant la batterie est répartie en deux ou quatre séances, selon les prérogatives des divers conseils scolaires. Chaque séance se fait en rencontrant un enfant individuellement dans un local de son école. L’ordre d’administration des échelles dans cette étude est fixe : a) Reconnaissance des lettres, b) Dénomination des lettres, c) Élision phonémique, d) Lecture à voix haute de la première moitié des mots réels, e) Reconnaissance des mots communs, f) Lecture à voix haute de la deuxième moitié des mots réels, g) Élision syllabique, h) Lecture à voix haute des mots inventés et i) Son des graphèmes. Le temps total requis pour administrer ces huit échelles est approximativement de 90 minutes.

Description de l’échantillon

Les huit échelles préliminaires du BÉMÉL ont été mises à l’épreuve au printemps 2002 auprès de 308 élèves (175 filles, 133 garçons) de la maternelle à la sixième année du niveau primaire. Leur âge s’étend de 5 à 13 ans. Ces élèves proviennent de deux régions canadiennes, l’Outaouais québécois et la région de Moncton au Nouveau-Brunswick.

Résultats

Pour faciliter la compréhension des résultats, nous avons groupé les échelles qui présentent un patron d’acquisition similaire. Pour chaque groupe, nous rapportons les résultats relatifs à la performance des enfants en fonction du niveau scolaire, de la maternelle à la sixième année, et la cohérence interne des items et des échelles de la batterie.

Échelles de sensibilité phonologique

La figure 1 illustre la proportion des réponses correctes aux deux épreuves de sensibilité phonologique en fonction du niveau scolaire. Le taux de réussite augmente progressivement en fonction du niveau scolaire pour l’élision phonémique, F (6, 279) = 29,84, p < 0,0001, aussi bien que pour l’élision syllabique, F (6,279) = 28.93, p < 0,0001). Courcy, Béland et Pitchford (2000) rapportent un profil très similaire avec des mots inventés. Dans la présente étude, le taux de réussite global est inférieur à 40 % à la maternelle et supérieur à 80 % à la fin de la sixième année. Les résultats montrent également que l’élision phonémique s’avère nettement plus difficile à effectuer que l’élision syllabique, F (1, 279) = 95,62, p < 0,0001.

Figure 1

Taux de réussite dans les épreuves de sensibilité phonologique en fonction du niveau scolaire et du type d’épreuve

Taux de réussite dans les épreuves de sensibilité phonologique en fonction du niveau scolaire et du type d’épreuve

-> Voir la liste des figures

Une analyse par item indique que le taux de réussite pour la plupart des items augmente à peu près uniformément avec le niveau scolaire. À la maternelle, tous les élèves échouent 20 % des élisions phonémiques ; aucune élision syllabique ne présente un tel taux d’échec. En sixième année, 7,5 % des items sont réussis par tous les élèves en élision phonémique, alors que 20 % le sont en élision syllabique. Les coefficients alpha de cohérence interne aux différents niveaux scolaires s’étalent de 0,82 à 0,93, avec une valeur globale de 0,95 pour l’élision phonémique et de 0,67 à 0,94, avec une valeur globale de 0,95 pour l’élision syllabique. Quant aux coefficients de corrélation item-total, ils varient d’un niveau scolaire à l’autre, entre -0,30 et 0,80 pour l’élision phonémique, avec une médiane de 0,44, et entre 0,01 et 0,81 pour l’élision syllabique, avec une médiane de 0,44.

Échelles de reconnaissance de lettres et de mots communs

Les épreuves de reconnaissance de lettres et de mots communs ont été conçues pour mesurer les différences inter-individuelles des enfants en début d’apprentissage. Tel qu’attendu, leur niveau de performance atteint l’asymptote supérieure à la fin de la première année du primaire. À la fin de la maternelle, les enfants reconnaissent en moyenne plus de 7,5 lettres sur 8 (moins de 10 % d’échecs), mais ne reconnaissent en moyenne que la moitié des 8 mots-cibles (autour de 50 % d’échecs). Le coefficient alpha de cohérence interne est de 0,73 pour la reconnaissance des lettres et de 0,74 pour la reconnaissance des mots. Les corrélations item-total varient entre 0,18 et 0,82 (avec une médiane de 0,48) pour la reconnaissance des lettres et entre 0,04 et 0,77 (avec une médiane de 0,50) pour la reconnaissance des mots. Les résultats donnent à penser que ces échelles seront surtout utiles dans l’évaluation des enfants d’âge préscolaire.

Échelles de connaissances alphabétiques

Le niveau de performance dans les épreuves de connaissance du nom des lettres et du son des graphèmes s’approche d’un plafonnement à la fin de la première année du primaire. Ainsi, les taux de réussite étaient de 95,1 % pour le nom des lettres et de 89,2 % pour le son des graphèmes. Ce niveau de performance demeure relativement stable jusqu’à la sixième année.

La différence entre les enfants de la maternelle et de première année est significative pour le nom des lettres, F (1, 83) = 59,54, p < 0,05, et le son des graphèmes, F (1,83) = 336,35, p < 0,05. En maternelle, les enfants connaissent un nombre nettement plus grand de noms de lettres que de sons de graphèmes (66,7 % contre 23,5 %), F (1, 28)= 101,30, p < 0,05. L’ensemble des résultats est conforme à ceux observés auprès des apprentis-lecteurs de langue anglaise (McBride-Chang, 1999) et indique que la maîtrise du nom des lettres est presque achevée à la fin de la première année du primaire, bien qu’elle ne soit pas absolument parfaite.

Une analyse plus fine par item fait ressortir qu’à la fin de la maternelle, certaines lettres (ex. : o, e, i, n, m, s, k, x) sont connues par plus de 80 % des enfants de l’échantillon, mais aucune n’est connue de tous. En première et deuxième années, plus de 40 % des lettres sont connues de tous les élèves. Toutefois, certaines lettres occasionnent encore de sérieuses difficultés (ex. : y, q, g). Le coefficient alpha de cette échelle s’élève à 0,93. Les corrélations item-total varient de 0,09 à 0,90 avec une médiane de 0,56.

La lecture des graphèmes est nettement plus difficile à maîtriser que la dénomination des lettres. Chez les élèves de la maternelle, 15 % des graphèmes sont parfaitement inconnus de tous les enfants, alors que les autres sont réussis par une proportion des enfants qui varie entre 3,6 % et 75,9 %. Entre la première et la sixième année, le taux de réussite s’élève remarquablement, mais la maîtrise absolue ne s’avère pas le fait de tous. Le pourcentage de graphèmes réussis par tous les élèves se situe encore entre 10 % et 20 % vers la fin du primaire. Certains graphèmes sont maîtrisés parfaitement ou presque dès la première année (ex. : a, o, un, eau, ch), alors que d’autres posent encore des difficultés vers la fin du niveau primaire (ex. : y, eu, gn, g). Les coefficients alpha par niveau scolaire varient entre 0,83 et 0,94, avec une valeur de 0,96 pour l’ensemble de l’échantillon. Les corrélations item-total varient entre -0,15 et 0,92 avec une médiane de 0,49.

Échelles de lecture orale de mots réels ou inventés

La majorité des enfants de la maternelle étaient incapables de lire les mots qui leur ont été présentés. Les données de ce niveau scolaire ne sont donc pas comprises dans les analyses que nous rapportons. Les mots réels sont généralement plus faciles à lire à voix haute que les mots inventés, sauf si ces premiers ont été sélectionnés pour être particulièrement difficiles, comme c’est le cas ici. En effet, nous avons manipulé la régularité orthographique, la fréquence d’occurrence et la longueur des mots afin d’en graduer la difficulté et éviter un effet de plafonnement à la fin du cycle primaire. Dans l’ensemble, les taux de lecture correcte des mots réels et des mots inventés des élèves ne sont pas significativement différents, F (1, 268) = 0,04, p > 0,001, même si la taille des échantillons d’items diffère (128 mots contre 36 mots inventés). Toutefois, comme la figure 2 l’illustre, le taux de réussite augmente assez uniformément en fonction du niveau scolaire, autant pour les mots réels, F (5, 268) = 31,84, p < 0,001, que pour les mots inventés, F (5, 268) = 17,49, p < 0,001. À la fin de la première année, les élèves peuvent lire correctement plus de 50 % des mots. Ce pourcentage s’élève à environ 90 % en sixième année.

La lecture orale de plusieurs mots est maîtrisée par à peu près tous les élèves dès la fin de la première année (ex. : non, après, mieux, libre), alors que d’autres mots sont réussis par moins de 25 % des élèves en sixième année (ex. : saccharification, clebs, exiguë). La lecture orale des mots inventés présente aussi des différences inter-items, mais comparativement aux mots réels, ces différences sont réduites et la progression du taux de réussite en fonction du niveau scolaire est relativement uniforme pour chaque mot inventé. Les coefficients alpha de cohérence interne pour les différents niveaux scolaires s’étalent de 0,89 à 0,98, avec une valeur globale de 0,99 pour les mots réels, et de 0,78 à 0,99, avec une valeur globale de 0,96 pour les mots inventés. Les corrélations item-total varient entre -0,20 et 0,95, avec une médiane de 0,36, et entre -0,10 et 0,99, avec une médiane de 0,40, pour les mots inventés.

Figure 2

Taux de réussite dans les épreuves de lecture orale en fonction du niveau scolaire et du type d’items

Taux de réussite dans les épreuves de lecture orale en fonction du niveau scolaire et du type d’items

-> Voir la liste des figures

Discussion

Le but de cet article était de rapporter les résultats préliminaires d’un programme de recherche dont l’objectif est d’élaborer un ensemble d’échelles de mesure relatives à cinq domaines de connaissances pertinents à la lecture du français : la sensibilité phonologique, les connaissances alphabétiques, la lecture de mots isolés, la sensibilité grammaticale et la compréhension de texte. Les résultats présentés ici se rapportent aux trois premiers de ces cinq domaines de connaissances et à huit échelles de mesure. Ces échelles ont été mises à l’épreuve auprès d’enfants de la maternelle à la sixième année du cycle primaire. Une telle étendue des niveaux scolaires, rare dans les travaux sur l’apprentissage de la lecture, permet d’effectuer une analyse détaillée de la sensibilité réelle et de la structure interne des échelles de mesure. Dans la suite de cette section, nous discutons des implications de ces résultats et des développements anticipés du BÉMÉL.

L’examen des coefficients alpha de Cronbach donne à penser que toutes les échelles possèdent une bonne cohérence interne. Cette observation n’a rien de particulièrement étonnant, car les concepts mesurés sont bien définis et déjà bien documentés (Coltheart et al., 2001 ; Harm et Seidenberg, 1999 ; McBride-Chang, 1999 ; Morais et Kolinsky, 1995 ; Rayner et al., 2001 ; Share et Stanovich, 1995 ; Sprenger-Charolles et Colé, 2003 ; Treiman et al., 1998). Ce paramètre est toutefois insuffisant pour assurer l’utilité des échelles. Celles-ci doivent également être constituées d’items caractérisés par des planchers et des plafonds différents afin d’assurer une sensibilité à tous les niveaux scolaires. D’autres indicateurs sont appelés à jouer un rôle important dans la sélection des items. Par exemple, les coefficients de corrélation item-total renseignent sur la force de l’association linéaire entre un item et l’ensemble des items d’une échelle. Dans ce cas, nous attendons une corrélation positive mais modeste (0,40 -0,50). Une corrélation très faible ou négative peut indiquer un item défectueux dans l’échelle. Les deux cas de figure sont présents dans nos données. Les recherches subséquentes sur le BÉMÉL viseront à améliorer ses caractéristiques psychométriques en uniformisant les niveaux de difficulté des items et en déterminant le niveau de difficulté de chaque item ainsi que sa capacité à différencier les répondants sur la base de leurs habiletés à l’aide de l’analyse de la courbe caractéristique de l’item (Bertrand et Blais, 2004).

L’élévation du taux de réussite en fonction du niveau scolaire constitue un indicateur de la sensibilité des échelles de la batterie et de leur validité. Chacune des huit échelles possède cette propriété, mais avec des planchers et des plafonds différents. Par exemple, les mesures de reconnaissance de lettres ou de mots communs ainsi que celle de dénomination des lettres dénotent peu de variation après la fin de la première année du primaire, car les cotes ont presque atteint leur niveau maximum. Soulignons que ces échelles sont essentielles pour étudier le développement précoce en lecture et la structuration des connaissances pendant la phase initiale d’apprentissage de la lecture. À l’autre extrême, le décodage des chaînes de lettres est à toutes fins utiles nul à la fin de la maternelle. On remarque un bond considérable à la fin de la première année et une progression assez régulière jusqu’à la fin de la sixième année, sans toutefois que le plafond soit atteint. Un profil très similaire est observé dans les scores d’élision syllabique ou phonémique. La capacité de manipuler les sons de la parole continue de se développer parallèlement avec l’apprentissage de la lecture. Ces observations confirment dans leur ensemble que l’apprentissage de la lecture est amorcé avant le début de la scolarisation et qu’il se poursuit tout au long du cycle primaire (Rayner et al., 2001 ; Sprenger-Charolles et Colé, 2003).

L’augmentation progressive de la performance aux échelles de lecture de mots réels et inventés vers un plateau mérite une attention particulière. Les graphèmes du français regroupent plusieurs éléments de complexité : la variabilité des chaînes de lettres, les relations graphème-phonème, leur dépendance contextuelle (ex. : c, g, em, im). Au fur et à mesure que ces unités fondamentales sont maîtrisées, que ce soit par un enseignement explicite ou implicite, on s’attend à ce que l’élève puisse décoder des chaînes de lettres de plus en plus difficiles et qu’il puisse le faire de plus en plus rapidement. Il est possible que les mesures qui s’appuient sur la justesse des réponses perdent leur capacité de discrimination au fur et à mesure que les opérations fondamentales qui président à la lecture deviennent automatiques. Ce serait le cas dans les langues à orthographe transparente, comme l’allemand, selon Wimmer (1993). Il pourrait en être ainsi du français puisque son orthographe légèrement plus transparente que celle de l’anglais facilite l’acquisition de mots (Seymour et al., 2003). Des travaux récents en français appuient l’idée de compléter les échelles existantes du BÉMÉL par des mesures chronométrées et ce, même à partir de la première ou deuxième année scolaire (Plaza et Cohen, 2003, 2004 ; Sprenger-Charolles et al., 2000).

L’exploration de la sensibilité grammaticale et de la compréhension des textes revêt un intérêt pour plusieurs raisons. Sur le plan pratique, il existe peu d’échelles de mesure qui ont été élaborées au Canada et pour des locuteurs d’expression française. Le développement de la sensibilité grammaticale a encore été très peu étudié, même dans l’ensemble de la francophonie. On dispose encore de données très fragmentaires sur la maîtrise de la morphologie grammaticale et de la syntaxe chez les élèves du cycle primaire (Lecocq, 1996).

Sur le plan théorique, la question centrale reste à savoir précisément comment les cinq domaines que nous avons identifiés contribuent au développement de la lecture. Quelle est la relation entre la sensibilité phonologique, les connaissances alphabétiques, le décodage des chaînes de lettres, les connaissances grammaticales, l’étendue du vocabulaire et l’extraction du sens ? Si plusieurs indices peuvent être tirés des nombreux travaux réalisés auprès des jeunes apprenants de langue anglaise, nous devons demeurer vigilants devant la possibilité d’observer des différences inter-linguistiques.

Enfin, une batterie d’épreuves comme le BÉMÉL n’est véritablement utile que si elle est assortie d’un cadre de référence normatif. Or la normalisation d’un tel instrument de mesure à l’échelle du Canada pose des problèmes particuliers. La vitalité ethnolinguistique de la langue française et le degré de diglossie varient considérablement entre les provinces canadiennes et des écarts importants ont été observés dans les épreuves sommatives de compréhension de texte en français entre les francophones qui résident au Québec et ceux qui résident hors-Québec (Statistique Canada, 1996, 2002). Il pourrait donc être très difficile d’établir un cadre de référence normatif pour l’ensemble des Canadiens d’expression française. Les recherches futures sur le BÉMÉL permettront de décider entre la solution retenue par les concepteurs de L’Échelle de vocabulaire en images de Peabody (Dunn, Thériault-Whalen et Dunn, 1994) de développer des normes communes et celle des concepteurs du Test de rendement pour francophones (1994) d’établir des normes distinctes pour les locuteurs d’expression française qui vivent au Québec et ceux des autres provinces canadiennes.

Conclusion

L’élaboration d’une batterie de tests pour évaluer la compétence en lecture à l’intention des enfants du cycle primaire pose plusieurs défis conceptuels et techniques. La compétence ciblée englobe plusieurs facettes conceptuelles. Chaque facette n’a pas reçu la même attention de la part des chercheurs. Si le développement de la sensibilité phonologique, des connaissances alphabétiques et du décodage des chaînes de lettres a déjà été abondamment étudié chez les élèves d’expression anglaise, l’étude de la sensibilité grammaticale et de la compréhension reste encore en friche. De surcroît, les travaux propres au français sont encore relativement rares.

La première étape de la construction du BÉMÉL fournit déjà un riche ensemble de données sur des domaines de connaissances centraux dans l’apprentissage de la lecture chez des élèves d’expression française au Canada. Ces données appuient la conclusion que les échelles que nous avons élaborées ont, dans l’ensemble, des propriétés psychométriques satisfaisantes. Par ailleurs, elles offrent une première impression du développement de capacités spécifiques de la première à la sixième année du cycle primaire. La suite du programme de recherche visera à parfaire les échelles existantes de la batterie, à poursuivre l’élaboration des échelles complémentaires pour éventuellement produire une batterie riche, polyvalente et guidée par des considérations théoriques. Parallèlement, nous nous proposons de poursuivre l’évaluation d’hypothèses dérivées des fondements théoriques mêmes de la batterie et de vérifier empiriquement ses principaux points d’appui. Cette approche situe l’élaboration de la batterie dans une démarche qui conduira à la production d’un outil utile à l’évaluation de la compétence en lecture et à l’avancement des connaissances sur l’apprentissage de la lecture en français.