Corps de l’article

1. Introduction

Une des questions importantes auxquelles tentent de répondre beaucoup d’études sur le développement cognitif et langagier chez l’enfant est de savoir quand et comment les enfants deviennent capables de penser et d’exprimer ce qui est possible ; « ce qui peut être » plutôt que ce qui est réellement. Cet élément du langage qui exprime les possibilités se nomme « modalité ». Les sens de la modalité sont divisés en deux grandes catégories : la modalité radicale (à propos de la capacité, de l’obligation, de l’intention) et la modalité épistémique (les inférences faites à partir de ce qui est connu ou perçu). Dans cet article, nous nous penchons sur la production d’occurrences épistémiques par des enfants francophones unilingues (n = 6, Paris Corpus, Morgenstern et Parisse 2007, 2012) ainsi que leur mère (input – langue « modèle » utilisée par les parents). Nos résultats contribueront à améliorer notre compréhension des mécanismes qui permettent aux enfants acquérant leur langue première de lier leurs pensées épistémiques à des formes linguistiques. Nous adoptons une approche principalement syntaxique, et nous nous concentrons sur les usages épistémiques des verbes modaux (pouvoir, devoir) et de certains adverbes (peut-être [que]), que nous comparons aux études antérieures analogues sur l’anglais (Cournane 2021, 2015b) et le serbo-croate (Veselinović et Cournane 2020). Nous montrons que les enfants francophones produisent, comme les enfants anglophones et serbo-croates, les ordres d’acquisition suivants : pour les éléments modaux, l’interprétation radicale vient avant l’interprétation épistémique ; et pour les éléments épistémiques, les adverbes viennent avant les verbes modaux (voir aussi Bassano 1996). Nous émettons l’hypothèse que ces résultats peuvent être expliqués, du moins partiellement, par le lien existant entre la chronologie acquisitionnelle et la structure syntaxique des énoncés.

La « modalité », domaine sémantique de la possibilité et de la nécessité (voir, par exemple, Kratzer 1977 ; Palmer 2001 ; Traugott 2006 ; Barbet 2015a, b ; van der Auwera et Plungian 1998), est un concept « notionnel » (Kratzer 1981), c’est-à-dire qu’il est défini par la sémantique plutôt que par la forme linguistique. Cela a comme conséquence qu’il correspond à des catégories (morpho) syntaxiques diverses d’une langue à l’autre, mais aussi à l’intérieur d’une même langue (Hacquard 2013 ; Palmer 2001 ; Traugott 2006). Les verbes modaux (pouvoir, devoir ; anglais can, must ; voir section 2) représentent les membres prototypiques de ce concept. Dans un quart des langues du monde (surtout dans la famille indo-européenne, mais pas exclusivement ; voir van der Auwera et Ammann 2005), ces verbes sont polysémiques, c’est-à-dire qu’ils possèdent à la fois un sens radical (1a, 2a) et un sens épistémique (1b, 2b). Les autres catégories qui expriment un sens de modalité, comme les verbes d’attitude (3) ou les adverbes (4), ont, à quelques exceptions près (par exemple, possible), des interprétations exclusives : soit radicales (3a, b, 4a) ou épistémiques (3c, d, 4b).

Les verbes modaux typiquement épistémiques peuvent représenter un défi pour les enfants en processus d’acquisition, et ce, indépendamment des concepts qu’ils expriment. Premièrement, la structure syntaxique qui leur est associée varie en fonction de leur interprétation (voir section 2) (Brennan 1993 ; Cinque 1999 ; van Dooren 2020 ; Hacquard 2010 ; Roberts 1985 ; Ross 1967 ; Veselinović 2019 ; Zubizarreta 1982) ; les structures syntaxiques épistémiques sont typiquement dites plus complexes (c’est-à-dire qu’elles ont une portée englobant un complément de plus grande taille ; section 2) que leurs équivalentes radicales (mais voir Rullmann et Matthewson 2018). Les verbes modaux ont des projections complexes, alors qu’un seul verbe peut projeter à la fois une interprétation épistémique et une interprétation radicale qui, chacune, possède son propre réflexe syntaxique[2]. L’enfant apprenant doit comprendre qu’un seul verbe exprime deux interprétations conceptuellement difficiles, ce qui viole le principe heuristique de la relation unique entre forme et interprétation (par exemple, Clark 1993), et qui peut demander un input particulièrement dénué d’ambigüité afin que l’enfant puisse repérer l’épistémicité (van Dooren et al. 2017, 2019). Ces modaux à double interprétation ne sont d’ailleurs pas équivalents au point de vue de l’usage : les interprétations épistémiques sont présentes dans les inputs à un taux beaucoup plus bas que les interprétations radicales (voir section 3) (pour l’anglais : van Dooren et al. 2017 ; le néerlandais : van Dooren et al. 2019 ; et le serbo-croate : Veselinović et Cournane 2020). Ce sont ces faits qui nous poussent à récolter des données de corpus de langage d’enfants afin de voir si la complexité relative des structures syntaxiques des verbes modaux épistémiques ne serait pas une cause plus probable du « délai épistémique » observé (voir section 3.1). Pour ce faire, nous comparerons l’usage de ces modaux avec celui d’un autre type d’élément épistémique qui est plus simple grammaticalement : l’adverbe qui a un simple rôle d’adjoint et qui est monosème (peut-être).

Dans le cadre de cette étude, nous nous attardons sur l’acquisition de l’expression épistémique (verbes modaux et éléments adverbiaux) par des enfants unilingues francophones : quand produisent-ils les différents adverbes et modaux, et comment cette acquisition se compare-t-elle à ce qui est observé dans d’autres langues ? Il existe de multiples facteurs qui ont une influence sur les différentes étapes de la production épistémique spontanée, et nous proposons ici d’en étudier quelques-uns de manière empirique.

Bassano (1996) a réalisé une étude exploratoire pour le français ; elle a étudié les expressions épistémiques et hypothétiques de façon générale chez un enfant francophone. Ses résultats suggèrent que les éléments épistémiques de type adverbial (les éléments plus « lexicaux », puisqu’elle adopte une approche fonctionnaliste, qui incluent l’adverbe peut-être) sont produits plus tôt que les éléments dits « grammaticaux ». Nous prenons donc ses résultats comme point de départ, en ajoutant les données de plus d’enfants, et en comparant les différentes catégories syntaxiques (éléments adverbiaux et modaux) entre elles. Nous opposerons ensuite ces résultats pour le français à des données similaires récoltées à propos d’autres langues, en mettant l’accent sur l’anglais (Cournane 2021, 2015b ; O’Neill et Atance 2000) et le serbo-croate (Veselinović et Cournane 2020).

En plus de vérifier les résultats de Bassano et de tester le lien existant entre ordre d’acquisition des expressions modales et les structures syntaxiques, ce travail situe également les premières productions des verbes modaux épistémiques du français (pouvoir et devoir) par rapport à celles de langues comme le serbo-croate et l’anglais, en plus d’apporter des preuves empiriques acquisitionnelles inédites pour l’ordre général de production épistémique du français.

Cet article est divisé de la façon suivante : la section 2 présente une synthèse des connaissances à propos de la syntaxe des verbes modaux en français, comparée à celle de l’anglais et du serbo-croate. Ceci nous permettra d’établir les faits nécessaires pour répondre à notre question liée à la complexité syntaxique. La section 3 est une synthèse des connaissances à propos de l’acquisition de ces mêmes éléments, pour en arriver à comprendre la chronologie acquisitionnelle. La section 4 présente notre étude, en incluant la méthodologie, les résultats ainsi qu’une discussion de nos résultats qui insiste sur : 1) la comparaison avec d’autres langues ; 2) le lien entre chronologie d’acquisition et complexité syntaxique. Finalement, la section 5 conclut en soulignant les principales contributions de notre article au domaine de l’acquisition de la langue première par les enfants.

2. Modalité et formes modales

2.1 La syntaxe des verbes modaux en anglais, en serbo-croate et en français

Les verbes modaux ont des comportements syntaxiques et sémantiques analogues dans les langues du monde (interprétations radicales et épistémiques, ou les deux à la fois), même s’il existe des différences spécifiques à certaines langues. Les interprétations radicales (e.g., habiletés, obligations, buts) peuvent aussi être appelées « agentives » (agent-oriented, Bybee et al. 1994), puisque la force de l’élément modal est sur l’agent de l’évènement décrit (Dino dans l’exemple [1a], avec une signification d’obligation), alors que les interprétations épistémiques sont plutôt orientées vers le locuteur, puisque la force du modal lui est liée (speaker-oriented, Bybee et al. 1994 ; le locuteur fait une inférence par rapport à ce qui est considéré vrai, comme dans l’exemple [1b]).

D’un point de vue syntaxique, en anglais, les verbes modaux sélectionnent un verbe simple (les auxiliaires modaux, comme dans must eat), un infinitif (les semi-auxiliaires modaux, comme dans have to eat) (5a), ou un verbe conjugué à un temps composé (must have eaten, has to have eaten) (5b) (pour un aperçu récent, voir Barbiers et van Dooren 2017, en plus de Lightfoot 1979 ; Roberts 1985, entre autres). Les usages comme (5a) sont autant radicaux (orientés vers le futur, c’est-à-dire que l’obligation de manger est valide à partir de maintenant) qu’épistémiques (avec une interprétation habituelle sur le verbe principal, c’est-à-dire que l’action de manger se produit de façon habituelle, fréquemment)[3]. Dans l’exemple (5a), le verbe modal est interprété à la forme logique (post-syntaxe) soit au-dessus ou plus bas que les projections du temps et de l’aspect. Si un marqueur aspectuel est présent, comme l’auxiliaire dans (5b), alors c’est l’interprétation épistémique qui est capturée (voir Hacquard 2010). En anglais, les verbes modaux sont en fait des auxiliaires invariables qui ont une position fixe en syntaxe à l’intérieur du domaine verbal (INFL, Pollock 1989), et leur interprétation est déterminée par des facteurs grammaticaux et contextuels.

De son côté, Veselinović (2019, 2016) montre que les verbes modaux en serbo-croate (morati ‘devoir’, moći, ‘pouvoir’), lorsqu’utilisés de façon radicale, génèrent tous une construction assez simple, monoclausale avec accord du modal avec le sujet et un verbe principal à la forme perfective (6a). En contraste, lorsqu’utilisés de façon épistémique, ces mêmes verbes génèrent une structure biclausale, avec SC subordonné (6b). Le verbe modal porte les marques morphologiques 3pers.sg.pres, alors que le verbe subordonné porte la marque de l’imperfectif. Nous voyons donc qu’en serbo-croate, les même modaux peuvent apparaitre dans deux structures distinctes : ils sont dans la proposition principale d’une structure biclausale lorsqu’épistémiques, mais ils sont dans une proposition indépendante lorsqu’ils ont une interprétation radicale (ils ont alors une portée sur le SMod [MoodP]). Ils sont donc des verbes « réguliers » (ils ne sont ni auxiliaires ni semi-auxiliaires), et ils requièrent un SC subordonné pour que l’interprétation épistémique soit possible (Veselinović 2019).

En français, ce sont les verbes pouvoir et devoir[5] qui sont les principaux verbes modaux (Larreya 2004 ; voir Chu 2008 pour un résumé complet de cette classe de verbes en français). D’un point de vue sémantique, ces verbes peuvent, à l’instar de leur équivalent sémantique anglais et serbo-croate, entrainer une interprétation radicale ou une interprétation épistémique (exemples 1 et 2 dans l’introduction), selon le contexte (situationnel ou grammatical) (Sueur 1977).

En français (Hacquard 2010 ; Borgonovo et Cummins 2007), les verbes modaux sont généralement considérés fonctionnels (souvent appelés semi-auxiliaires, ils se démarquent des verbes « réguliers » comme marcher ou manger) et ils portent les marques de temps, d’aspect et d’accord, et leur interprétation – radicale ou épistémique – dépend d’une variété de facteurs. Par exemple, comme avec l’anglais must, l’interprétation épistémique est favorisée lorsque le verbe principal est un verbe d’état (comme être, aimer, etc.), lorsque le verbe est conjugué à un temps composé, ou alors lorsque le sujet est explétif, impersonnel ou générique (puisque les interprétations radicales ont tendance à se retrouver plus souvent avec des sujets animés ; voir Hacquard 2010 ; Jackendoff 1972 ; Ross 1967 ; Wurmbrand, 1999). Ces verbes, dans leur interprétation épistémique, sont traditionnellement considérés comme étant des verbes à montée (en opposition aux verbes à contrôle) (Huot 1974 ; Rooryck 1989, etc.), c’est-à-dire qu’ils sont compatibles avec un sujet explétif, qu’ils peuvent régir un infinitif, et qu’ils sélectionnent un SI (plutôt qu’un SC, comme c’est le cas pour les modaux en serbo-croate) ; mais voir Wurmbrand (1999) pour une proposition selon laquelle tous les verbes modaux seraient à montée, même dans leur interprétation radicale. Aux fins de la présente démonstration, nous insistons sur les faits suivants : les verbes modaux en français partagent certaines caractéristiques avec ceux du serbo-croate ; ils s’accordent avec leur sujet et portent les flexions de temps et d’aspect. Par contre, les modaux en français ne requièrent pas de SC comme complément pour être interprétés de façon épistémique. En fait, à l’instar de l’anglais, les verbes modaux du français obtiennent leur interprétation radicale ou épistémique à partir de la combinaison de temps et d’aspect de leur préjacent (la proposition avec laquelle ils sont combinés). On peut donc sans doute penser aux verbes modaux du français comme étant situés sur le continuum de grammaticalisation entre l’anglais et le serbo-croate (voir van Dooren 2020 pour une discussion à propos des verbes modaux du néerlandais, qui seraient eux situés ailleurs sur le continuum, puisqu’ils sont verbaux comme le serbo-croate, mais ils ne peuvent introduire que leur propre SI, distinct de la proposition principale).

En somme, le français, l’anglais et le serbo-croate, langues indo-européennes faisant partie de familles distinctes, possèdent toutes des verbes modaux polysémiques. Par contre, les verbes de chacune de ces langues diffèrent par rapport à leur catégorie syntaxique, ainsi que par rapport à leurs exigences en matière d’accord, en plus de ne pas sélectionner le même type de compléments. De plus, alors que les trois langues mentionnées se rejoignent par rapport au fait que l’interprétation épistémique signifie une portée plus haute (higher scope) dans la structure que l’interprétation radicale, les langues se distinguent aussi puisque cette portée plus haute est tantôt visible dans la syntaxe (serbo-croate), tantôt furtive, donc liée à la forme logique post-syntaxique. Le tableau 1 en donne le résumé. Les différences cruciales qui y sont exposées nous permettront de répondre de façon inter-linguistique à l’hypothèse mise de l’avant dans la présente étude, à savoir s’il existe un lien entre ces faits syntaxiques et l’ordre et la chronologie d’acquisition par les enfants de ces éléments modaux.

Tableau 1

Caractéristiques des verbes modaux polysémiques en anglais, français et serbo-croate

Caractéristiques des verbes modaux polysémiques en anglais, français et serbo-croate

-> Voir la liste des tableaux

2.2 Les adverbes épistémiques en anglais, en serbo-croate et en français

Tout comme en français, nos deux langues utilisées comme comparaison possèdent des adverbes épistémiques (e.g., maybe en anglais et možda en serbo-croate) qui se comportent comme des éléments adjonctifs en syntaxe, et qui sont comparables à peut-être (exemple 8, tiré de notre corpus). Comme peut-être, ces adverbes sont monosémiques ; ils n’ont donc qu’une signification épistémique.

Syntaxiquement, peut-être et ses équivalents sont flexibles par rapport à la position qu’ils peuvent occuper dans la proposition, puisqu’ils sont adjoints. Ils peuvent également apparaitre en isolation en réponse à une question fermée. De plus, le français représente un choix de langue important pour apporter des preuves supplémentaires pour comprendre le rôle de la complexité syntaxique dans la production enfantine de la modalité épistémique, puisqu’en plus de l’adverbe peut-être, il existe aussi en français la locution conjonctive épistémique peut-être que (9).

Différente syntaxiquement de l’adverbe seul, cette conjonction sert à introduire une proposition (elle est donc toujours située en début d’énoncé), sans pour autant faire partie d’une structure biclausale complète. La structure exacte de cet élément est incertaine. Nous considérons que peut-être que s’est grammaticalisé et fait partie d’un SC défectif, dans lequel il n’y a pas de SI (le peut et le être n’ont aucune propriété verbale), mais qui peut tout de même sélectionner un SC ou un SI (voir Tailleur 2013 ; Veselinović 2019 ; Massam 2017)[6].

Le développement langagier chez l’enfant est marqué par une augmentation graduelle de la complexité grammaticale (voir Culicover et Jackendoff 2016 et Givón 2009 pour des points de vue opposés quant aux éléments spécifiques qui changent et pourquoi, et comment on mesure cette complexité ; voir Pérez-Leroux et al. 2018 pour une discussion à la lumière de l’acquisition). Pour les besoins de la présente investigation, nous définissons la complexité selon deux axes. Premièrement, nous considérons que d’acquérir des mots monosémiques (peut-être) est plus simple que d’acquérir des mots polysémiques (devoir). Deuxièmement, en termes de modifications syntaxiques, nous considérons que l’adjonction est plus simple que la complémentation (Pietroski 2005, ainsi que les travaux qui y sont cités), et que la taille (et la complexité) des compléments du verbe augmente à mesure que le langage se développe (de façon générale, on parle d’éléments nominaux > petites propositions > syntagmes verbaux) (pour un apercu à propos de la complémentation en acquisition, voir de Villiers et Roeper 2016). Si le lien avec la complexité syntaxique s’avérait, nous nous attendons donc à ce que les enfants francophones produisent la conjonction adverbiale épistémique – peut-être que – plus tard que l’adverbe simple (adjoint) – peut-être – mais plus tôt que les verbes modaux épistémiques (verbes fonctionnels).

3. Acquisition (L1) de la modalité épistémique

3.1 Études antérieures

La plupart des travaux qui se sont intéressés à l’expression de l’épistémicité l’ont fait en s’attardant plutôt sur les verbes modaux eux-mêmes (comme pouvoir et devoir), et c’est particulièrement le cas pour les études sur l’anglais (les auxiliaires comme can, will, might, etc. y étant très représentés). Les études classiques des années 1970-1980 ont observé que les enfants utilisaient ces formes dès l’âge de 2 ans avec une interprétation radicale (11a, b), et seulement plus tard, à partir de l’âge de 3 ans, avec une signification épistémique (11c) (pour un aperçu, Papafragou 1998). Cette asymétrie entre deux significations (radicale > épistémique, ou « délai épistémique ») pour un même élément lexical a souvent été interprétée comme étant le reflet d’un manque dans le raisonnement conceptuel chez l’enfant (voir Dack et Astington 2011 ; Diessel 2011 ; Papafragou 1998 ; Sweetser 1990)[7]. En effet, il a été suggéré que le concept même d’épistémicité est une réalité ou un mécanisme de pensée trop complexe (qualifié de « thinking about thinking », voir Papafragou 1998), et que les significations épistémiques seraient en fait bâties à partir de celles radicales, qui surviennent plus tôt (une découlerait de l’autre) (Diessel 2011 ; Sweetser 1990)[8].

Pourtant, les enfants semblent tout à fait capables d’exprimer des notions de doute et d’incertitude avec des éléments adverbiaux à propos de propositions, factuelles ou non, à un âge assez précoce (12) (Bassano 1996 ; Cournane 2021, 2015b ; O’Neill et Atance 2000 ; Veselinović et Cournane 2020). En fait, les recherches effectuées à propos des précurseurs conceptuels du raisonnement modal – qui conduit à son tour à l’expression langagière modale – suggèrent que les très jeunes enfants pourraient être en mesure de raisonner à propos de possibilités (voir Cesana-Arlotti et al. 2018 ; Leahy et Carey 2019) et de croyances (Onishi et Baillargeon 2005 ; Southgate et al. 2007). Ces résultats rendent plausible l’hypothèse selon laquelle le langage épistémique enfantin serait comme celui d’un adulte, tout en gardant en tête que les données de production ne peuvent être liées directement aux représentations sémantiques.

Cournane (2021 ; voir aussi 2015a, b) a examiné 17 corpus de langue enfantine tirés de la section d’anglais nord-américain de CHILDES (MacWhinney 2000), pour y trouver les usages épistémiques des verbes modaux et des adverbes (l’échantillon contenait 167 171 occurrences d’enfants jusqu’à 3;06 ainsi que 212 044 occurrences d’input). Elle a trouvé que les enfants utilisent de façon constante l’adverbe maybe avant n’importe quel usage d’un verbe modal épistémique – pour les enfants qui avaient assez de données pour le déterminer, cette différence était significative (cette précision est importante, car cela exclut la possibilité que ce résultat soit seulement un effet de l’échantillon, puisque le nombre d’occurrences de verbes modaux épistémiques est relativement bas).

Pour ce qui est des parents (input), Cournane mentionne qu’ils produisent également plus d’adverbes (maybe, probably) que de verbes modaux épistémiques (ratio 3:1), et que leurs taux d’utilisation correspondent généralement à ceux de leurs enfants, ce qui suggère que la priorité adverbiale pourrait aussi être liée à leur utilisation plus robuste dans l’input. Les premiers usages épistémiques des verbes modaux étaient en général autour de 3 ans, avec certaines exceptions (enfant montrant un développement précoce) à 2 ans (voir aussi van Dooren et al. 2017 ; sur le Manchester Corpus : Theakston et al. 2001). En général, les usages modaux épistémiques des enfants reflètent ceux de leur input, mais lorsqu’ils commencent à utiliser ces expressions, ils les utilisent à un taux significativement plus bas que ce qui est entendu dans l’input. L’étude de van Dooren et al. (2017) montre très bien que les enfants anglophones de 2 ans utilisent des modaux épistémiques à raison de 2 % de tous leurs usages de verbes modaux alors que ce ratio se situe à environ 8 % pour les adultes (voir aussi Cournane 2015a, b ; Shatz et Wilcox 1991). De plus, Choi (1991, 2006) montre que la fréquence de l’input ne peut à elle seule expliquer les usages d’éléments épistémiques ou évidentiels par les enfants coréens.

Veselinović et Cournane (2020) ont quant à elles examiné le corpus SCECL – Serbian Corpus of Early Child Language (n = 8 paires mère-enfant ; âges 1;06-4;00; 72 305 occurrences d’input, 95 105 occurrences par les enfants ; Anđelković, Ševa, et Moskovljević 2001) pour y trouver en serbo-croate les attestations de verbes modaux polysémiques, moči « pouvoir » et morati « devoir », en plus des adverbes épistémiques (možda ‘peut-être’, valjda ‘probablement’, sigurno ‘sûrement). Veselinović et Cournane n’y ont trouvé aucun usage épistémique des verbes modaux par les enfants (sur un total de 2 371 verbes modaux) et ce même si les données pour chacun des enfants vont jusqu’à l’âge de 4 ans. Les verbes modaux épistémiques des mères représentent environ 1 % de tous leurs usages de verbes modaux (23/2452). Les auteures expliquent ce résultat en se basant sur des arguments syntaxiques (voir section 2). Pour ce qui est du lien avec l’input, dès l’âge de 3 ans, les enfants ont des taux de production de modaux à interprétation radicale ainsi que d’adverbes épistémiques qui se comparent à ceux de leur mère, même s’ils ne produisent toujours pas de verbes modaux épistémiques.

Pour le français, Bassano (1996) a étudié la production modale d’un enfant (Benjamin), de l’âge de 1;09 jusqu’à l’âge de 4;00 (15 021 occurrences en tout). Avec une approche générale (exploratoire) et fonctionnaliste, elle voulait en connaitre davantage à propos de l’émergence des différents usages modaux, en mettant l’accent sur les fonctions épistémiques. Les éléments de langue inclus dans ses études sont donc plus nombreux que ce qui est décrit ici, puisqu’elle a aussi regardé le futur (aller + infinitif), les hypothétiques ainsi que les expressions figées telles que je sais pas. Cela dit, nos questions de recherche se recoupent beaucoup, et elle a observé, dans son corpus, que les interprétations radicales sont généralement produites avant les interprétations épistémiques, et que les formes « lexicalisées » (adverbes, verbes principaux) sont produites avant les formes « grammaticalisées » (flexions verbales, par exemple le mode subjonctif). Pour ce qui est de l’âge exact de production de ces éléments, elle observe que l’adverbe peut-être est produit pour la première fois à 2;07 (peut-être va partir au train), alors que le verbe devoir épistémique est produit pour la première fois à 3;03 (Benjamin l’utilise trois fois de façon épistémique, alors qu’il ne produit aucun pouvoir avec cette interprétation, le verbe pouvoir étant utilisé exclusivement avec interprétation radicale).

3.2 Prédictions pour le français

En prenant les faits décrits dans la section précédente comme point de départ, notre étude vise donc à utiliser des données acquisitionnelles du français pour vérifier la possible corrélation entre l’ordre d’acquisition des éléments épistémiques et leurs caractéristiques syntaxiques. Pour ce faire, pour chacun des éléments épistémiques à l’étude, nous considérons la catégorie syntaxique (adverbe par rapport à verbe), la structure (structure radicale ou structure épistémique pour les mêmes verbes modaux) ainsi que les difficultés d’interprétation qui découlent de sémantiques multiples (les verbes modaux polysémiques qui peuvent être soit radicaux ou épistémiques, par rapport aux éléments qui n’ont qu’une seule interprétation possible). Nous considérons – et contribuons à la renforcer – l’hypothèse selon laquelle les enfants, pendant le processus d’acquisition langagière, emploient les catégories ou structures plus complexes (i.e., biclausales) bien après les constructions plus simples (i.e., syntagmes adjoints, tels que les adverbes).

Les prédictions spécifiques à notre étude sont les suivantes :

  • Prédiction 1 : Les enfants francophones produiront des usages épistémiques de l’adverbe peut-être dès l’âge de 2 ans. Ces usages seront similaires à ceux des adultes.

  • Prédiction 2 : Les enfants francophones utiliseront les verbes modaux d’abord avec un usage radical, autour de l’âge de 2 ans ; les usages épistémiques viendront par la suite, selon la chronologie 2-A ou 2-B.

    • Prédiction 2-A : Le français sera similaire à l’anglais pour les premières occurrences de verbes modaux épistémiques, qui se produiront vers l’âge de 3 ans ;

    • Prédiction 2-B : Le français sera similaire au serbo-croate pour les premières occurrences de verbes modaux épistémiques, qui se produiront après l’âge de 4 ans.

  • Prédiction 3 : Les usages de la conjonction adverbiale épistémique peut-être que seront produits plus tard que les premiers usages de l’adverbe épistémique peut-être.

Cette étude se concentre sur la production par les enfants. Même si nous prenons en considération la contribution additionnelle qu’apportent les facteurs liés à l’input (anglais : van Dooren et al. 2017, néerlandais : van Dooren et al. 2019, serbo-croate : Veselinović et Cournane 2020), nous laissons à de futurs travaux la tâche d’étudier et d’analyser en détail les usages des verbes modaux en français dans l’input (voir Jeretič 2018). Nous considèrerons tout de même certaines données de l’input pour contextualiser les résultats.

4 Étude

4.1 Méthodologie

Nous utilisons le corpus de Paris (Morgenstern et Parisse 2007, 2012 ; CHILDES, MacWhinney et Snow 1985). Ce corpus contient 58 287 occurrences produites par six enfants francophones, monolingues, qui ont un développement langagier typique. Ces occurrences ont été enregistrées dans la maison de chacun des enfants avec le chercheur ou la chercheuse et la famille (les enregistrements par vidéo sont disponibles pour la plupart des enfants, avec une transcription pouvant être interrogée). La fréquence des enregistrements est d’environ une séance par mois jusqu’à l’âge de trois ans, puis un enregistrement à tous les quelques mois par la suite. Les corpus de Léonard et Julie sont plus variables, puisque le premier est interrompu définitivement à l’âge de trois ans, alors que celui de Julie est interrompu pendant une période de 2 ans (entre 2;06 et 4;08). Le tableau 2 contient le résumé des informations du corpus, qui contient aussi le nombre d’occurrences produites par les mères (input) dans le même corpus (91 828 occurrences au total).

Tableau 2

Résumé des corpus d’enfants, en ordre décroissant de # total d’occurrences

Résumé des corpus d’enfants, en ordre décroissant de # total d’occurrences

-> Voir la liste des tableaux

Pour les données de chaque enfant, nous avons extrait les mesures générales de développement grammatical, en incluant la longueur moyenne des énoncés (mots) – LMÉ (Mean Length of Utterance, MLU ; Brown 1973) – et le ratio type/occurrence (de l’anglais type/token ratio), une mesure de diversité lexicale. Nous avons extrait les listes de mots provenant du corpus de chaque enfant afin d’identifier tous les verbes modaux et adverbes présents avec un potentiel d’interprétation épistémique. Les éléments ont été groupés selon leur catégorie syntaxique, soit verbes modaux (13a) et éléments adverbiaux (13b). Nous ne listons que les lemmes, mais nous avons extrait toutes les formes utilisées (par exemple pour savoir : sais, sait, savons, su, sachent, etc.), même celles qui auraient pu être le résultat d’une coquille dans la transcription (savon, du).

Chacune des occurrences modales contenant un des mots en (13) fut extraite avec les quatre lignes précédentes et les trois lignes suivantes, de façon à avoir le discours en contexte. Une codeuse dont la langue maternelle est le français a fait un balayage initial des données, chronologiquement pour chacun des enfants 1) en éliminant tous les usages non modaux (i.e., lorsque pouvoir est utilisé comme nom) ; 2) en codant tous les usages modaux pour le type discursif de l’énoncé. Le type discursif de l’énoncé distingue donc les usages spontanés des usages répétés, et distingue en plus ce que nous appelons des « auto-répétitions » (lorsque l’enfant répète la même occurrence au-delà de son tour de parole).

Pour ce qui est des verbes modaux eux-mêmes, la codeuse initiale a également identifié tous les usages potentiellement épistémiques en utilisant des critères assez généraux (elle a éliminé de ce fait tous les usages qui étaient clairement radicaux, comme ceux se référant à une habileté ou à une permission, dans le cas de pouvoir). En considérant que les usages épistémiques expriment les inférences du locuteur basées sur ses connaissances ou ses expériences, alors que les usages radicaux sont plutôt liés aux habiletés, objectifs, obligations, etc., de l’agent de l’énoncé, il fut relativement simple de distinguer les deux catégories principales de modaux ([15] ; radicale, épistémique). L’objectif était de trouver les épistémiques, de sorte que les usages identifiés comme radicaux n’ont bénéficié d’aucune analyse supplémentaire. Dans les travaux de sémantique modale, déterminer la signification exacte d’un modal est généralement effectuée à l’aide d’un questionnaire introspectif, ce qui n’est pas possible lorsque nous travaillons avec des données extraites d’un corpus. Étant donné que cette tâche est difficile et peut porter à l’interprétation, nous avons inclus une mesure de certitude (16)[11]. La certitude est codée sur une échelle de trois points : 2 = tout indique un épistémique, autant les facteurs linguistiques (par exemple : sujet impersonnel, verbe d’état) que contextuels (par exemple, l’enfant essaie de se rappeler où un jouet égaré pourrait bien se trouver) ; 1 = sûrement un épistémique, étant donnés les facteurs linguistiques ou contextuels ; et 0 = certains indices linguistiques ou contextuels pointent vers un épistémique, mais ce n’est pas clair (le contexte est insuffisant, ou certains mots sont obscurs, par exemple). Deux codeuses additionnelles ont examiné de façon indépendante les occurrences plus problématiques en termes d’interprétation ou de certitude afin d’isoler pour analyse toutes les occurrences compatibles avec une intention épistémique.

Pour ce qui est des éléments adverbiaux épistémiques, nous avons fait comme pour les verbes modaux en utilisant les contextes situationnel et grammatical pour déterminer l’épistémicité de chacun. Alors que ces éléments ne sont pas polysémiques (ils n’ont pas d’interprétation radicale possible), il existe tout de même des intentions du locuteur qui se transposent plutôt en « suggestions », ce qui voile quelque peu l’interprétation épistémique de ces éléments adverbiaux. Dans la grammaire adulte, nous savons que le sens épistémique de possibilité de maybe permet de le transformer pragmatiquement en suggestion (ou en intention, avec un sujet à la première personne), comme dans Peut-être qu’on va aller/ira[12] au parc plus tard ? (ou peut-être pas, c’est juste une suggestion…). Étant donné que les enfants sont exposés à de tels exemples, il n’est pas clair s’ils sont ainsi capables d’en faire l’interprétation épistémique (et, ensuite, de les utiliser comme tels)[13]. Le code en (17a) représente le degré de certitude épistémique pour chacun des éléments adverbiaux. Pour tous les usages de peut-être, nous avons aussi codé s’ils étaient suivis de que (17b) ou non, afin de capturer la possible différence catégorielle.

Finalement, pour évaluer de façon générale pour cet élément si les usages des enfants reflètent l’input, nous considérons les taux d’usage de peut-être et peut-être que chez la mère de chacun des enfants (puisque l’anglais et le serbo-croate n’ont pas d’éléments adverbiaux qui contrastent de la même façon, ces données supplémentaires sont nécessaires). Ces données serviront à déterminer si les taux d’usage tirés de l’input influencent ceux des enfants, ce qui peut expliquer certains de nos résultats, au même titre que l’hypothèse du développement syntaxique.

4.2 Résultats

Le tableau 3 présente les mesures générales de développement pour chacun des six enfants, avec la LMÉ et le ratio type/occurrence regroupés par intervalle de 6 mois, à partir de l’âge de 18 mois. Les données après 49 mois (plus de 4 ans) ont été regroupées. Les enfants sont classés en ordre décroissant du nombre total d’occurrences (importance relative du corpus). Madeleine a, de façon constante, la LMÉ la plus haute, pour tous les intervalles d’âges, ce qui signifie que ses énoncés contiennent en moyenne plus de morphèmes. Les autres enfants sont plus typiques, avec des LMÉ qui se rapprochent de leur âge (c’est-à-dire, une LMÉ d’environ 2 à l’âge de 2 ans ; Brown 1973). Les enfants ont un ratio[14] qui se situe entre 0,08 et 0,22, et aucun des six enfants à l’étude n’a un ratio particulièrement élevé ou particulièrement bas par rapport aux autres.

Tableau 3

Mesures de développement langagier par enfant, intervalles de 6 mois

Mesures de développement langagier par enfant, intervalles de 6 mois

-> Voir la liste des tableaux

Le tableau 4 montre l’âge exact (année;mois,jour) de la première occurrence de chacun des lemmes modaux, pour les éléments adverbiaux et les verbes modaux. Cet âge est établi 1) en incluant seulement les usages spontanés (à l’exclusion des répétitions) ; 2) en omettant tous les verbes modaux ayant un degré de certitude de 0, afin que nos données soient le plus fiables possibles. Pour les verbes modaux, nous rapportons aussi le premier usage radical et le premier usage épistémique comptabilisé (les premiers usages ne concernent que les occurrences codées avec un degré de certitude de 2)[15].

Tableau 4

Âge des premières occurrences, par enfant et par expression modale

Âge des premières occurrences, par enfant et par expression modale

-> Voir la liste des tableaux

Ces données montrent que tous les enfants utilisent peut-être, avec une première occurrence qui se situe entre 1;11,16 (Théophile) et 5;03,19 (Julie). Comme le corpus de Julie ne contient aucune donnée entre 2;06 et 4;08, sa première occurrence très tardive ne peut donc pas nous renseigner sur son processus d’acquisition. Seulement deux enfants utilisent peut-être que (Madeleine et Théophile), tous deux à l’âge de 3 ans. Nous voyons en (19) les premières occurrences de peut-être pour tous les enfants, et en (20) les premières occurrences de peut-être que. Notons que la position dans la phrase de peut-être varie, même pour ces occurrences (en outre, en plus des positions exemplifiées ici, certains peut-être sont produits en position finale de la phrase : [i]l est caché peut-être, Anae, 2;0529). Finalement, seulement cinq des 78 occurrences de peut-être semblent avoir une interprétation de suggestion de la part du locuteur plutôt que purement épistémique (par exemple, je vais peut-être mettre les petites billes là, Madeleine, 6;05,04)[16].

Pour ce qui est des verbes modaux eux-mêmes, le tableau 4 montre que tous les enfants utilisent pouvoir avec une interprétation radicale (habileté, permission) à un très jeune âge, avec l’occurrence la plus précoce à l;07,03 (Anae) et la plus tardive à 2;03,00 (Léonard) (voir 21). Par contre, seulement deux enfants utilisent pouvoir de façon épistémique dans ce corpus (Madeleine et Antoine), tous deux à l’âge de 4 ans (ceci est comparable à Bassano 1996), qui n’a trouvé aucune occurrence chez Benjamin, alors que son corpus s’arrête à 4;00). Étant donné le nombre d’occurrences très limité (n = 4), nous avons inclus tous les exemples de pouvoir épistémique en (22), en ordre du plus précoce au plus tardif. Il est important de noter que trois des quatre occurrences de pouvoir épistémique (22a-c) sont conjuguées au conditionnel avec la forme pourrait (la quatrième, [22d] a la forme peut), et tous les sujets sont à la troisième personne du singulier, trois ça et un il. Deux de ces usages sont suivis par le verbe être, et les deux autres par faire. Dans tous les cas, le caractère épistémique des occurrences avec pouvoir n’est pas aussi évident qu’il ne l’est pour devoir.

Les premières occurrences de devoir sont moins rapprochées chronologiquement, puisqu’on les retrouve de 2;01,22 chez Julie, jusqu’à 4;05,23 pour Anae, alors que Léonard n’en produit aucune (son corpus ne va que jusqu’à 3;02,25). Notons que ce fait ne semble pas être dû à l’absence de modaux radicaux de nécessité (obligation), puisque tous les enfants utilisent falloir, avec les premières occurrences se situant assez tôt, entre 1;10,07 (Madeleine) et 2;09,07 (Théophile), à chaque fois avant les premières occurrences de devoir (23). Quatre enfants utilisent la version épistémique de devoir dans leur échantillon (Madeleine, Antoine, Théophile, Léonard), alors que l’âge de la première attestation varie de 3;02,25 (Léonard) à 6;03,08 (Antoine). Léonard a les premiers usages de tout le corpus, autant pour l’adverbe que pour le verbe modal épistémique. Étant donné le nombre très restreint d’occurrences (n = 7), l’exemple (24) montre toutes les occurrences de devoir utilisées de façon épistémique, de l’occurrence la plus précoce à la plus tardive. Comme nous avons pu observer avec pouvoir, les occurrences épistémiques de devoir sont relativement homogènes dans leur forme : six des sept occurrences utilisent la forme doit (l’autre est , à presque 7 ans) ; le sujet est ça trois fois sur sept, et il deux fois (et elle et ils pour les deux occurrences les plus tardives) ; quatre des sept occurrences sont suivies du verbe d’état être (les autres verbes sont dormir, glisser et se casser).

Le tableau 5 présente le décompte des usages épistémiques par enfant pour chacune des expressions modales, ainsi qu’un pourcentage total des occurrences produites avec une des expressions modales étudiées. Madeleine a le plus d’occurrences de chacune des quatre catégories d’expressions, ce qui n’est pas seulement un résultat de la taille plus importante de son corpus, puisqu’elle a aussi la proportion la plus importante d’expressions épistémiques (0,32 %) (elle a aussi la LMÉ la plus élevée). Léonard, Antoine et Julie ont moins de modaux par nombre d’occurrences que les trois autres enfants. Il y a un total de 97 usages pertinents épistémiques par les enfants, desquels 78 sont des occurrences de peut-être (80,4 %) et huit de peut-être que (8,2 %). Seulement sept occurrences de devoir ont été produites (7,2 %), et quatre de pouvoir (4,1 %). Notons que les trois enfants qui ont le pourcentage le plus élevé d’usages épistémiques, Madeleine, Anae et Théophile, sont aussi les enfants qui produisent le plus d’occurrences de peut-être, ce qui fait augmenter les taux.

Tableau 5

Décompte des usages épistémiques, par enfant et par expression

Décompte des usages épistémiques, par enfant et par expression

-> Voir la liste des tableaux

Le tableau 6 montre la distribution des usages épistémiques par intervalle de six mois. Nous voyons qu’avant 42 mois (3;02), les enfants n’utilisent que peut-être, et que ce n’est qu’après l’âge de quatre ans (48 mois) que toutes les formes épistémiques étudiées sont attestées dans la production enfantine. Des 8 occurrences de peut-être que (produites par seulement deux enfants), il y en a trois qui sont utilisées avant l’âge de 4 ans. Des onze usages épistémiques des verbes modaux devoir et pouvoir, seulement la première occurrence de devoir de Léonard (24a) est produite avant l’âge de 4 ans.

Tableau 6

Décompte cumulatif (intervalles de 6 mois), par expression (tous les enfants)

Décompte cumulatif (intervalles de 6 mois), par expression (tous les enfants)

-> Voir la liste des tableaux

Pour vérifier si les résultats des enfants reflètent l’input reçu, nous avons extrait les données de peut-être et peut-être que pour chacune des mères. Le tableau 7 montre que toutes les mères utilisent les deux expressions adverbiales, et qu’elles ont également en moyenne un taux d’utilisation de peut-être beaucoup plus élevé que peut-être que (395:68 pour les mères, comparé à 78:8 pour les enfants). Les enfants utilisent en général moins ces expressions que leurs mères (0,15 % par rapport à 0,50 %).

Les mères de Madeleine et d’Anae ont plus d’utilisations que les autres et elles ont également un taux global d’utilisation plus élevé, ce qui correspond exactement à l’usage de leurs filles respectives, qui est également plus élevé que les autres, autant pour le nombre brut que pour les taux globaux d’utilisation. Pour les usages de peut-être, qui est l’élément pour lequel nous avons le plus de données, la corrélation entre les taux de l’input et les taux des enfants est très forte (R = 0,92).

Tableau 7

Comparaison entre l’enfant et l’input (mère) pour les expressions adverbiales

Comparaison entre l’enfant et l’input (mère) pour les expressions adverbiales

-> Voir la liste des tableaux

4.3 Discussion

Nous avons émis trois prédictions en lien avec la production modale par des enfants francophones, avec une attention toute particulière accordée aux usages épistémiques des verbes modaux et de l’adverbe peut-être. Ces hypothèses ont été mises de l’avant avec deux motivations principales : premièrement, nous tenions à étudier le développement de la production modale en considérant les catégories et structures syntaxiques de chacune des constructions produites ; et, de façon tout aussi importante, nous tenions à fournir des données inédites du français de façon à avoir un portrait plus complet et inter-langagier de la production modale, en comparant avec les données de l’anglais et du serbo-croate.

Pour ce qui est de la Prédiction 1 (concernant peut-être), les enfants utilisent peut-être avant tout autre usage d’un verbe modal épistémique, dès l’âge de 1;11, mais avec la plupart des enfants qui le produisent vers l’âge de 2 ans (nous excluons ici Julie, à cause de la période manquante de ses données). Notons que ces résultats sont en moyenne plus précoces que ceux avancés par Bassano (1996), qui avait trouvé les premiers usages chez Benjamin seulement à 2;07. Les premières occurrences de peut-être apparaissent en moyenne un peu plus tard que les premières occurrences des verbes modaux à usage radical (pouvoir et falloir), mais dans notre corpus les premières attestations de chacun sont toutes deux à 1;11. Ces premières occurrences de l’adverbe épistémique peut-être, comme cela avait déjà été démontré dans d’autres langues, ne sont pas seulement des réponses isolées à des questions totales, mais semblent bien exprimer un raisonnement lié à une possibilité à propos de la proposition dénotée dans la phrase (mais voir Leahy et Carey 2019 pour une discussion à propos du raisonnement autour des possibilités survenant à l’âge de 2 ans). Ces résultats confirment donc que nous devrions rejeter l’hypothèse conceptuelle selon laquelle il existe une asymétrie entre l’expression d’un raisonnement radical, qui arriverait plus tôt, et celle d’un raisonnement épistémique, plus tardif. En réalité, les deux semblent se faire environ au même moment (l’épistémique est quand même légèrement plus tard, mais comme il est beaucoup moins fréquent, il est difficile de savoir si ce n’est qu’un effet de corpus), mais en utilisant des outils langagiers différents (verbes modaux pour le premier, adverbes pour le second). Nous pouvons expliquer ce phénomène par le fait que peut-être soit épistémique monosème (il n’a pas d’interprétation radicale possible qui lui serait associée), avec une syntaxe flexible, plate, et adjonctive, et également par le fait que ce soit un élément lexical qui est assez fréquent dans l’input (voir aussi Veselinović et Cournane 2020 ; Cournane 2021), en plus d’être souvent saillant en position initiale ou finale. Ces faits fournissent donc à l’enfant apprenant des moyens plus directs de lier l’expression épistémique à une forme épistémique plus facilement accessible.

Comme pour l’anglais maybe et le serbo-croate možda, les enfants utilisent peut-être plus tôt et beaucoup plus fréquemment que les usages épistémiques des verbes modaux. Pour le français, il existe quelques différences qui ont un impact sur les résultats comparables. Nous n’avons trouvé aucun usage d’adverbes épistémiques de nécessité (probablement, sûrement), contrairement à l’anglais, où nous retrouvons des usages de probably, et en serbo-croate, où les enfants produisent des occurrences de sigurno « sûrement ». En anglais, les enfants utilisent beaucoup moins de ces adverbes de nécessité que leurs parents (ils représentent 25 % des occurrences de l’input, alors que ce n’est que 5 % chez les enfants ; Cournane 2021), mais ils les utilisent quand même. Il est difficile de savoir pourquoi ces adverbes ne sont pas produits en français. Le seul élément que nous avons trouvé dans les corpus étudiés, autre que peut-être, est l’attribut sûr, dans la conjonction c’est sûr (que). Nous avons trouvé cinq occurrences de cet élément, dont deux en isolation (ah oui c’est sûr, Anae 3;10,00). Les trois autres occurrences sont produites par Madeleine et Antoine après l’âge de 5 ans (5;10 et 5;11). Madeleine, dans une de ces occurrences, « affaiblit » d’ailleurs la portée de l’élément de possibilité en ajoutant « un peu » :

De plus, en anglais, environ un tiers des productions de maybe étaient des suggestions, avec présence de modaux (will, can) orientant la proposition vers une interprétation future, comme dans Maybe we can go to the park later. Nous n’avons trouvé que cinq occurrences avec cette interprétation dans les données étudiées (seulement 6 % du nombre total de peut-être)[19].

La prédiction 2 (verbes modaux ; radical avant épistémique et chronologie) est aussi corroborée : les enfants francophones utilisent de façon constante les verbes modaux en premier avec une interprétation radicale, autour de l’âge de 2 ans, alors que l’usage épistémique de ces mêmes verbes vient plus tard (même chose pour Bassano 1996). Ces résultats sont comparables à ce qui avait déjà été démontré dans les études antérieures sur l’anglais et le serbo-croate (et plus généralement, section 3).

Nous nous sommes également demandé à quel âge exactement les enfants francophones utiliseraient leurs premières occurrences de verbes modaux de façon épistémique, et comment cela se comparerait-il aux premières occurrences des enfants anglophones et serbo-croates ? Les verbes modaux en français partagent des caractéristiques avec ceux des deux langues et se situent donc dans une position intermédiaire en termes de complexité syntaxique (voir section 2). La seconde partie de la Prédiction 2 suggérait donc que les enfants francophones allaient se comporter soit comme les enfants anglophones en produisant des verbes modaux avec interprétation épistémique autour de l’âge de 3 ans, soit comme les enfants serbo-croates en n’en produisant pas du tout avant l’âge de 4 ans. Les enfants des corpus à l’étude ont produit leurs premières occurrences de verbes modaux autour de leur deuxième anniversaire (souvent avec négation – peux pas – ce qui est compatible avec ce qui est observé dans d’autres langues), mais que l’usage épistémique de ces verbes modaux ne venait qu’au moins deux ans plus tard, autour de l’âge minimum de 4 ans. De plus, les usages avec devoir sont plus communs et plus clairement épistémiques (les usages avec pouvoir sont le plus souvent combinés avec une morphologie conditionnelle avec une possibilité d’interprétation circonstancielle). Cette prépondérance du verbe modal de nécessité (devoir) par rapport au modal de possibilité (pouvoir) pour le rôle épistémique n’est pas sans rappeler ce qui est observé chez les adultes serbo-croates (Veselinović et Cournane, 2020). Il semble donc que les résultats soient plus proches du serbo-croate que de l’anglais.

D’un point de vue syntaxique, rappelons que Cournane (2015a, b) et Veselinović et Cournane (2020) ont proposé que la raison pour laquelle les enfants anglophones produisent des verbes modaux épistémiques autour de l’âge de 3 ans est que ces verbes auxiliaires ont des portées plus hautes que Temps et Aspect, et que cette construction – proposition principale avec SI (SAsp) subordonnée – est productive chez les enfants environ à cet âge (2;10 à 3;0, voir de Villiers et Roeper 2016). D’un autre côté, les enfants serbo-croates ne produisent pas de verbes modaux épistémiques avant l’âge de 4 ans puisque ces derniers ont des SC subordonnées comme compléments dans cette langue, productive chez les enfants à environ 4 ans.

Par contre, comme les usages épistémiques sont en général assez rares chez les jeunes enfants, avec des taux plus bas que ce qui est retrouvé dans l’input (Cournane 2021 ; van Dooren et al. 2017, 2019 ; Veselinović et Cournane 2020), il se peut que la taille de l’échantillon joue un rôle dans nos résultats[20]. Les enfants pourraient en réalité avoir la compétence nécessaire pour produire des verbes modaux épistémiques dès l’âge d’environ 3 ans, mais comme ils sont rares dans le discours, nous n’avons simplement pas d’exemple dans nos corpus. En fait, nous avons l’exemple d’un enfant – Léonard – qui utilise le modal épistémique devoir assez tôt (3;02), et l’enfant dans l’étude de Bassano (1996) qui utilise aussi devoir épistémique à 3;03. Nous pouvons expliquer ce fait soit par l’effet d’échantillonnage : peut-être que tous les enfants sont capables de les produire aussi tôt, mais nous n’avons « attrapé » l’usage que d’un seul enfant aussi tôt (deux enfants, en incluant Bassano 1996), à cause de la rareté de la construction, surtout chez les enfants très jeunes. Ou nous pouvons aussi expliquer ce résultat par le fait que Léonard serait tout simplement plus précoce que les autres enfants avec la modalité : en fait, il utilise également l’adverbe peut-être le premier (1;11), alors cette explication semble tenir la route.

De plus, nous pouvons ajouter un argument lié à l’approche en termes de mapping, ou d’association forme-interprétation, en insistant sur les différences inter-langagières. Les enfants francophones et serbo-croates, comparativement aux enfants anglophones, ont une production plus tardive de verbes modaux épistémiques puisque les modaux pouvoir et devoir ont à la fois une interprétation radicale et une interprétation épistémique, et aucun des deux (ni de moći et morati) n’est essentiellement épistémique chez l’adulte – ces verbes sont surtout radicaux, même si l’interprétation épistémique est toujours possible (contrairement à might et must en anglais, qui sont utilisés de façon majoritairement épistémique dans le langage adulte adressé à l’enfant ; van Dooren et al., 2017). Ces faits ont comme conséquence de rendre les signaux provenant de l’input moins clairs pour les enfants, puisqu’ils doivent associer ces verbes à des interprétations épistémiques en plus de les associer à des interprétations radicales (Papafragou 1998; van Dooren et al. 2017), beaucoup plus nombreuses (cette réalité est aussi présente en serbo-croate) (Veselinović et Cournane 2020). Il n’existe pas d’équivalent verbal en français pour exprimer la possibilité épistémique, alors que pouvoir est rare dans ce contexte, n’est produit que tardivement (après 4 ans) et qu’il est la plupart du temps utilisé au mode conditionnel.

Nous croyons qu’il est en fait très peu probable que les enfants francophones et anglophones, lors de production langagière dans des environnements similaires, diffèrent dans leurs raisonnements exprimés, alors qu’il est tout à fait plausible que ce ne soit que les stratégies grammaticales utilisées pour le faire qui se distinguent. Les taux beaucoup plus bas de verbes modaux utilisés par les francophones par rapport aux anglophones (en comparant nos résultats avec ceux de l’étude de van Dooren et al. 2017 et Cournane 2021) peuvent être attribuables aux façons d’utiliser le mode et la modalité dans une langue particulière pour exprimer différentes notions sémantiques ; pour l’anglais ça peut être à l’aide d’un modal comme might, mais en français ce serait plutôt la morphologie du mode conditionnel présent sur le verbe principal (Bassano [1996] a d’ailleurs trouvé que la stratégie morphologique d’utiliser le subjonctif et le conditionnel arrive plus tard que les stratégies plus lexicales).

Bien qu’il est vrai que notre échantillon d’usages de verbes modaux épistémiques soit très restreint, les propriétés observées des sujets (impersonnels, troisième personne) et du type de verbes des propositions (souvent verbes d’état) sont conformes à ce qui est généralement décrit dans la théorie (voir Condoravdi 2002 ; Hacquard 2011 ; Ramchand 2018 ; Werner 2006 ; i.a.), mais également observé dans les données sémantiques et distributionnelles, et ce également dans les études qui s’intéressent à l’input (van Dooren et al. 2017, 2019). Ceci suggère donc que les enfants francophones reconnaissent et reproduisent les corrélations syntactico-sémantiques liées à l’usage épistémique des verbes modaux de leur input.

Finalement, par rapport à la Prédiction 3 (peut-être avant peut-être que), les enfants francophones semblent bel et bien utiliser peut-être que de façon plus tardive que le plus simple peut-être. Par contre, seulement deux des six enfants du corpus utilisent cette forme, pour les premières fois à 3;03 et 3;08, et les taux d’utilisation sont très bas (n = 8, surtout par Madeleine). Pour vérifier si les résultats des enfants reflètent l’input reçu, nous avons extrait les données de peut-être et peut-être que pour chacune des mères. Ces dernières utilisent aussi peut-être plus souvent que peut-être que, et le taux d’usage général pour chacun des enfants correspond à celui de leur mère respective (quoique de façon générale le taux des enfants est moins élevé que celui des mères), ce qui suggère que l’input semble jouer un rôle dans les usages précoces de peut-être. La fréquence de l’input ainsi que les facteurs syntaxiques représentent donc des explications possibles des résultats obtenus.

5. Conclusion

Quand les enfants sont-ils en mesure d’exprimer à l’aide de leur langue leur raisonnement épistémique avec formes modales ? Que peuvent nous apprendre les données du français, en considérant les catégories syntaxiques propres aux formes épistémiques qui sont liées à une seule ou à plusieurs interprétations distinctes (seulement épistémique pour des adverbes tels que peut-être, mais plusieurs interprétations possibles pour des verbes modaux tels que pouvoir) ? Cette étude a démontré que les enfants produisent, autant en français que ce que nous savions déjà en anglais et en serbo-croate, l’ordre d’acquisition suivant : adverbe épistémique (i.e. peut-être) > verbes modaux épistémiques[21]. Pour ce qui est des verbes épistémiques eux-mêmes, les enfants produisent d’abord leur première occurrence avec une interprétation radicale, puis, en moyenne 2 ans plus tard, ont des usages avec interprétation épistémique. Malgré les données assez limitées (seulement deux enfants sur six l’utilisent), nous avons aussi pu observer que l’expression adverbiale peut-être que, qui représente ce que nous avons appelé un SC défectif, est produite plus tardivement que l’adverbe simple (SAdv) peut-être. Nous concluons que ces résultats ne sont pas dus à la complexité conceptuelle de l’épistémicité, puisque les mêmes pensées épistémiques peuvent être exprimées par différentes catégories, mais bien au fait que les enfants acquièrent les différentes catégories et structures syntaxiques à des moments différents, selon leur capacité à reconnaitre les interprétations multiples autant que selon la façon dont ces éléments sont attestés dans l’input.