La citation comme source de renseignements métalangagiers dans l’article scientifique

Collet, Tanja

doi:https://doi.org/10.7202/1083183ar

1. Introduction

Dans ce texte, nous examinerons la valeur terminologique de la citation, une convention d’écriture particulièrement caractéristique de l’article scientifique. En effet, l’article scientifique, une forme du discours universitaire qui est destiné à la communauté scientifique et où, donc, la scientificité (et non la didaxie) domine (Pollet 1997 : 774), renferme souvent ce que Kocourek (1982 : 19) avait appelé un « dialogue scientifique simulé » dont la base est la référence et la citation. Dans l’article scientifique, l’auteur, on le sait, « ne parle pas seul », mais « cite d’autres chercheurs, et il leur répond, il interprète, il interroge, il critique, il réfute, il consent » (Kocourek 1982 : 19). Ces quelques lignes introductrices constituent d’ailleurs déjà un bel exemple de ce dialogue simulé que construit l’article scientifique ; dialogue qui a pour effet d’adoucir la nature plutôt monologique de ce genre de texte, qui émane, en principe, d’un auteur, soit unique ou collectif, dont il présente, en quelque sorte de manière ex cathedra, les idées.

Au sein de ce dialogue simulé, la citation peut prendre plusieurs formes. Elle peut être directe (elle transmet, dans ce cas, mot pour mot les paroles de l’auteur cité) ou indirecte (elle rapporte alors la substance des paroles de l’auteur cité tout en les reformulant). L’exemple 1 ci-dessous illustre la citation directe et l’exemple 2 la citation indirecte.

Elle peut, par ailleurs, être fusionnée (la référence, souvent du type Auteur (année : page), est, dans ce cas, intégrée syntaxiquement à la phrase qui contient ou introduit la citation) ou non-fusionnée (la référence, prenant souvent la forme (Auteur Année : Page), suit alors la citation, mais sans s’insérer dans la structure syntaxique de l’énoncé). Cette distinction correspond, il importe de le mentionner, à celle établie par Swales (1990) entre integral et non-integral citations. L’exemple 3 ci-dessous est une citation fusionnée. L’exemple 4, quant à lui, représente une citation non fusionnée.

Enfin, elle peut être longue et dépasser 3 à 5 lignes de texte, ou se limiter au contraire à quelques mots, en quel cas elle est dite courte.

Quelle que soit sa forme, la citation remplit de nombreuses fonctions au sein du dialogue simulé qu’elle aide à construire. En effet, on peut en identifier au moins trois que la citation tend à réaliser simultanément au sein de l’article scientifique. À ces trois fonctions plutôt canoniques s’ajoute, en outre, une quatrième qui n’est pas toujours réalisée, contrairement aux trois premières. C’est, toutefois, sur cette quatrième fonction que cet article se penchera, car c’est elle qui confère à la citation une utilité terminologique.

La fonction première de la citation, qui est aussi la mieux connue, consiste à signaler à l’aide d’une référence, fusionnée ou non, qu’une réflexion ou donnée, reproduite mot pour mot ou sinon paraphrasée, a été empruntée à un autre auteur (Kaplan 1965). Il s’agit de la fonction normative de la citation, dont l’emploi, on le sait, est imposé par les règles éthiques gouvernant la pratique professionnelle des chercheurs en milieu universitaire. En effet, ceux-ci sont tenus d’identifier leurs sources ; toute déviation de cette règle constituant une violation de l’éthique professionnelle qui risque d’entraîner une accusation de plagiat. Cette fonction, qui rend l’emploi de la citation particulièrement répandu dans les articles scientifiques, se repère dans l’exemple 5 qui suit :

Dans cet extrait, l’auteur semble tirer dans la deuxième phrase une conclusion des travaux cités dans la première phrase, notamment ceux de Bialystok et Hakuta (1999) et de Marinova-Todd et al. (2000). Cependant, la référence non fusionnée à la fin de la deuxième phrase signale clairement que la conclusion, qualifiée de légitime par l’auteur et exprimée en ses propres mots, n’est pas la sienne, mais bien celle de Marinova-Todd et al. (2000).

Outre sa fonction normative, la citation réalise au moins deux autres fonctions dans l’article scientifique ; fonctions qui dérivent toutes deux de la première, et dont l’une peut être qualifiée d’historique et l’autre de rhétorique.

En effet, la citation, toujours normative, signale, d’une part, que l’article et son contenu ne doivent pas être considérés comme des construits originaux dans le sens absolu du terme, mais bien plutôt comme les derniers chaînons d’un réseau d’articles et de travaux de recherches qui portent tous sur des sujets connexes voire identiques. La citation illustre ainsi la dimension historique de l’article scientifique, puisqu’elle l’insère dans l’évolution scientifique de son domaine en le rattachant aux travaux qui l’ont précédé et en ouvrant la voie aux citations futures dans les travaux qui lui feront suite. La citation souligne de cette manière que le progrès scientifique repose sur une collaboration fondamentale (Rose 1993/1994), dont le dialogue simulé dans l’article scientifique est en quelque sorte l’expression indirecte. L’exemple 6 ci-dessous constitue un bel exemple de cette percolation du savoir scientifique :

Dans l’extrait, l’auteur mentionne en 2001 les travaux de Hyltenstam et Abrahamsson effectués en 2000 et qui se basaient, entre autres, sur un projet de recherche réalisé en 1998 par Ekberg.

Par l’établissement de ces liens historiques, la citation cherche, d’autre part, à augmenter la force de persuasion de l’article (Gilbert 1977 ; Brooks 1986). En effet, les liens signalés par la citation sont généralement élaborés de façon stratégique, donc à l’avantage de l’article et des propos qu’il avance. Ils résultent d’un choix opéré délibérément par l’auteur parmi la totalité des travaux antérieurs en fonction d’un certain nombre de critères, comme entre autres la pertinence et la qualité des textes et la réputation et le rayonnement de leurs auteurs. La citation permet ainsi à l’auteur de l’article de faire montre de son savoir, donc de démontrer sa maîtrise du sujet.

Aux trois fonctions précédentes, celles normative, historique et rhétorique, s’ajoute une quatrième qui n’est, cependant, pas réalisée par toute citation. Cette fonction, qui a d’ailleurs beaucoup moins retenu l’attention des chercheurs que les trois premières, peut être qualifiée de métalangagière, car les citations qui l’exécutent rapportent des passages qui expriment des faits relatifs à la terminologie d’un domaine. En effet, la citation peut viser à rehausser l’efficacité et la précision du langage utilisé pour exprimer le contenu de l’article. La citation retrace et analyse, dans ce cas, des emplois antérieurs d’un terme souvent afin d’en préciser le sens. Ce type de citation se repère, entre autres, dans les articles en sciences humaines et sociales où la terminologie à employer varie souvent en fonction du cadre théorique retenu. En voici un exemple :

Dans des études antérieures publiées en anglais (Collet 2016 ; Collet 2018), nous avons employé l’expression semantic marker pour identifier les citations qui remplissent cette fonction métalangagière. Dans cet article, rédigé en français, nous appellerons ces citations des marqueurs sémantiques, traduction qui s’éloigne peu de l’expression anglaise originale et qui évoque bien, par ailleurs, le fonctionnement discursif de ces citations qui agissent dans le texte comme des balises qui guident la lecture et dirigent l’interprétation que le lecteur en fera.

Le but de cet article est d’examiner les types de renseignements métalangagiers, allant d’éléments définitionnels à des informations étymologiques, qu’une telle citation est susceptible de contenir. En effet, ce type de citation constitue, en quelque sorte, un cas particulier de ce que Meyer (2001) avait appelé « knowledge-rich context » ou KRC (contexte riche en connaissances ou CRC [voir par exemple Hmida, Morin et Daille 2015 ; Hmida 2017 ; Lefeuvre et Condamines 2017]), un segment de texte riche en informations terminologiques.

Nous commencerons l’article par un examen contrastif du marqueur sémantique et du CRC. Nous présenterons, par la suite, la gamme des renseignements terminologiques véhiculés par les marqueurs sémantiques et examinerons, de plus, leur prévalence au sein de plusieurs domaines. Nous nous servirons, à cet effet, de données, quantitatives et qualitatives, tirées d’un corpus de textes couvrant plusieurs disciplines en sciences humaines et sociales, notamment la traduction, la linguistique, la psychologie, la sociologie et l’histoire. Il va sans dire que nous jugeons que les marqueurs sémantiques constituent une ressource précieuse pour quiconque veut dresser la terminologie d’un domaine en science humaine ou sociale. C’est en tout cas ce que nous voulons démontrer.

2. Marqueurs sémantiques et CRC

L’article scientifique est un construit qui se constitue, comme l’avait déjà observé Kocourek (1991a : 61), de deux sortes de passages : les uns métalangagiers et les autres non métalangagiers. Les passages métalangagiers correspondent à des segments qui expriment des faits relatifs aux termes employés, par exemple à leur sens, leur origine, leur forme et leur emploi. Les passages non métalangagiers, quant à eux, sont des segments qui présentent entre autres des faits scientifiques rattachés à la thématique de l’article. Les passages métalangagiers apportent, selon Kocourek (1991a : 61-62), avant tout des précisions sémantiques axées sur la définition ou la redéfinition des termes employés. En fait, ces passages participeraient aux processus de formation et de terminologisation des termes, car, selon Kocourek (1991a : 105), les termes ne peuvent être considérés tels que quand ils sont définis et employés dans des textes de spécialité, comme par exemple l’article scientifique.

En 2001, Meyer (2001 : 281) propose, mais dans le domaine du dépouillement automatique de corpus spécialisés, une notion connexe aux passages métalangagiers de Kocourek (1991a), notamment celle de contexte riche en connaissances ou CRC. Il s’agit de segments textuels, donc de contextes, qui « jouent un rôle prépondérant dans la compréhension des termes » (Hmida, Morin et Daille 2015 : 425), car ils renferment des éléments définitionnels. Meyer (2001) semble, ainsi, confirmer ce que Kocourek (1991a) avait observé, notamment que les passages métalangagiers fournissent majoritairement des informations qui permettent d’appréhender le sens d’un terme. Meyer (2001 : 283) distingue, pour sa part, deux grands types de CRC : ceux qui définissent (« defining KRC ») et ceux qui expliquent (« explanatory KRC »).

Le premier type de CRC se compose d’un énoncé définitoire qui respecte, selon Meyer (2001 : 283), la définition aristotélicienne, à savoir X = Y + traits particuliers, même si les CRC ne suivent pas toujours l’ordre linéaire de cette formule classique. La définition aristotélicienne se scinde en deux parties, qui sont en principe échangeables : le definiendum qui identifie le terme à définir (X) et le definiens qui associe à un hyperonyme (Y) du terme à définir (X) des traits particuliers ou différentiels. Considérons, par exemple, le CRC définitoire suivant, tiré de Meyer (2001 : 287) : « Compost is perhaps best defined as organic material deliberately assembled for fast decomposition ». On repère dans ce CRC les deux parties de la définition aristotélicienne : le definiendum, d’une part, notamment « compost », et le definiens, de l’autre, « organic material deliberately assembled for fast decomposition ». Quant à la suite, « is perhaps best defined as », qui relie le definiendum au definiens, elle correspond à ce que Meyer (2001 : 290) appelle un « knowledge pattern » ou patron de connaissances (PC) (Hmida, Morin et Daille 2015 : 426). Les patrons de connaissances, qui peuvent être de type lexical, grammatical ou paralinguistique selon Meyer (2001 : 290), identifient des relations sémantiques existant entre deux termes. Parmi les patrons de connaissance de type lexical marquant l’hyperonymie, Meyer (2001 : 290) liste, entre autres, « defined as ». Par souci de précision, il nous faut, cependant, noter ici que dans des travaux plus récents en terminologie et en ingénierie des connaissances (tels, par exemple, Marshman, L’Homme et Surtees 2009 ; Lefeuvre et Condamines 2017) qui exploitent le concept de CRC de Meyer (2001), « defined as » est appelé un « marqueur de relation (conceptuelle) » qui constitue la composante centrale d’un patron de connaissances, noté X is _ defined _ as Y.

Quant au deuxième type de CRC, il se compose d’un énoncé qui propose également des fragments définitionnels, mais qui ne respecte pas la définition aristotélicienne. En effet, ce CRC renseigne sur le terme à définir sans recourir à un hyperonyme. Meyer (2001 : 287) propose la formule, X ⊃ caractéristiques, pour le CRC explicatif, car « the concept designated by X either “must have” or “typically has” one or several conceptual characteristics ». Le CRC explicatif indique, d’ailleurs, souvent une relation partitive ou méronymique. Par exemple, le CRC explicatif, « Compost contains nutrients, nitrogen, potassium and phosphorus », tiré de Meyer (2001 : 287), se constitue du verbe « contains », la composante centrale du patron de connaissances X _contains_Y, qui établit entre « compost », le terme illustré, et « nutrients, nitrogen, potassium and phosphorus » une relation méronymique.

Les marqueurs sémantiques, c’est-à-dire les citations qui remplissent dans l’article scientifique une fonction métalangagière, se rangent parmi les passages métalangagiers identifiés par Kocourek (1991a). Ils se rapprochent, de plus, également des CRC identifiés par Meyer (2001) sans, toutefois, coïncider totalement avec ces segments textuels.

D’abord, de toute évidence, parce que les marqueurs sémantiques sont des citations. Ce cas n’est pas considéré par Meyer (2001), dont les objectifs de recherche axés sur le dépouillement automatique de corpus spécialisés diffèrent sensiblement des nôtres en analyse du discours scientifique et visant, entre autres, le fonctionnement discursif des termes. Il est tout de même brièvement noté par Pearson (1998 : 118), dont le concept de « defining expositive » est analogue à celui de CRC, selon Meyer (2001 : 300) :

A defining expositive may be explicitly signalled in texts […] ; in such cases, the author may preface the definition by referring to the original author of the definition, the inventor of the concept.
Pearson 1998 : 118

Cette différence est, cependant, significative, du moins dans le cadre de notre approche qui se veut davantage discursive. En effet, pour nous, les marqueurs sémantiques constituent des segments textuels qui, tout en participant à la mise en discours du terme, illustrent de par leur nature même l’originalité du terme, c’est-à-dire ce qui le distingue des autres lexèmes de la langue, et qui réside dans le fait qu’il est le produit d’un acte de dénomination explicite (Mortureux 1995 : 16), acte qui est retracé et identifié par la citation. Les marqueurs sémantiques confirment, ce faisant, que le concept de la propriété intellectuelle peut s’appliquer, du moins dans les genres textuels appartenant au discours universitaire, au terme et à son sens. Considérons, par exemple, le marqueur sémantique ci-dessous, qui contient, certes, des éléments définitionnels, mais qui nomme, de plus, de façon explicite le chercheur qui a pensé et nommé le concept dont il est question. En fait, le marqueur identifie et le chercheur et l’oeuvre et l’année de sa première parution :

Ensuite, parce que les marqueurs sémantiques, bien qu’ils fournissent souvent des informations qui permettent de saisir le sens d’un terme, rapportent aussi d’autres faits métalangagiers relatifs, par exemple, à la genèse du terme ou à sa position au sein d’une terminologie. Le marqueur sémantique qui suit en constitue un bel exemple. Il identifie un cas de foisonnement terminologique particulièrement riche dans une branche de la linguistique appliquée qui s’intéresse à l’étude du bi- et multilinguisme. Par l’énumération des différentes appellations, toujours associées aux noms des chercheurs qui les ont créées, le marqueur signale que la réflexion sur la thématique de l’article est récente et que la terminologie employée est donc tout aussi jeune et en voie de formation :

Finalement, il nous faut noter que les marqueurs sémantiques, qui cherchent à définir ou à expliquer le sens d’un terme, présentent, quant à eux, le plus souvent la forme d’un CRC définitoire ou explicatif, même si leur structure varie généralement en fonction des exigences stylistiques du passage qui les contient. Les marqueurs sémantiques, qui visent à définir un terme, renferment, par exemple, souvent les trois composantes canoniques du CRC définitoire, telles qu’identifiées par Meyer (2001) : definiendum, definiens et patron de connaissances. C’est le cas du marqueur sémantique qui suit. On y repère le terme défini, heritage language learner, qui constitue le definiendum et qui est lié au definiens, la suite mise entre guillemets et tirée mot pour mot de Hornberger et Wang (2008), par l’expression, in … definition of … as, qui signale la présence d’une hyperonymie entre les deux autres parties de la définition.

D’autres marqueurs sémantiques juxtaposent à l’occasion directement le definiendum et le definiens de la définition aristotélicienne. Le marqueur sémantique ci-dessous, par exemple, emploie bien la formule aristotélicienne, X = Y + traits particuliers, pour définir un concept étudié en psychologie, notamment survivor guilt. La virgule, qui sert à signaler l’existence d’une hyperonymie entre guilt et survivor guilt, joue dans cette structure appositive (Borillo 1996) le rôle d’un patron de connaissances paralinguistique (Meyer 2001 : 290-291).

Enfin, à la façon du CRC explicatif, le marqueur sémantique explicatif ne définit pas, mais fournit d’autres informations qui permettent de saisir le sens du terme. Le marqueur sémantique ci-dessous, par exemple, se sert du patron de connaissances, X is_marked_by Y, pour signaler ce qui peut marquer, dans un texte écrit, l’engagement de l’auteur, c’est-à-dire sa position sur un sujet. Seule la référence non-fusionnée, (Hyland, 2008a, p. 11), distingue dans le cas présent le marqueur sémantique du CRC.

3. Fonctions métalangagières du marqueur sémantique

Dans une étude antérieure (Collet 2016 ; Collet 2018), nous avons dépouillé un corpus de textes dans le but de dresser un inventaire des informations sémantiques ou métalangagières que fournissent les marqueurs sémantiques. Ce corpus se composait d’une soixantaine d’articles en traductologie parus entre 2001 et 2011 dans la revue Meta, publiée par les Presses de l’Université de Montréal. Les articles, rédigés en français ou en anglais, avaient été tirés au hasard des numéros suivants : 46/2 (2001), 47/1 (2002), 49/1 (2004), 53/3 (2008), 53/4 (2008), 55/3 (2010), 56/1 (2011), 56/2 (2011), 56/3 (2011) and 56/4 (2011).

Le dépouillement de ce corpus nous a permis de diviser les marqueurs sémantiques en cinq grands groupes, selon les informations métalangagières qu’ils contiennent :

Marqueurs sémantiques qui visent le sens du terme. Il s’agit de marqueurs, soit définitoires, soit explicatifs, qui renferment des fragments de définitions. Ces marqueurs peuvent, en outre, identifier des cas de polysémie.
Marqueurs sémantiques axés sur la genèse du terme, donc sur l’acte de dénomination dont il est le produit. Il s’agit de marqueurs qui identifient par qui, quand, comment ou pourquoi un terme a été créé.
Marqueurs sémantiques qui s’intéressent à la place occupée par le terme au sein d’une terminologie. Il s’agit de marqueurs qui identifient des relations sémantiques, telles que la synonymie, l’hyperonymie, etc.
Marqueurs sémantiques qui portent sur l’usage du terme. Il s’agit de marqueurs qui identifient pour le terme illustré une connotation, un domaine particulier d’emploi, etc.
Marqueurs sémantiques interlinguistiques. Il s’agit de marqueurs qui donnent pour le terme illustré des équivalents de traduction dans d’autres langues.

Sur la base de ce premier regroupement, nous avons déterminé que les marqueurs sémantiques tendent à réaliser au sein de l’article scientifique au moins huit fonctions métalangagières ou sémantiques différentes (appelées « semantic features » dans Collet 2016 et 2018), qui chargent le texte de renseignements qui peuvent être utiles à des fins terminographiques. En effet, selon la nature de l’information métalangagière qu’ils communiquent, les marqueurs peuvent avoir :

une fonction définitoire ;
une fonction dénominative ;
une fonction de désambiguïsation (polysémie) ;
une fonction étymologique ;
une fonction relationnelle (synonymie) ;
une fonction relationnelle (hyperonymie) ;
une fonction pragmatique ;
une fonction interlinguistique.

Nous avons, plus récemment, constitué un deuxième corpus composé cette fois-ci de textes publiés dans d’autres domaines, mais tous en sciences humaines et sociales, à savoir la linguistique, l’histoire, la psychologie et la sociologie. L’analyse de ce deuxième corpus s’est faite d’abord dans l’optique de vérifier le bien-fondé de la première typologie. Ensuite, les données recueillies ont été employées à des fins contrastives, notamment pour calculer la distribution disciplinaire des marqueurs sémantiques présents dans le corpus. Ce deuxième corpus comprend une quarantaine d’articles, tous rédigés en anglais, qui se répartissent comme suit sur les quatre domaines retenus :

histoire : 10 articles tirés au hasard de la revue Canadian Journal of History ;
linguistique : 10 articles tirés au hasard de la revue Annual Review of Applied Linguistics ;
psychologie : 10 articles tirés au hasard de la revue Psychoanalytic Psychology ;
sociologie : 10 articles tirés au hasard de la revue Sociology.

Les articles du deuxième corpus ont tous été publiés entre 2000 et 2018 dans les numéros suivants :

histoire : 35(avril 2000), 35 (décembre 2000), 39 (août 2004), 42 (printemps-été 2007), 42 (automne 2007), 43 (automne 2008), 43 (hiver 2008), 46 (hiver 2011), 52(1) (2017) ;
linguistique : 21 (2001), 25 (2005), 30 (2010), 32 (2012), 34 (2014), 35 (2015) ;
psychologie : 25(2) (2008), 27(1) (2010), 30(1) (2013), 31(2) 2014, 33(1) (2016), 34(4) (2017), 35(1) (2018) ;
sociologie : 39(5) (2005), 41(3) (2007), 47(3) 2012, 48(1) (2014), 49(1) (2015), 49(4) (2015), 50(3) 2016, 50(6) (2016), 51(6) (2017), 52(2) (2018).

Les articles, tous d’une longueur comparable de 8 000 à 10 000 mots, ont été tirés au hasard des quatre revues susmentionnées, selon la méthode désormais classique conçue par Moravcsik et Murugesan (1975) en analyse de citations. Ensuite, en suivant les principes de l’analyse de contenu de citations (voir par exemple Chubin et Moitra 1975), nous avons effectué une lecture intégrale de chaque article, considéré comme le produit d’une production écrite soumise aux conventions d’écriture ayant cours dans le domaine du savoir dans lequel l’article s’insère. Les citations repérées lors de la lecture ont été analysées au sein de l’article les contenant et retenues si elles présentaient des indices linguistiques ou encore des indices typographiques révélant et confirmant leur valeur sémantique. Par indices linguistiques, nous entendons le recours au sein de la citation à des constructions souvent, mais non uniquement verbales, comprenant des mots tels que define, describe, explain, refer to, call, distinguish, term, definition, etc. Quant aux indices typographiques, il s’agit typiquement de l’emploi d’italiques ou de guillemets pour faire ressortir des mots ou des expressions, donc afin de les distinguer du reste de l’énoncé. En l’absence d’indices linguistiques ou typographiques, le sens général de la citation, soupçonnée d’être un marqueur sémantique, a été analysé au sein du passage de texte la contenant afin de trancher la question de son extraction. Le marqueur sémantique ci-dessous, par exemple, présente à la fois des indices linguistiques (notamment the term, originally, used by) et typographiques (les guillemets anglais simples entourant the generalized other) et a donc été extrait :

Aussi, il nous faut préciser que nous avons par le biais de cette méthode d’extraction non outillée retenu uniquement les citations qui sont des marqueurs sémantiques et avons écarté de nos considérations, tant qualitatives que quantitatives, celles qui ne le sont pas. Cette approche se justifie dans le contexte du double objectif de cette étude, qui visait d’une part à valider la typologie élaborée lors de la première étude et de l’autre à scruter la prévalence des différentes sortes de marqueurs sémantiques au sein des quatre sous-corpus qui se répartissent sur autant de disciplines.

L’analyse du deuxième corpus a mené à une mise à jour de la première typologie reproduite ci-dessus. En effet, sur la base des nouvelles données recueillies, nous avons ajouté à cette première typologie une fonction métalangagière, qui n’était pas réalisée dans le corpus Meta, à savoir une troisième fonction relationnelle, mais axée sur l’antonymie. Cet ajout porte à neuf le nombre des fonctions métalangagières que nous avons jusqu’à présent identifiées pour les marqueurs sémantiques :

une fonction définitoire ;
une fonction dénominative ;
une fonction de désambiguïsation (polysémie) ;
une fonction étymologique ;
une fonction relationnelle (synonymie) ;
une fonction relationnelle (hyperonymie) ;
une fonction relationnelle (antonymie) ;
une fonction pragmatique ;
une fonction interlinguistique.

Dans la suite de cette section, nous analyserons différents types de marqueurs sémantiques au moyen d’exemples extraits des quatre sous-corpus susmentionnés. Selon l’information métalangagière fournie, nous dirons que le marqueur remplit une fonction définitoire, une fonction dénominative, une fonction interlinguistique, etc. Il convient de noter, cependant, qu’un marqueur peut réaliser plus d’une fonction à la fois, quand il fournit, par exemple, plus d’une sorte d’information métalangagière. Un marqueur peut, donc, être simple, c’est-à-dire n’avoir qu’une seule fonction, ou complexe et exécuter plusieurs fonctions. Nous donnerons des exemples des deux cas.

Marqueur sémantique à fonction définitoire : marqueur qui définit ou qui explique un ou plusieurs termes.

Le marqueur, que nous venons de reproduire ci-dessus, est un bel exemple d’un marqueur simple. Il n’exécute, en effet, qu’une seule fonction : celle de préciser un aspect de la dimension conceptuelle du terme working class.

Marqueur sémantique à fonction de désambiguïsation (polysémie) : marqueur qui signale que le terme illustré peut s’employer dans plus d’une acception ; la fonction de désambiguïsation est souvent accompagnée de la fonction définitoire, comme dans l’exemple ci-dessous :

Le marqueur sémantique, reproduit en 15, évoque les deux acceptions de discourse distinguées par Gee (1996), auteur qui dote le terme de deux orthographes différentes, l’écrivant par souci de clarté avec d minuscule ou avec d majuscule selon qu’il s’agit de l’une ou de l’autre acception. Il s’agit donc d’un cas analogue à la distinction dieu / Dieu ou encore état / État, des instances de polysémie en français qui exploitent le même marquage orthographique.

Le marqueur sémantique, reproduit en 16, qui se penche sur dog training, terme qui peut s’employer dans au moins deux acceptions, est un autre exemple de l’emploi simultané de la fonction de désambiguïsation et de la fonction définitoire.

Marqueur sémantique à fonction dénominative : marqueur qui associe à une notion une dénomination tout en identifiant l’auteur de l’acte de dénomination ; la fonction dénominative se présente souvent de concert avec d’autres fonctions, telles que la fonction définitoire ou la fonction relationnelle (synonymie).

Comme on le sait, la fixation référentielle du terme ne relève que rarement d’une habitude associative dont la source est inassignable (Mortureux 1995), c’est-à-dire d’un acte de dénomination préalable, mais dont l’auteur est inconnu. En effet, contrairement au mot, le terme est, le plus souvent, le produit d’un acte de dénomination effectif (Kleiber 1984), donc d’un acte de dénomination accompli de manière explicite par le chercheur, devenu créateur de termes, dans le texte spécialisé, et qui est généralement revendiqué par lui comme relevant de sa propriété intellectuelle. Les marqueurs sémantiques en général et à fonction dénominative en particulier signalent que cet acte de dénomination effectif s’inscrit par la suite dans les connaissances du domaine des spécialistes, qui y feront référence entre autres en vertu de la loi bakhtinienne de l’orientation dialogique du discours (Bres 2005), selon laquelle tout texte portera inévitablement des traces explicites et implicites des textes antérieurs avec lesquels son auteur est entré en interaction. Le marqueur complexe (à la fois dénominatif et définitoire) reproduit ci-dessus le confirme clairement.

Marqueur sémantique à fonction étymologique : marqueur qui retrace l’origine d’une notion ou d’un terme et qui renseigne éventuellement sur l’évolution de cette notion ou de ce terme au sein d’un domaine, voire au sein de l’oeuvre du chercheur qui en est l’auteur.

Se rangent aussi dans cette catégorie, les marqueurs qui associent à un chercheur, occupant une place particulièrement éminente dans un domaine, une notion ou un terme qu’il a pensé ou créé. Ces marqueurs identifient souvent le chercheur sans recourir à une référence complète.

Marqueur sémantique à fonction relationnelle (synonymie) : marqueur qui signale l’existence de termes synonymiques pour une notion ; cette fonction s’effectue souvent avec d’autres, telles que la fonction dénominative, la fonction définitoire, ou encore la fonction pragmatique.

Marqueur sémantique à fonction relationnelle (hyperonymie) : marqueur qui répertorie pour un hyperonyme donné des hyponymes ; cette fonction peut s’accompagner d’autres, telles, par exemple, celles définitoire, dénominative ou étymologique. À titre d’illustration, le marqueur, ci-dessous, réalise outre la fonction hyperonymique également les fonctions dénominative et étymologique.

Marqueur sémantique à fonction relationnelle (antonymie) : marqueur qui oppose deux termes connexes ; en l’occurrence, dans le marqueur sémantique, reproduit en 22, small stories et big stories.

Marqueur sémantique à fonction pragmatique : marqueur qui se prononce sur l’emploi d’un terme dans un domaine particulier ou sur une connotation éventuelle que le terme véhiculerait.

Marqueur sémantique à fonction interlinguistique : marqueur qui propose un équivalent dans une autre langue pour un terme donné.

4. Prévalence des marqueurs sémantiques

Sur la base du deuxième corpus de textes, qui permet une comparaison entre les quatre disciplines retenues (histoire, linguistique, psychologie et sociologie), nous avons calculé la distribution disciplinaire des marqueurs. Nous avons, dans un premier temps, vérifié le recours aux marqueurs par les quatre disciplines, et dans un deuxième temps, le recours privilégié à une fonction métalangagière ou sémantique précise. Voici les résultats de ces calculs.

4.1. Prévalence des marqueurs sémantiques

Avant de passer aux chiffres, il convient toutefois d’attirer brièvement l’attention sur une caractéristique pertinente pour nos propos des textes analysés. Les textes se rangent tous dans quatre disciplines qui, étant des sciences humaines et sociales, correspondent dans une large mesure à ce que Rey (1992) avait appelé des domaines construits par le discours. Il s’agit, en effet, de domaines qui manipulent des concepts qui reposent sur des réflexions, souvent de nature théorique, qui se tiennent dans le discours, et qui y cherchent entre autres à délimiter les confins des concepts sur lesquels elles portent aux fins d’une argumentation scientifique. Quant aux termes employés dans ces textes, ils sont le plus souvent de type théorique (Hermans 1989 : 529), en ce sens que ce sont des termes pour des concepts qui se pensent, se façonnent et se structurent en discours ; des termes, donc, dont la portée conceptuelle est quelque peu imprécise, car déterminée par leur emploi et leur fonctionnement dans le texte. C’est, en effet, le co-texte environnant les termes théoriques qui tend à délimiter et ainsi à préciser leur portée conceptuelle dans le texte. Le caractère conceptuellement imprécis des termes est confirmé par les auteurs des textes analysés qui ressentent souvent le besoin de faire une mise au point terminologique avant l’entrée en matière proprement dite, comme en témoigne l’extrait qui suit où l’auteur s’efforce dans un premier temps de bien clarifier la portée conceptuelle de deux termes-clés dans le cadre de son texte, notamment heritage language et heritage language learner :

(25)

[…] there is no universal understanding of just what the terms “heritage language” and “heritage language learner” mean (e.g., Bale, 2010 ; Carreira, 2004 ; Hornberger, 2005 ; Hornberger & Wang, 2008 ; Polinsky & Kagan, 2007 ; Van Deusen-Scholl, 2003).

Different definitions are based in part on whether the primary focus is on the languages, their societal status, or individuals’ linguistic proficiency […]. […] It is in this research […] context where there are also ongoing debates about whether terms such as “ancestral language,” “minority language” or “community language” are equivalent or preferable to “heritage language” (e.g., Brutt-Griffler &Makoni, 2005 ; De Bot & Gorter, 2005 ; Wiley, 2005).

[…]

In this usage, which is the focus of this article, heritage language […] is a specific type of minority language […].

Leeman 2015/35 : 103-104

Le corpus comporte d’ailleurs aussi des articles qui se proposent de faire le point sur la portée d’un seul concept d’une grande importance dans le domaine, et qui par un examen des écrits de différents auteurs évoquent ainsi toute la dimension conceptuelle du terme qui lui est associé. Voici un extrait d’un tel article :

Cette façon de faire rappelle ce que Kocourek (1991b : 72) avait déjà observé, notamment que la capacité métalinguistique définitoire et redéfinitoire se manifeste d’abord dans les textes, qui saisissent et expriment le contenu du domaine scientifique auquel ils appartiennent. C’est d’ailleurs cette constatation qui l’avait amené à poser que le terme est une unité lexicale définie dans le texte ou, dit autrement, une unité lexicale qui se constitue et s’institue dans le texte.

Cette caractéristique des textes analysés laisse à penser, en outre, que la conception classique du terme conçu comme une unité lexicale spécialisée qui renverrait à un concept unique, préexistant et bien délimité, n’est pas opérationnelle dans les textes scientifiques, du moins pas dans ceux se situant dans les sciences humaines et sociales, où les termes employés sont, comme nous venons de le préciser, souvent de type théorique (Hermans 1989) et requièrent, par conséquent, que leur portée conceptuelle soit délimitée dans le texte lors de la mise en discours. Cette imprécision du terme théorique, ce caractère conceptuel flou, n’est pas un défaut, mais s’inscrit dans la démarche scientifique propre aux sciences humaines et sociales où les confins du concept exprimé par le terme peuvent faire l’objet même des réflexions rapportées dans le texte, comme signalé par l’extrait reproduit en 26 ci-dessus. Dans les sciences humaines et sociales, donc, le concept évoqué par le terme mis en discours est le produit de son insertion et de son instauration dans le texte (Petit 2001). (Pour l’instant, nous n’osons pas nous exprimer sur les termes employés dans les textes se situant en sciences pures. Nous nous pencherons sur ces textes dans un autre projet.)

Voici maintenant sans plus tarder les résultats de l’analyse quantitative.

Les deux premiers tableaux ci-dessous renseignent sur la distribution disciplinaire des marqueurs sémantiques, mais sans prendre en considération les fonctions métalangagières qu’ils exécutent dans les textes dont ils ont été extraits, textes ayant tous une longueur comparable de 8 000 à 10 000 mots environ. Le premier donne pour chaque sous-corpus (linguistique, histoire, psychologie et sociologie) le nombre total de marqueurs sémantiques repérés, alors que le second traduit ce chiffre en pourcentage. On note que le sous-corpus linguistique présente le plus grand nombre de marqueurs sémantiques, suivi en ordre décroissant par les sous-corpus sociologie, histoire et psychologie. Il nous faut mentionner ici que des quatre sous-corpus, seuls les sous-corpus histoire et psychologie comportent des textes ne contenant pas de marqueurs sémantiques. Il s’agit, plus précisément, d’un texte pour le sous-corpus psychologie et de deux textes pour le sous-corpus histoire dont l’analyse n’a permis le repérage d’aucun marqueur sémantique.

Tableau 1

**Nombre total des marqueurs sémantiques**

Tableau 2

**Distribution des marqueurs exprimée en pourcentage**

Il va sans dire que la taille relativement petite du corpus ne permet pas de tirer des conclusions définitives. Ceci dit, son dépouillement a, tout de même, révélé des tendances intéressantes caractérisant l’emploi des marqueurs sémantiques dans les quatre disciplines. On constate, d’abord, que le recours aux marqueurs sémantiques est assez bien établi dans les quatre disciplines, dont deux sont des sciences humaines (linguistique, histoire) et les deux autres des sciences sociales (sociologie, psychologie). En effet, en moyenne, les quatre disciplines emploient de 9 à 17,8 marqueurs sémantiques par article. Les quatre disciplines se divisent, ensuite, en deux groupes : les disciplines dont les articles renferment, en moyenne, moins de 10 marqueurs sémantiques (histoire et psychologie) et les disciplines dont les articles contiennent, en moyenne, plus de 10 marqueurs sémantiques (sociologie et linguistique). Ces tendances différentes dans l’emploi des marqueurs peuvent, si on se base uniquement sur les articles de notre corpus, s’expliquer comme suit. L’histoire et la psychologie sont des disciplines qui tendent à présenter et à analyser des faits historiques ou des études de cas, mais qui s’interrogent moins que les deux autres disciplines, la linguistique et la sociologie, sur les concepts à manipuler et la terminologie à employer. C’est en tout cas ce qui est ressorti de l’analyse de ces deux sous-corpus. On remarque, donc, en linguistique et en sociologie une plus grande préoccupation avec la langue que dans les deux autres disciplines. Les auteurs oeuvrant dans ces deux disciplines font, d’ailleurs, souvent de façon explicite allusion à ce questionnement métalangagier, comme on peut le voir dans les deux extraits qui suivent :

D’autres auteurs, encore, incluent dans leurs articles une section entière dédiée à l’examen de la terminologie portant sur la thématique à l’étude. Le sous-titre, « Clarifying the terms », reproduit ci-dessous, constitue un bel exemple des expressions utilisées pour introduire de telles sections.

Il nous faut remarquer, cependant, que, dans le cadre de cette étude, nous n’avons pas examiné en profondeur la répartition des marqueurs sémantiques sur la structure globale de l’article. Cette analyse reste à faire.

Enfin, que le sous-corpus linguistique contienne le plus grand nombre de marqueurs sémantiques n’est peut-être pas surprenant. On peut le comprendre à la lumière de la remarque de Hagège (1985 : 62) qui avait dit de la linguistique qu’elle est « la seule science humaine actuelle dont l’objet coïncide avec le discours qu’elle tient sur lui ».

4.2. Prévalence des fonctions métalangagières

Pour le recours aux différentes fonctions métalangagières ou sémantiques, nous avons obtenu les chiffres qui suivent. Il importe de noter, avant de nous pencher sur les chiffres, que nous avons comptabilisé chaque occurrence d’une fonction qu’elle soit réalisée par un marqueur simple (à fonction unique) ou par un marqueur complexe (à plus d’une fonction). Il s’ensuit que le nombre total de fonctions dépasse le nombre total de marqueurs sémantiques extraits du corpus.

Le premier tableau ci-dessous quantifie, pour les quatre sous-corpus, les occurrences des neuf fonctions métalangagières, exécutées par des marqueurs soit simples soit complexes, et traduit ces chiffres en pourcentages. Des chiffres émerge une hiérarchie quant à la prévalence des fonctions qui n’est pas tout à fait inattendue. En effet, les fonctions se rattachant à l’acte de dénomination (fonctions définitoire, dénominative et étymologique) sont nettement plus nombreuses dans les quatre sous-corpus que les fonctions relationnelles (synonymie, hyperonymie, antonymie), pragmatique et interlinguistique. Cette prévalence est une conséquence de ce que nous avons observé plus haut, notamment que les textes émanant de domaines construits par le discours participent à la construction du savoir spécialisé en manipulant des termes de type théorique (Hermans 1989), issus d’actes de dénomination effectifs et reconnus comme tels, mais dont la portée conceptuelle est quelque peu indéterminée et doit être reprécisée d’un texte à l’autre. De ce fait, le même terme peut faire l’objet de définitions explicites dans différents textes, qui évoqueront souvent également l’acte de dénomination originale par le biais d’une fonction dénominative ou étymologique. Les définitions, façonnées selon les besoins argumentatifs du texte, se chevaucheront bien sûr, mais seront néanmoins rarement complètement identiques. Selon Hermans (1989 : 530), cette indétermination conceptuelle est liée à la complexité des sciences, explication qui s’applique bien aux domaines construits par le discours :

Les sciences sont des systèmes complexes, qui n’essaient pas d’arriver à une stabilité maximale, laquelle équivaudrait à une stagnation totale. Elles cherchent par contre une instabilité proche de l’équilibre entre détermination et indétermination. Si les concepts scientifiques sont trop déterminés, ils ne fonctionnent plus comme instruments de découverte ou d’explication.

Tableau 3

**Recours aux fonctions métalangagières**

Le diagramme à bandes qui suit et qui est basé sur le tableau ci-dessus montre la prévalence des neuf fonctions sémantiques ou métalangagières dans le corpus. L’axe horizontal liste les neuf fonctions, et l’axe vertical leurs occurrences dans le corpus exprimées en pourcentage :

Enfin, le tableau ci-dessous montre la distribution exprimée en pourcentage des fonctions métalangagières sur les quatre sous-corpus. Dans la colonne de droite, nous avons noté le nombre total (F) des fonctions présentes dans chaque sous-corpus et exécutées par des marqueurs sémantiques, soit simples soit complexes.

Tableau 4

**Distribution des fonctions par discipline exprimée en pourcentage**

On constate que des trois fonctions liées à l’acte de dénomination (fonctions dénominative, étymologique et définitoire), celle définitoire est la plus fréquente. En effet, elle représente 50 % des fonctions réalisées dans le corpus entier, soit 56,3 % des fonctions dans le sous-corpus linguistique, 44,8 % des fonctions dans le sous-corpus histoire, 46 % des fonctions dans le sous-corpus psychologie, et 48,5 % des fonctions dans le sous-corpus sociologie. La forte prévalence de la fonction définitoire se comprend à la lumière de nos explications précédentes sur le recours aux termes théoriques dans les domaines construits par le discours.

Cette prévalence signale, en outre, que le recours à la définition n’est aucunement inhabituel dans l’article scientifique, du moins en sciences humaines et sociales, en dépit du fait qu’il s’agit d’un texte spécialisé, donc d’un texte destiné aux pairs. En effet, l’article scientifique porte, en règle générale, sur des travaux en cours dont il veut informer un lectorat, composé avant tout d’experts. Il puise, pour ce faire, dans la science déjà constituée tout en informant sur la science qui se constitue, un va-et-vient conceptuel auquel participe la définition, sous la forme bien entendu d’un marqueur sémantique, donc d’une citation. Il s’agit d’une dynamique textuelle qui se conforme, par ailleurs, au dialogisme bakhtinien (Todorov 1981). On voit bien dans les textes des quatre sous-corpus une double orientation : vers l’amont et vers l’aval d’un enchaînement de textes portant tous sur un même sujet ou sur des sujets similaires. Cette double orientation est le reflet d’une double interaction de la part de l’auteur. Lors de la production de son texte, celui-ci interagit, en effet, avec les textes écrits antérieurement par d’autres sur le même sujet, mais s’adresse également à son futur lecteur, inconnu pour l’instant certes, mais sur la compréhension-réaction duquel il ne cesse d’anticiper (Thompson 2001 ; Bres 2005 ; Collet 2016)[2].

On en peut conclure que le recours plutôt répandu aux marqueurs sémantiques à fonction définitoire dans l’article scientifique se fait dans le contexte d’une stratégie discursive qui vise la précision, d’une part, étant donné le caractère indéterminé des termes, et la persuasion du lectorat du bien-fondé de l’argumentation scientifique de l’autre, tout en obéissant aux règles honorifiques strictes régissant l’écriture de ce genre de textes spécialisés, car le concept de la propriété intellectuelle s’applique, comme nous l’avons vu, au terme et à ce qu’il désigne. Cette stratégie discursive, et particulièrement les règles honorifiques, expliquent aussi la forte présence des fonctions étymologique et dénominative, qui permettent de lier le terme de manière claire et précise à celui ou à celle qui l’a introduit dans le domaine. Ces deux fonctions constituent, par ailleurs, aussi une façon raccourcie et indirecte d’insérer dans le texte des renseignements sur la portée conceptuelle du terme, car elles signalent au lecteur où les trouver. Ci-dessous un exemple clair d’un marqueur sémantique qui investit la fonction étymologique de ce double but :

Les autres fonctions métalangagières sont nettement moins fréquentes, sans doute parce qu’il s’agit là de fonctions qui se rattachent moins à l’articulation de la thématique du texte, mais de fonctions qui sont symptomatiques de réelles réflexions sur la langue. Le premier extrait qui suit, et qui constate l’emploi de plus en plus généralisé d’un terme, en est un bon exemple. Il en va de même du second extrait, qui commente la connotation potentiellement trompeuse d’un terme.

Pour terminer, il nous reste à faire une remarque concernant la fonction relationnelle (hyperonymie), qui répertorie pour un hyperonyme donné deux ou plusieurs hyponymes. Cette fonction, peu fréquente dans notre corpus, vise souvent le déterminant de termes complexes, comme dans les deux exemples qui suivent où les déterminants, mis en évidence dans le texte original par des italiques ou une combinaison de parenthèses et de guillemets anglais simples, établissent un contraste de type hyperonymique :

Enfin, la grande majorité des marqueurs sémantiques repérés dans les quatre sous-corpus (linguistique, histoire, psychologie, sociologie) portent sur des termes nominaux. Seule une petite minorité concerne des adjectifs et des verbes. Cette constatation n’est pas nouvelle, mais confirme ce que maints terminologues, de Guilbert (1973) à L’Homme (2011 : 27), avaient déjà observé, notamment que les termes employés dans les textes spécialisés « se résument à certaines catégories de mots : un grand nombre de substantifs, quelques verbes et quelques adjectifs ». Voici les chiffres pour les quatre sous-corpus :

Tableau 5

**Catégories grammaticales des termes cernés par les marqueurs**

Cependant, contrairement aux termes nominaux, les adjectifs et les verbes qui font l’objet de marqueurs sémantiques dans les quatre sous-corpus sont souvent ce que Gentilhomme (1994 : 387) avait appelé des termes larvés, c’est-à-dire « des mots qui, à première vue, semblent appartenir au vocabulaire commun, mais qui, dans la discipline considérée, acquièrent un contenu particulier ». En voici un exemple, le verbe to witness en psychologie, cerné par le marqueur sémantique ci-dessous :

5. Conclusion

Il ressort de ce qui précède que les marqueurs sémantiques constituent un excellent outil pour l’élaboration de travaux terminologiques portant sur un domaine relevant des sciences humaines ou sociales, domaines où le recours aux marqueurs est, comme nous l’avons démontré, bien établi. En effet, les marqueurs sémantiques font partie des conventions d’écriture des textes destinés aux pairs (tels que les articles scientifiques que nous avons examinés) dans ces domaines, qui sont largement construits par le discours et manipulent une terminologie au caractère quelque peu indéterminé. Ils insèrent, dans ces textes, des données précises quant à l’origine, la portée conceptuelle et l’emploi des termes selon les besoins, entre autres, de l’argumentation scientifique. En effet, nous avons constaté que les marqueurs sémantiques peuvent effectuer au moins neuf fonctions sémantiques différentes, selon la nature de l’information métalangagière qu’ils apportent : des fonctions liées à l’acte de dénomination (fonctions dénominative, étymologique et définitoire), des fonctions relationnelles évoquant la structuration d’une terminologie (synonymie, antonymie, hyperonymie et polysémie), et enfin des fonctions liées à l’emploi (pragmatique et interlinguistique). De ces neuf fonctions, celle définitoire domine dans les textes. Cette prévalence confirme la justesse des propos de Kocourek (1982 : 77), qui soutenait que « les termes sont […] des unités lexicales dont le sens est défini par les spécialistes dans les textes de spécialité ». On voit, en effet, que dans les articles scientifiques, le terme est défini directement par celui ou celle qui a pensé (ou repensé) le terme et indirectement, par le biais de marqueurs sémantiques à fonction définitoire, par celui ou celle qui évoque par la suite, pour quelque raison, cet acte dénominatif.

Enfin, avant de clore cet article, il nous faut attirer l’attention sur une dernière dimension des marqueurs sémantiques, que nous n’avons pas examinée dans ce texte faute d’espace : leur utilité pour quiconque s’intéresse à l’évolution conceptuelle et terminologique d’un domaine. Cette dimension terminochronique (Møller 1998) des marqueurs se remarque bien dans l’exemple reproduit ci-dessous :

Grâce à cette dernière fonction terminochronique, l’étude des marqueurs sémantiques pourrait aussi contribuer à l’intérêt aujourd’hui renouvelé, entre autres en terminologie textuelle (Picton 2018), pour la dimension diachronique des langues de spécialité.

La citation comme source de renseignements métalangagiers dans l’article scientifique

Résumé

Abstract

Resumen

1. Introduction

2. Marqueurs sémantiques et CRC

3. Fonctions métalangagières du marqueur sémantique

4. Prévalence des marqueurs sémantiques

4.1. Prévalence des marqueurs sémantiques

4.2. Prévalence des fonctions métalangagières

5. Conclusion

Annexe

Corpus d’articles savants

Notes

Bibliographie

List of figures

List of tables

Abstracts

Résumé

Abstract

Resumen

Article body

1. Introduction

2. Marqueurs sémantiques et CRC

3. Fonctions métalangagières du marqueur sémantique

4. Prévalence des marqueurs sémantiques

4.1. Prévalence des marqueurs sémantiques

4.2. Prévalence des fonctions métalangagières

5. Conclusion

Appendices

Annexe

Corpus d’articles savants

Notes

Bibliographie

List of figures

List of tables

Citation Tools

Cite this article

Export the record for this article