Corps de l’article

Les encyclopédies et autres dictionnaires collaboratifs, Wikipédia en tête, ont bouleversé le paysage lexicographique mondial. Quel traducteur professionnel ou occasionnel ne s’en sert pas ? On peut alors s’étonner que les répercussions linguistiques de ce changement de paradigme n’aient pas fait l’objet de davantage de recherches. C’est donc avec plaisir que l’on salue la publication du présent ouvrage, qui manifestement cherche à combler une lacune importante et par là même à rétablir une réputation. On sait que la méfiance a été pendant longtemps le maître mot parmi les linguistes. Le grand lexicographe et spécialiste des encyclopédies, Alain Rey, disait en 2011 tout le mal qu’il pensait de Wikipédia et de « ces encyclopédies participatives dans lesquelles on a tout et n’importe quoi »[1]. La présente étude aurait-elle été susceptible de le faire changer d’avis ?

Une des premières surprises que l’on a en ouvrant ce volume est l’existence de nombreuses études réalisées dans des cadres très variés par différentes communautés de recherche mais peu prises en compte par la métalexicographie francophone. On se félicite alors de ce précieux bilan de l’existant : il s’avère que l’anglais est relativement bien couvert par rapport au français et à l’italien, qui ont toutefois fait l’objet d’analyses ponctuelles mais pertinentes grâce à un petit nombre de chercheurs isolés. Partant de cette synthèse de nombreux travaux antérieurs, l’auteure met à profit ses propres recherches réalisées dans le cadre d’une thèse de doctorat pour rendre compte des aspects linguistiques de cette révolution lexicographique.

Le livre comporte neuf chapitres. Le premier présente succinctement les objectifs de l’étude, le deuxième une historique du concept encyclopédie, mettant l’accent sur la forme – canonique – qu’il a pris à la période des Lumières. Ensuite, l’auteure esquisse l’évolution ultérieure, en passant par l’époque « bourgeoise » au dix-neuvième siècle pour arriver aujourd’hui à l’éruption du numérique. La nouvelle possibilité de dialoguer avec l’encyclopédie, surtout par le truchement de la fonction Discussion et l’effacement de la distinction entre auteur et utilisateur, sont deux aspects de la révolution numérique qui sont problématisés ici et leurs effets linguistiques sont analysés tout au long de l’ouvrage. Le troisième chapitre situe les orientations proprement linguistiques dans l’approche de la « tradition discursive », outil d’analyse du discours bien connu dans les pays de langue allemande, prisme par lequel sera analysé d’abord l’article d’encyclopédie papier puis celui de Wikipédia. Cette école d’analyse textuelle est présentée en détail et sa pertinence pour une comparaison à la fois historique et interlinguistique est finement argumentée. Le quatrième chapitre expose et justifie le choix du corpus et de la méthode de dépouillement et d’analyse. Le corpus se compose d’articles correspondant à cinq vedettes prises dans quatre domaines différents (géographie, chimie, médecine, économie), dans deux encyclopédies papier françaises (Larousse et Universalis) et deux italiennes (Garzanti et Nova) ainsi que dans les pages Wikipédia françaises et italiennes. Les cinq concepts ainsi analysés sont dans trois cas sur quatre des cohyponymes : pour la médecine, il s’agit de cinq maladies, pour la géographie de cinq noms de pays, etc. L’économie constitue l’exception, car les concepts sont plus hétérogènes. On dispose ainsi d’un corpus « encyclopédies », papier et numériques, de 549 685 mots (tokens). Les différentes techniques d’interrogation sont alors présentées en détail. Pour le contenu des articles, chaque concept vedette est sous-divisé en aspects, qui peuvent être schématisés par type et par langue. Par exemple, pour les substances chimiques, 21 aspects sont identifiés au moyen de mots clés[2] : propriétés, production, utilisation, forme naturelle, structure, etc., dont les pourcentages sont traduits en termes de graphiques.

Les quatre chapitres suivants sont des analyses contrastives des parties constitutives des articles, papier et électroniques. Le cinquième se focalise sur une comparaison du contenu : les aspects traités des cinq concepts témoins, les mots-clés associés aux concepts et les traits culturels spécifiques à la France et à l’Italie. Le sixième chapitre est consacré à la spécialisation linguistique : dans quelle mesure les articles relèvent-ils de la langue de spécialité ? Le septième est dévolu au principe de la neutralité du point de vue, et donc de l’expression, et le huitième porte sur des considérations strictement linguistiques : questions d’orthographe et de ponctuation, construction de la phrase, aspects morphosyntaxiques (pronoms, conjonctions, temps verbaux et lexique). Le neuvième chapitre est une conclusion qui met l’accent sur l’évolution de l’encyclopédie par rapport aux changements de média en tenant plus particulièrement compte de la variation engendrée par la spécialisation, par le support et par la culture.

L’appareil critique de cette étude est explicitement placé dans la tradition de la romanistique allemande, qui remonte à Coseriu, développée en particulier par Koch et Oesterreicher (nombreuses références, surtout 2011). L’auteure situe très utilement son approche par rapport à d’autres traditions d’analyse discursive, d’études de genres ou de la linguistique du texte, de telle manière qu’il n’y ait pas de phase d’apprentissage du métalangage par celui qui découvre le domaine. Le texte est abondamment illustré par des exemples et comporte de très nombreux tableaux (165 en tout) et autres graphiques qui permettent de visualiser le détail des analyses.

Il n’est pas possible dans l’espace de quelques pages de rendre compte de tous les aspects d’une étude aussi vaste. Nous nous limitons ici à ceux qui ont un lien avec ce que l’on pourrait appeler la métaterminologie ou l’analyse de répertoires terminologiques.

La validité du corpus mérite une brève mention. L’auteure s’excuse presque de sa taille modeste, mais on sait depuis les travaux de Lauren et Nordman (1996) qu’un échantillon réduit mais bien choisi peut permettre de caractériser finement différents types de discours spécialisés, et par là même l’évolution des traditions discursives. Il est probable que l’analyse d’autres domaines ouvrirait de nouvelles pistes, mais les quatre choisis sont suffisamment différenciés terminologiquement pour constituer un bon échantillon. Pour ceux qui s’intéressent à Wikipédia en tant que tel (ou encore les traducteurs de romans contemporains), l’absence d’échantillon de la culture populaire pourrait être considérée comme un fâcheux oubli, mais pour la terminologie, il est sans conséquences.

Le chapitre sur la langue de spécialité (Fachsprachlichkeit) est particulièrement intéressant du point de vue de la terminologie, car il représente une tentative de rendre compte d’un phénomène foncièrement onomasiologique (l’encyclopédie s’intéresse aux concepts même si elle y accède par les mots) par des moyens essentiellement sémasiologiques (les résultats de l’analyse des corpus). On peut considérer qu’un décompte du nombre de lettres par mot, déjà pratiqué sur l’anglais, ne donne pas de résultat bien concluant. B. Eiber propose alors différentes manières d’identifier les expressions spécialisées (on serait tenté de dire des termes, mais l’auteure se borne prudemment à parler de fachsprachliche Tokens) et d’établir leur pourcentage par rapport au total des textes. Il ressort de l’analyse que Wikipédia en version française emploie légèrement davantage de termes scientifiques que les encyclopédies papier, mais que ces derniers les utilisent plus fréquemment, signe d’un plus grand approfondissement. D’ailleurs, pour ce qui concerne la vulgarisation, l’auteure constate que Wikipédia en version française reformule davantage les termes techniques que les encyclopédies papier.

On peut dire que l’approche adoptée dans le livre est linguistique et lexicographique plutôt que terminologique, dans le sens d’une prise en compte d’une structuration conceptuelle du savoir. Le lecteur dispose alors de beaucoup de renseignements très utiles sur les domaines et sous-domaines traités, mais peu sur les liens entre les concepts présentés. La navigation dans l’encyclopédie par différents types de lien n’est guère approfondie, pas plus que la tendance constatée par ailleurs de présenter des folksonomies[3] (Poudat et Loiseau 2007) plutôt que les taxinomies scientifiques. C’est là où l’on peut estimer que la construction d’un savoir par « la foule » montre ses limites.

Le sous-chapitre consacré aux emprunts illustre également cette même orientation lexicologique, voire étymologique. Les lexies empruntées sont présentées en deux groupes, d’abord les éléments pris au grec et au latin, puis les anglicismes. Le premier groupe correspond davantage à une tradition germanique des Fremdwörter, puisqu’en français, les éléments classiques sont considérés comme faisant partie du stock morphologique de la langue, activement développés par exemple dans des dictionnaires comme le Robertméthodique[4]. Pour les anglicismes, c’est la possibilité de l’extraction automatique qui a déterminé le choix de la seule « classe » analysée ici, à savoir les mots empruntés qui se terminent par -ing ; les exemples sont assez nombreux pour l’économie et cela dans les deux langues, mais encore une fois, les résultats ne sont guère probants.

Les thématiques de la neutralité, de l’objectivité et de l’universalité, principes fondateurs de Wikipédia, reçoivent ici un traitement de fond. Selon la conception des fondateurs, Wikipédiaen français n’est pas Wikipédia de la France tout comme Wikipediaitaliana n’est pas celui de l’Italie. Or, il arrive que les articles de Wikipédia, comme ceux des encyclopédies papier, privilégient des spécificités culturelles de la France et de l’Italie. Comment le déterminer linguistiquement ? C’est d’abord reflété textuellement dans les titres et sous-titres des articles, et linguistiquement par l’incorporation de marqueurs de points de vue français ou italiens au sein des articles. Ceux-ci peuvent être repérés en étudiant les suites, par exemple en France et in Italia, ou encore par des tournures de phrase comme « notre pays », typiques de la lexicographie plus ancienne. La présence canadienne n’est pas analysée en tant que telle, malgré le rôle de pionniers des Québécois aux temps héroïques de Wikipédia. Dans l’ensemble, l’auteure note une nette évolution du francocentrisme des encyclopédies imprimées vers une internationalisation effective mais non complète de l’encyclopédie collaborative. L’économie reste le domaine dont la spécificité nationale est déterminante, exemple de ce que les métalexicographes désignent comme des domaines dont la terminologie est déterminée par la culture.

Plus généralement, ce livre, fidèle à son titre d’étude comparative, permet de constater les similitudes et les différences entre supports, domaines et langues. La démarche fondée sur les traditions discursives met en lumière non seulement les changements occasionnés à la fois par la migration sur la Toile et l’écriture participative, mais aussi la permanence des exigences encyclopédiques qui continuent de guider la rédaction. Le chapitre sur les contenus montre une assez grande stabilité entre les deux supports, mais avec une nette tendance à une meilleure prise en compte à la fois de l’actualité, des nouveaux domaines transversaux (écologie, informatique) ainsi que des besoins des utilisateurs. On est tenté de se demander si cette dernière avancée n’a pas un lien direct avec le changement de perspective, où l’usager peut très bien être aussi un contributeur. Les comparaisons entre langues sont également intéressantes. On fait remarquer, par exemple, que le style des articles Wikipédia en italien est influencé par celui de l’anglais dans la mesure où il est plus clair et plus concis. Parfois, la comparaison aurait pu être développée davantage : le jeu des temps verbaux, exposé dans le chapitre 8, va moins loin que l’analyse de Pöckl (1997), qui met en lumière la très grande variété de temps typique des articles biographiques en français.

Il ne faut pas bouder son plaisir : l’étude linguistique qu’on attendait du Wikipédia français est enfin arrivée, avec en prime une comparaison avec l’italien. C’est une présentation claire, systématique et pédagogique, qui adopte une grille de lecture éprouvée et particulièrement adaptée au sujet : le point de vue des traditions discursives est éclairant lorsqu’il s’agit de constater systématiquement ce qui a changé dans les discours encyclopédiques lors de la migration vers le mode numérique et participatif et ce qui demeure. Les résultats sont plutôt encourageants pour les wikipédistes, car on peut constater que les principes de base exemplifiés par les encyclopédies papier sont largement maintenus. Le recours aux sources primaires est encore plus systématique qu’auparavant, la neutralité par rapport aux pays mieux assurés, la terminologie plutôt mieux expliquée, la prise en compte de nouvelles grilles de lecture et de l’actualité s’est également affirmée. On note toutefois une moindre vigilance par rapport aux différents aspects de la correction linguistique, caractéristique sans doute d’un travail en cours, encore perfectible. Comme les bases de terminologie.

On ne peut savoir si cette nouvelle étude aurait suffi pour convaincre Alain Rey du sérieux de Wikipédia, mais il est certain que l’encyclopédie en ligne permet à ceux qui s’intéressent à la question de se faire leur propre idée.