Corps de l’article

1. Introduction

Les listes, telles que les index, sommaires, annuaires, horaires, listes de cadeaux, de personnes, de numéros de téléphone ou simples listes de courses, sont un outil quotidien dont on se sert sans presque s’en apercevoir. Ce type singulier de textes a des caractéristiques particulières : son agencement est généralement vertical – plus rarement horizontal – et la présence de phrases plutôt inhabituelle. Les unités, essentiellement des syntagmes nominaux, constituant chaque élément d’une liste introduisent peu de prédicats, mais plutôt des spécifications. Par exemple : Transport (de marchandises), Sucre (en sachet)[1], etc. L’observation et les apports du contexte immédiat seront en conséquence limités.

La linguistique de corpus traite habituellement de textes constitués de phrases ainsi que de suites de phrases organisées (paragraphes, chapitres, etc.). Le corpus permet d’étudier systématiquement l’axe syntagmatique en partant d’une référence fixée sur l’axe paradigmatique, ce qu’un corpus composé de listes ne permettrait pas. De ce fait, les listes – production linguistique très particulière – ne constituent pas un corpus prototypique. Cependant lorsqu’on en constitue un, il est possible d’en extraire des informations diverses sur la nature des constituants du corpus (nature linguistique et extralinguistique), sur leurs rédacteurs (intentions, capacités de synthèse – toute prédication étant concentrée sur une unité sans contexte, par exemple dans le cas cité plus haut : Transport (synthèse de : Transport de marchandises par voie terrestre), mais rien n’est dit sur l’ensemble, sur leurs destinataires (nécessités et capacités interprétatives, formes de consultation) et sur les utilisateurs (qui peuvent être différents des rédacteurs et destinataires, par exemple des traducteurs). Leur analyse ne se fait donc pas sans difficulté. Les recherches à leur propos sont quasi inexistantes.

Les annuaires téléphoniques professionnels (désormais ATP) tels que les célèbres PagesJaunes® en France ou les PagesJaunes™ au Canada sont une catégorie de liste riche en informations d’ordre linguistique, culturel et économique. La finalité d’origine des ATP – nous aborderons plus bas l’aspect historique – était de faire connaître les abonnés au service téléphonique ; en conséquence, aujourd’hui encore, leur mise à jour est constante. De nouveaux abonnés apparaissent tandis que d’autres disparaissent, qu’il s’agisse de personnes, d’entreprises ou d’organisations de tout type. Contrairement aux versions électroniques et pour des raisons éditoriales, les éditions papier ne peuvent suivre cette évolution rapide et ne peuvent en conséquence que proposer une quantité d’entrées limitée dans le temps et fixe pendant une période. Les éditions prennent généralement en compte des périodes d’un an (par exemple : année 2006 ou de mai 2006 à mai 2007). La liste des abonnés et des rubriques est donc considérée comme close pour la période de référence. De ce fait, deux éditions sont opposables chronologiquement.

Les ATP constituent une liste limitée aussi à l’espace dont ils enregistrent les données – région ou ville – et aux activités pour la plupart économiques, administratives et professionnelles (par opposition aux informations sur les particuliers répertoriées dans les Pages blanches). En plus de ces paramètres (espace-temps-contenu), les ATP en version papier sont formellement délimités aussi en nombre de pages. Les éditions électroniques quant à elles organisent les éléments de la liste sous la forme de base de données. L’accès à l’annuaire n’est en conséquence plus le même puisqu’il se fait à travers une requête à la base et non par la consultation des pages.

Dans le cadre, par exemple, d’une étude de marché, lorsqu’il s’agit de connaître les produits vendus, les services proposés, les entreprises ou les professionnels présents en un lieu précis, les ATP sont d’une grande utilité et maniabilité en parallèle avec d’autres outils fournis notamment par les Chambres de commerce ou d’autres éditeurs d’annuaires. Lorsqu’il s’agit d’obtenir des informations analogues dans un autre pays et dans une autre langue, le besoin de traduction apparaît. Or la traduction des ATP n’est pas aussi simple, sauf dans les pays où des langues coexistent – auquel cas, le corpus contient déjà des correspondances d’une langue à une autre, parce que les pratiques économiques sont répertoriées simultanément dans deux ou plusieurs langues.

Nous avons concentré notre attention sur ce qu’on pourrait appeler « la clé de lecture des ATP » : les rubriques. Lors de leur traduction, on se heurte à la difficulté majeure que constitue l’absence d’un contexte permettant de préciser ce à quoi les intitulés de rubrique réfèrent. Par exemple, l’intitulé Habillement concerne-t-il la fabrication, la vente en gros ou au détail, l’importation ? Lorsqu’on a affaire à des secteurs tels que la construction en tant que domaine de connaissance, il est nécessaire de connaître le domaine d’activité précis (de Vecchi 2004), de savoir qui utilise ces unités, voire d’identifier les acteurs de ces pratiques pour pouvoir fournir une traduction appropriée. En effet, par exemple les entreprises de BTP (en France, « bâtiment et travaux publics ») ne sont pas nécessairement les mêmes que celles de la construction de maisons individuelles. Ce qui est clair dans une langue risque d’être obscur dans une autre langue, ce qui n’est pas une nouveauté en traduction, mais ce qui, par rapport aux activités économiques, peut poser problème dans le cas d’une activité réalisée dans un autre pays. Ce n’est cependant pas le cas, comme nous le verrons, pour les listes internationales des activités économiques.

La variété d’expressions linguistiques rencontrées dans la lecture des ATP en tant que corpus offre de nombreuses perspectives dans des champs allant de la linguistique (par exemple, sémantique et catégorisation) à l’économie (pratiques et firmes existantes dans les régions couvertes), en passant par les études interculturelles (pratiques culturelles et économie), et ce, dans une liste non limitative. Le présent article vise l’exploration des ATP considérés comme un corpus de dénominations en vue de la traduction. L’exploration a été réalisée à travers les listes de rubriques des annuaires téléphoniques professionnels de deux villes aux caractéristiques proches : Paris et Buenos Aires.

Nous explorerons brièvement l’historique du concept d’ATP avant de traiter de la constitution du corpus, puis des modes de classification. Ensuite, nous exposerons la méthodologie utilisée pour comparer les deux ATP. Nous verrons que la traduction des rubriques des ATP ne dépend pas seulement de la connaissance de la langue (générale ou spécialisée) et de la culture, mais aussi de la connaissance des pratiques économiques du lieu considéré et des manières de classifier les éléments de la liste autant que les activités économiques.

2. Bref historique des ATP

Avec l’avènement du téléphone, la nécessité de faire connaître les abonnés au service s’est vite fait sentir. Le public devait disposer d’une liste à laquelle se référer pour contacter des abonnés, personnes, services, institutions ou commerces. En outre, pour des raisons commerciales, des entreprises elles-mêmes en ont eu besoin. Hormis l’histoire du bottin en France, avec Sébastien Bottin (1764-1853) qui rédigea en 1797 le premier Almanach du commerce et de l’industrie, les ATP sont un objet que l’on connaît finalement peu, mais que l’on utilise beaucoup. Les données historiques le concernant sont rares : bien que le téléphone soit un objet d’intérêt, les annuaires le sont beaucoup moins.

La distinction entre deux types d’abonnés semble s’être faite dès le premier annuaire, avant la différenciation entre les deux types d’édition (Pages blanches et PagesJaunes). C’est à New Haven, dans le Connecticut, par la Connecticut District Telephone Company, que les abonnés au service téléphonique ont commencé à être répertoriés dès 1878[2]. Il s’agissait d’une liste qui classifiait la cinquantaine de souscripteurs dans sept rubriques (tableau 1).

Tableau 1

Rubriques du répertoire de la Connecticut District Telephone Company[3]

Rubriques du répertoire de la Connecticut District Telephone Company3
*

« Résidences », « Médecins », « Dentistes », « Divers » (incluant la police et la poste), « Magasins, fabriques et autres », « Marchés de viande et de poisson », « Chevaux et étables de location »

-> Voir la liste des tableaux

La souscription au service téléphonique allait donc de pair avec le besoin d’enregistrer les clients autant qu’avec celui de les catégoriser, ceci pour aider le lecteur dans sa recherche d’informations. D’autres annuaires parurent à Zurich et à Londres en 1880, à Berlin en 1881. Depuis, dans la plupart des pays, les listes d’abonnés sont publiées régulièrement en version papier, puis aussi au format électronique sur Internet.

Ce premier annuaire de 1878 montre déjà ce qui, entre autres, économiquement, était important pour la société de New Haven : les annuaires sont de véritables catalogues pour la connaissance d’une société. Une lecture historique des anciens annuaires est en quelque sorte non seulement une lecture de l’activité économique, mais aussi de la manière de la classifier. Pourtant, s’il existe des passionnés de l’annuaire téléphonique (ATP ou particuliers) comme l’attestent les sites qui proposent des annuaires rares, mis à part les études onomastiques dans les Pages blanches, les annuaires ne semblent pas avoir fait l’objet de recherches particulières.

3. L’ATP, un corpus à part

Lorsqu’on observe un ATP, on ne peut qu’être dérouté par la nature de ce matériel linguistique, et ce, autant en ce qui concerne sa forme que son contenu. Sa composition, comme celle des sites Internet, fait appel à un assemblage de textes très hétérogènes : listes, publicités, textes, titres, images, cartes, etc. Selon le cas, cet assemblage est aussi traduit dans d’autres langues. Il ne fait aucun doute que ce sont là des exemples de l’utilisation d’une langue à un moment donné de son histoire. Peut-on pour autant en faire un corpus ?

La définition du corpus ne fait pas l’unanimité, mais une discussion définitoire n’a pas sa place ici. On ne retiendra que quelques définitions pour avancer dans notre propos. En tout état de cause, un corpus se constitue, se compose, se forme ou s’établit en tant qu’objet d’étude. Les corpus n’existent pas en tant que production en soi. Par exemple, en France, les PagesJaunes® produisent des annuaires et non des corpus, en revanche c’est le linguiste qui peut y voir un corpus – en l’occurrence, un corpus de dénominations.

Pour Sinclair (1996 : 4), « a corpus is a collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language ». La définition est reprise par Habert, Nazarenko, et al. (1997 : 11). Habert (2000 : 11) complète la définition de Sinclair de la manière suivante : « un corpus est une collection de données langagières qui sont sélectionnées et organisées selon des critères linguistiques et extralinguistiques explicites pour servir d’échantillon d’emplois déterminés d’une langue ». (La mise en relief est celle de l’auteur). McEnery et Wilson (2001 : 29) de leur côté, décrivent un corpus comme un « finite sized body of machine readable text, sampled in order to be maximally representative of the language variety under consideration ». Par ailleurs, il est intéressant de remarquer que Rastier (2002) distingue le corpus d’étude des autres formes de corpus : il est délimité par les besoins de l’application en tant que niveau dans le passage de l’archive aux corpus de travail. Plus tard, Sinclair (2005 : §12) précise : « a corpus is a collection of pieces of language text in electronic form, selected according to external criteria to represent, as far as possible, a language or language variety as a source of data for linguistic research ».

À chaque fois, ces définitions contiennent des éléments qui nous amènent, du point de vue du linguiste, à considérer un ATP comme un corpus à part entière. Cela posé, un ATP est une collection de données linguistiques finie, dans le sens de « délimitée », grâce à des critères externes, notamment métalinguistiques, ciblés par le chercheur. Il s’agit dans notre cas d’une liste de dénominations d’ensembles d’abonnés au service de téléphone partageant des caractéristiques communes. Cette collection est le résultat d’une systématisation et d’une organisation de dénominations selon des critères extralinguistiques, on y reviendra, qui conditionnent autant l’édition par l’éditeur que la constitution du corpus par le chercheur, garants l’un comme l’autre de la cohérence des objets qu’il édite dans un cas ou analyse dans l’autre. Il est indéniable qu’un ATP est représentatif de l’utilisation de la langue par la culture environnante. En effet, l’ATP est la collection organisée de dénominations utilisées par une communauté en particulier, élargie au niveau d’un pays, pour nommer ses activités économiques ; cette collection n’est pas échangeable avec celle d’une autre communauté, y compris dans la même langue. Il est cependant discutable d’affirmer qu’il s’agit d’une variété de langue, y compris spécialisée, bien que l’expression « annuairiste » (utilisée pour désigner celui qui répertorie des sites web) tende à démontrer que des pratiques spécifiques sont en train d’être créées. La possibilité de lecture et de traitement par ordinateur est sans doute un avantage majeur pour son analyse, mais ne constitue pas la raison d’être d’un corpus. L’ATP est alors un corpus d’étude et un corpus de travail. La numérisation des rubriques donne à l’ATP un statut de document électronique, qui ne correspond qu’à une facette de l’exploitation qui peut en être faite.

Les ATP existent aujourd’hui sous deux formats : papier et électronique (CD ou en ligne). Dans les deux cas, les contenus sont les mêmes, mais l’accès est radicalement différent, mais pas uniquement pour des raisons matérielles liées à la consultation d’un volume en papier ou à un accès par ordinateur. Dans le premier cas, la lecture est conditionnée par des facteurs extérieurs aux ATP : connaissances du lecteur (notamment de qui vend ou produit quoi), pratiques locales d’organisation du texte – voire tradition éditoriale – (organisation des rubriques), ordre alphabétique, etc. Dans le second cas, et selon les pays, l’utilisateur peut interroger une base de données sans conditions préalables de catégorisation : il cherche directement un produit ou un service. Autrement dit, contrairement au format électronique où l’on peut chercher par exemple une vis, le format papier exige de l’utilisateur qu’il sache, selon les pays, où l’on vend des vis, c’est-à-dire qu’il connaisse l’expression quincaillerie. Pour le reste, la comparaison des contenus des deux formats ne montre pas toujours de différences significatives.

La version électronique ne permet qu’un accès limité aux données linguistiques exploitables. En revanche, après numérisation via la reconnaissance optique de caractères de la version papier, l’ATP devient exploitable par l’ordinateur. Les recherches exploratoires ont toutes été réalisées dans des fichiers textes formatés, après numérisation et reconnaissance de caractères, dans un format Microsoft Word (.doc). La recherche des concordances a été effectuée avec le logiciel Lexico3, ce qui a nécessité la conversion des textes numérisés en format brut (.txt).

Comme pour tout corpus, la constitution d’un corpus formé de listes exige la prise en compte de certains paramètres. En premier lieu, la finalité des listes colligées doit être semblable. En effet, il serait inopérant de rassembler des listes dont les finalités seraient diverses puisque leur contenu ne serait pas de même nature. Une liste destinée à la classification n’est pas nécessairement compatible avec une autre destinée à répertorier des objets, même si, syntaxiquement, elles peuvent paraître similaires. En second lieu, les rédacteurs des listes doivent suivre une même stratégie de rédaction, établie en fonction de la finalité de la liste. Doivent aussi être connues les pratiques de consultation du destinataire de la liste, en fonction desquelles la liste aura été rédigée de manière précise. Dans le cas des ATP en France, il s’est toujours agi du même éditeur : les PagesJaunes. La stratégie rédactionnelle est la même dans tous les départements français. La finalité de la liste est toujours la même : diffusion des contenus et identification de professionnels et d’entreprises.

Toutefois, l’ATP reste un corpus atypique, notamment eu égard aux habitudes en linguistique de corpus. Un corpus exhaustif des rubriques d’ATP édités en France par les PagesJaunes pourrait en conséquence être constitué de l’ensemble de tous les ATP publiés en France au cours d’une même année dans leur édition papier (les bases de données étant actualisées en permanence pour les versions électroniques). Il est alors possible de travailler en synchronie, le corpus étant stable pendant l’année de référence. L’intérêt d’une telle tâche serait de disposer de la totalité des classifications effectuées par l’éditeur sans tenir compte des différences qui peuvent exister entre deux régions, différences dues à la réalité du terrain. Par exemple, il est logique que si, dans une région particulière, il n’y a pas d’entreprises de transport maritime, cette classification soit omise dans l’annuaire régional alors qu’on peut la trouver ailleurs. Ce qui veut dire en même temps que les ATP peuvent faire l’objet d’une recherche comparée, ce qui nécessite des annuaires des régions comparables, par exemple deux régions qui partagent les mêmes caractéristiques géographiques, humaines et d’activité. Ceci permet aux données d’être cohérentes et, au chercheur, de trouver des éléments de comparaison. On peut alors comparer deux villes côtières ou deux villes entourées de grosses productions céréalières, industrielles ou forestières. Dans chaque cas, la constitution du corpus à étudier doit suivre les mêmes démarches et ajouter une condition supplémentaire : la connaissance des pratiques culturelles et quotidiennes des régions à comparer. En effet, sans cette connaissance, les interprétations peuvent être faussées.

Pour constituer notre corpus de dénominations à travers les rubriques des ATP, nous avons choisi deux villes qui nous sont connues[4] : Paris et Buenos Aires. Cette connaissance a une importance majeure lorsqu’il s’agit d’interpréter le plus correctement possible un découpage ou une association conceptuelle. Ces deux villes possèdent des caractéristiques semblables à plusieurs égards[5]. Il s’agit dans les deux cas de capitales qui regroupent non seulement la plus grande partie de la population nationale, mais aussi une bonne partie des activités économiques du pays, lesquelles se voient reflétées dans les annuaires téléphoniques professionnels édités annuellement. Compte tenu de la période de l’année au cours de laquelle les annuaires sont publiés, l’année de référence prise en considération est l’année 2005-2006 pour Buenos Aires et 2006 pour Paris.

Si l’on s’attache à leur présentation, les deux annuaires sont constitués d’un seul volume et contiennent des cartes faisant référence à la zone géographique couverte, de manière à permettre aux lecteurs de repérer les adresses mentionnées dans le texte. Cependant, d’autres parties des annuaires diffèrent en fonction des pratiques éditoriales respectives. Par exemple, en France, les Pages jaunes dédient une de leurs parties aux adresses Internet – partie inexistante dans l’annuaire de Buenos Aires. À l’inverse, l’annuaire de Buenos Aires dispose d’une partie qui concerne les organismes officiels et les services publics – partie inexistante dans l’ATP parisien.

Le volume des rubriques varie selon l’annuaire, leur présentation aussi. De son côté, l’annuaire de Paris recourt très fréquemment à l’usage des parenthèses pour compléter le sens de l’entrée. Par exemple, la rubrique Isolation est complétée par (travaux) ou celle de Gaz précisée par (réparation d’appareils). La typographie est aussi importante parce qu’elle oriente le lecteur dans la recherche et dans l’identification des rubriques.

Enfin, les deux annuaires ont recours à des encarts publicitaires présentant parfois des images. Dans le cadre de notre analyse, ils servent à compléter l’information d’un abonné grâce au contenu de la publicité. En effet, l’accès à des images ou à d’autres listes de mots dans l’encart publicitaire vient renforcer le sens d’une unité. Par exemple, une unité polysémique comme Tatouage, ambiguë en tant que rubrique, est clarifiée dans les annonces grâce à des expressions comme piercing, maquillage semi-permanent ou art tatoo qui indiquent qu’il s’agit de tatouages humains et non du tatouage des animaux réalisé par le vétérinaire, pratique qui pourrait faire également l’objet d’une entrée ventilée en deux possibilités (tatouage humain et tatouage des animaux). Dans la consultation électronique, la requête avec tatouage est ambiguë, mais pas avec tatouage + chien, ce qui montre que le tri de la base de données est à l’oeuvre.

L’utilisation de la forme plurielle devient canonique (contrairement aux dictionnaires de langue) dans les deux annuaires, sauf dans le cas très particulier des non-comptables, qui concernent essentiellement les cultures, les matières et les techniques : Apiculture (« Apicultura »), Héliciculture, Habillement (Ropa), Ivoire, Peinture (Pintura) et Caucho (« caoutchouc »), Nitrógeno (« azote »), (« thé »). Les entrées sont constituées essentiellement de formes nominales.

Après ces remarques, il convient de se poser la question suivante : l’ATP peut-il être un corpus utile à la linguistique de corpus ? La réponse est nuancée. La taille du corpus est limitée, elle pourrait être élargie si tous les annuaires édités par un même éditeur (systématicité de la classification) dans un même pays (homogénéité très probable des pratiques) étaient réunis et analysés. Par ailleurs, le regroupement des unités d’un même domaine de connaissance pourrait être étudié comme porte d’entrée vers des domaines d’activité. Par exemple : dans le cas de Buenos Aires, les unités qui se rapportent au monde de la construction et du bâtiment ou à l’industrie automobile apparaissent avec une fréquence notable. Quelle est la place de ces activités dans cette ville ? Est-ce que ce type d’analyse ferait ressortir des préoccupations économiques des sociétés à une échelle plus vaste que celle de la région considérée ? On peut le supposer. C’est le regard croisé du linguiste, du sociologue et de l’économiste qui peut apporter une réponse. Comme nous le verrons dans la section suivante, l’étude des concordances s’avère être d’une utilité relative tout comme les mises en correspondance des langues qui posent des problèmes notamment culturels qui concernent l’interprétation des unités de la liste et les pratiques économiques. L’analyse diachronique, quant à elle, reste possible tout particulièrement par rapport à l’évolution des pratiques économiques.

4. La nécessité de classifier l’activité économique

Si les ATP répertorient et classifient des activités économiques, ils ne sont pas les seuls à le faire. D’une manière générale, ce qu’on pourrait appeler des « répertoires professionnels » pourrait aussi être pris en considération. Par exemple en France : les business guides, les guides business to business (ou B2B), Pages Pro®, les guides des commerçants locaux ou de quartier – ces deux derniers couvrant une zone très délimitée et proche géographiquement de l’utilisateur. Contrairement aux ATP, ces répertoires ne se basent pas sur le fait que les entités répertoriées ont souscrit un abonnement téléphonique. Ils répertorient des activités professionnelles ou commerciales et sont, dans de nombreux cas, issus d’une démarche commerciale.

Les activités économiques sont classifiées dans le monde entier par différents organismes en fonction de l’objectif recherché : l’encadrement des activités, l’imposition, les statistiques ou les échanges économiques de biens et de services. Le résultat de ces classifications prend aussi la forme de listes. La constitution de tels répertoires nécessite aussi le recours à des classifications. Par exemple : la classification de toutes les branches d’activité économique est publiée en France par l’Institut national de la statistique et des études économiques (INSEE)[6]. La visée est bien différente de celle des ATP. Les listes obtenues possèdent toutefois des caractéristiques proches : unités simples ou complexes sans prédication ; si un contexte apparaît, il est limité à l’explicitation de l’unité traitée. Toutes les formes sont nominales. Le tableau 2 montre un extrait de la liste de sections de niveau 1 de l’INSEE. Comme on peut le constater, rien n’y est dit à propos de ces activités, l’argumentation en est absente, il s’agit de syntagmes nominaux.

Tableau 2

Nomenclature des activités françaises (NAF) rév. 2, 2008 – Niveau 1 – Liste des sections précédées du code attribué par l’INSEE

Nomenclature des activités françaises (NAF) rév. 2, 2008 – Niveau 1 – Liste des sections précédées du code attribué par l’INSEE

-> Voir la liste des tableaux

Ces listes sont traduites, notamment par les organismes internationaux qui suivent le même code (A, B, C, etc.) ; nous pourrions parler d’un résultat normalisé qui ne donne pas lieu à des divergences d’interprétation. Si nous considérons ces dénominations comme faisant partie de la langue spécialisée en économie et commerce, nous sommes en face de termes. En suivant une démarche onomasiologique, une activité sera classée dans une catégorie ou dans une autre, et ce, quel que soit le niveau de la liste considérée (5 niveaux pour l’INSEE). En effet, dans un cadre réglementaire, il ne peut y avoir de fluctuation d’interprétation par rapport à la désignation d’une catégorie quelle que soit la langue. Par exemple : pour l’INSEE (NAF rév. 2, 2008 – Niveau 5 – Liste des sous-classes), ce à quoi Boulangerie réfère n’est pas une sous-classe en soi, mais une catégorie de commerces (10.71C – Boulangerie et boulangerie-pâtisserie) qui ne donne pas lieu au détail des entreprises qui pratiquent cette activité.

Contrairement aux cas particuliers des listes qui concernent une classification des activités économiques, les ATP doivent procéder différemment. Ils répertorient non seulement des activités, mais aussi des produits et des services concrets ainsi que les entreprises ou organismes chargés de les produire ou de les commercialiser. C’est ainsi que les habitudes locales vont se voir reflétées dans les ATP dont la classification devient très différente de celle de l’INSEE. L’annuaire parisien a une tendance nettement moins marquée que l’annuaire argentin à citer des objets concrets tels que béquilles, gants, huîtres, pinceaux. À Buenos Aires, les objets cités sont légion. Faut-il y voir une pratique de consultation des ATP ou un besoin de réunir des objets dans des catégories plus larges ? La réponse ne saurait être définitive, mais il est probable que les habitudes de consultation mènent vers l’objet concret dans un cas, vers le vendeur ou prestataire de services dans l’autre.

Pour les ATP, la classification se fait en fonction des pratiques concrètes de ces commerces de boulangerie, de boulangerie-pâtisserie ou de pâtisserie. Nous trouvons alors : Boulangerie industrielle : pain, viennoiseries (détail), Boulangerie, Boulangerie-pâtisserie, puis Pâtisserie. La classification peut encore varier en fonction de la région et de la réalité du terrain : si, comme c’est le cas dans certaines villes ou certains villages, une seule entreprise centralise toutes les activités, par exemple de boulangerie, viennoiserie et pâtisserie, la classification les regroupera sous une seule entrée ou indiquera des renvois, par exemple : Viennoiserie : voir Boulangerie.

Les ATP classifient aussi différemment selon le pays et selon les habitudes héritées de sa propre histoire. Les annuaires n’explicitent pas nécessairement leur structure. Un même produit, par exemple le carrelage, peut être considéré comme une marchandise vendue, comme une marchandise posée/installée ou comme une marchandise traitée (dans le sens d’actions effectuées sur la marchandise). D’autres produits ou services se trouvent regroupés sous une rubrique unique, comme Carrosserie et peinture automobile. L’éditeur doit connaître les pratiques de consommation, de production, les pratiques professionnelles, en fonction de quoi il crée des catégories ou des entrées à part entière. L’annuaire de Buenos Aires sépare, selon les cas, le produit lui-même du négoce en créant des entrées spécifiques, comme on peut le constater dans le cas de la vente des glaces (crèmes glacées), tradition de longue date héritée de l’Italie (tableau 3). Par comparaison, l’ATP parisien ne mentionne que la rubrique Glaciers.

Tableau 3

Rubriques relatives aux glaces dans l’ATP de Buenos Aires

Rubriques relatives aux glaces dans l’ATP de Buenos Aires
*

« Glaciers, Glaciers – Articles, Glaces, Glaces – Machines et équipements ;

Voir aussi : Gastronomie – Machines et équipements, Glaces – Matières premières »

-> Voir la liste des tableaux

Ces classifications aboutissent aux rubriques, qui forment, dans les ATP, des listes beaucoup plus riches – donc plus longues – que celles qui sont publiées par les organismes officiels. Ainsi, sur le plan quantitatif, la liste de nomenclature des activités françaises au niveau 5 (Liste des sous-classes) est la plus grande des cinq listes de l’INSEE avec 732 libellés ; l’ATP parisien, quant à lui, comporte environ 1800 rubriques et celui de Buenos Aires atteint 2500. L’écart est pour le moins étonnant et se fonde, justement, sur les nécessités de classification : par exemple, la version papier de l’annuaire de Paris ne considère pas vis comme une entrée alors que l’annuaire de Buenos Aires considère son équivalent, Tornillos, avec un renvoi : Tornillos ver también Ferreterías industriales (« vis, voir aussi quincaillerie industrielle »). Ceci constitue une différence importante entre les éditions papier et électronique des ATP : les classifications des annuaires électroniques sont souvent invisibles et offrent d’autres possibilités. Une comparaison entre ces deux éditions n’est donc pas inutile. La possibilité de faire des requêtes étant beaucoup plus vaste, il appartient à l’internaute de taper un ou plusieurs mots pour obtenir des résultats (les catégories étant proposées par la suite). Pour l’exemple précédent, il y a deux classifications pour l’annuaire électronique de Paris (grâce à deux rubriques : Bricolage, outillage et boulonnerie et Visserie, clouterie) et cinq pour Buenos Aires (grâce à la mention d’objets concrets : Bombas a tornillo [« pompes à vis »], Tornillos Allen [« vis Allen »], Tornillos autoperforantes [« vis auto-perforantes »], Tornillos sin fin [« vis sans fin »], Tornillos de acero inoxidable [« vis en acier inoxydable »]). D’autres annuaires en usage à Buenos Aires, suivant la même logique, mentionnent jusqu’à vingt-quatre types de vis[7]. En conséquence, dans certains cas, c’est à l’utilisateur de formuler l’hypothèse de savoir où il va trouver les informations sur l’élément qui l’intéresse : à la rubrique qui concerne l’objet concret ou au commerce chargé de sa vente ou du service pertinent ?

L’annuaire de chaque ville suit une stratégie de classification fondée sur les pratiques culturelles et économiques, mais aussi sur les attentes, sur le plan notionnel, des utilisateurs. Autrement dit, les listes sont organisées en fonction de la stratégie de recherche susceptible d’être suivie par les utilisateurs des ATP dans chacune des villes. Les marques typographiques sont dès lors importantes : renvois à la ligne, retraits, parenthèses, caractères gras ou italiques, puces, utilisation des majuscules ou encore la mention voir ou voir aussi (ver ou ver también). En effet, elles aiguillent vers un mode de conceptualisation qui mène à la catégorie correspondante. Par exemple, l’annuaire parisien a recours aux alinéas signalés typographiquement avec des points, tandis que celui de Buenos Aires semble se focaliser seulement sur les articles manufacturés (tableau 4).

Tableau 4

Comparaison d’entrées équivalentes dans les ATP de Paris (A) et de Buenos Aires (B) : le rotin

Comparaison d’entrées équivalentes dans les ATP de Paris (A) et de Buenos Aires (B) : le rotin
*

« Rotin – articles »

-> Voir la liste des tableaux

Dans ce cas, Paris ventile la vente (détail, commerce) et la fabrication. À l’inverse, l’ATP de la capitale argentine ventile en plusieurs entrées ce qui est regroupé en une seule entrée dans l’ATP de Paris (tableau 5) : la référence à l’appareil concerné (Fotocopiadoras) précède le produit (Fotocopias).

Tableau 5

Comparaison d’entrées équivalentes dans les ATP de Paris (A) et de Buenos Aires (B) : la photocopie

Comparaison d’entrées équivalentes dans les ATP de Paris (A) et de Buenos Aires (B) : la photocopie
*

« Photocopieurs », « Photocopieurs – location », « Photocopieurs – réparations », « Photocopieurs – fournitures », « Photocopies couleur », « Photocopies et duplications »

-> Voir la liste des tableaux

Lorsqu’il s’agit de traiter la rubrique : « eau », les deux ATP prennent des stratégies très différentes (tableau 6). Les exemples de ce type sont nombreux.

Un produit ou un service peut être accompagné de ce qu’on pourrait appeler des classificateurs : par exemple, un objet donné peut être classifié selon qu’il s’agit de la fabrication, de la vente, de l’achat ou de la réparation. Chaque annuaire a recours à ces classificateurs mis en évidence par des procédés typographiques variables : placés après le nom de l’objet ou du service, ils peuvent être signalés par des parenthèses ou des tirets, ou encore être suivis d’un renvoi à la ligne pour constituer une nouvelle entrée (tableau 6).

Tableau 6

Comparaison d’entrées dans les ATP de Paris (A) et de Buenos Aires (B) : les eaux

Comparaison d’entrées dans les ATP de Paris (A) et de Buenos Aires (B) : les eaux
*

« Eau déminéralisée », « Eau distillée », « Eau minérale », « Eau naturelle », « Eaux souterraines – Études », « Eau – traitement voir aussi » : « eaux usées – traitement »

-> Voir la liste des tableaux

Les concordanciers sont ici utiles, car ils permettent de clairement visualiser ces classificateurs proposés par chaque annuaire et d’accéder directement à l’information recherchée.

Les classificateurs constituent parfois des catégories et peuvent apparaître isolés (achat) ou regroupés (achat et vente), et apparaissent dans les deux ATP. Le tableau 7 permet de comparer les classificateurs les plus fréquents dans les ATP des deux villes. Les classificateurs sont parfois trompeurs, car ils peuvent être polysémiques : par exemple, comercio, à Buenos Aires peut renvoyer au concept de //négoce//, mais aussi de //magasin//. Comme on le voit dans le tableau suivant, les stratégies de classification peuvent être similaires. Elles intéressent autant les buts commerciaux de l’éditeur qu’elles sont nécessaires au repérage du lecteur.

Tableau 7

Exemples des classificateurs les plus fréquents dans les ATP de Paris (A) et de Buenos Aires (B)

Exemples des classificateurs les plus fréquents dans les ATP de Paris (A) et de Buenos Aires (B)

-> Voir la liste des tableaux

Ces stratégies de classification et d’organisation interne des ATP ont leur impact sur les lecteurs et auront leur impact sur la traduction.

5. La traduction des ATP

Pourquoi traduire les ATP ? Les ATP sont un outil quotidien qui pour beaucoup est un instrument de travail. À titre d’exemple, le PagesJaunes Groupe est présent dans quatre pays par l’intermédiaire de ses filiales et représente un chiffre d’affaires de 1,1 milliard d’euros en 2009 pour ses différentes activités[8]. Lorsque les informations publiées doivent être recherchées dans une autre langue, la traduction devient nécessaire et délicate, et ce, quel que soit le sens dans lequel elle est effectuée. Elle conjugue des compétences en langues et en terminologie ainsi que des connaissances relatives aux pratiques économiques et professionnelles locales, autant d’aptitudes qui ne peuvent pas être toujours dissociées. Il est également nécessaire d’observer la manière dont l’annuaire lui-même est organisé. Il ne s’agit pas seulement de correspondances linguistiques entre listes : il importe de traduire un ATP en suivant la lecture qui sera faite par le destinataire de la traduction. En effet, il peut chercher les entreprises qui installent un produit ou louent des machines. Pour le lecteur, la traduction d’une rubrique peut être secondaire parce qu’il la connaît, en revanche, il ne suit pas forcément la même démarche de recherche d’informations dans deux pays différents avec des langues différentes, d’où la nécessité d’analyser finement non seulement les éléments constituants de la liste, mais aussi la manière que l’éditeur a de les organiser.

Alors, le besoin de mettre en correspondance les membres de ces listes se diversifie : soit deux annuaires sont ordonnés pour avoir des correspondances linguistiques entre deux pays en deux langues et au cas par cas (Paris et Buenos Aires), soit entre des villes aux cultures différentes, mais qui partagent une même langue dans des variétés différentes (Buenos Aires, Madrid, Mexico). Ce qui veut dire que les correspondances Paris-Buenos Aires ne sont pas forcément valables pour Paris-Mexico ou que celles de Mexico-Buenos Aires ne le sont pas non plus pour Buenos Aires-Caracas. Ces mises en correspondance servent autant la traduction destinée à un point précis que la recherche de variantes d’expression dans une même langue. Cependant, comme nous l’avons déjà évoqué, la difficulté majeure réside dans l’absence de contexte nécessaire à la bonne compréhension des éléments à traduire, ce qui peut provoquer des erreurs de traduction.

Nous avons procédé à la traduction en français de toutes les entrées de l’annuaire de la ville de Buenos Aires et à la comparaison du résultat aux entrées de l’annuaire parisien. Nous avons exclu de la traduction certaines catégories, à savoir les professions libérales, telles que les médecins ou les avocats, ainsi que les administrations et les associations et les clubs : dans les deux premiers cas, parce que la correspondance est presque identique (par exemple, Médicos Neurólogos et Médecins : neurologie) ; dans le troisième cas, parce que les administrations des deux pays ne correspondent pas. Quant aux associations et aux clubs, nous les avons exclus de notre étude parce qu’ils sont très liés à la vie locale.

La recherche d’équivalents est fondamentalement problématique dans deux situations. La première est celle des expressions rares dans la vie quotidienne ou limitées à un domaine d’activité. Par exemple : Trefilados (« tréfilage des aciers ») ou Zunchos (//armature métallique de renforcement du béton//). La deuxième situation apparaît lorsque les référents sont inexistants en français. Par exemple : Alfajores (« gâteaux traditionnels »), Yerba mate (« maté, infusion traditionnelle ») ou Quinchos (//constructions locales traditionnelles souvent sans murs avec le toit en chaume//). D’autres expressions seraient en revanche adaptables. Ainsi, le terme kiosque existe en français, mais ne correspond pas à kiosco en Argentine, où il désigne une petite boutique qui regroupe la vente de tabacs, friandises, boissons, petites fournitures, etc. De plus, les Kioscos font l’objet de trois entrées différentes, à savoir Kioscos 24 h (« kiosques ouvert 24 heures sur 24 »), Kioscos – Artículos (Kiosques – Articles) et Kioscos – Mayoristas (« kiosques fournitures en gros »).

L’absence de contexte rend la traduction des expressions polysémiques très difficile, et le phénomène apparaît dans les deux langues. Les contextes qui permettent de lever l’ambiguïté peuvent être trouvés dans le même ATP, notamment dans les publicités et, dans de très nombreux cas, grâce aux sites Internet des abonnés mentionnés dans les encarts. Par exemple : Depósitos est ambigu en tant que rubrique, puisqu’il peut s’agir de //dépôt d’objets// ou de //dépôts d’argent//. Toutefois, le sens est clair dans les pages faisant état des deux concepts, respectivement. Lors de la traduction en français, il faudra opter, pour la situation concrète évoquée, pour entrepôt, garde-meubles ou dépôt de marchandises (qui renvoient à des notions existant toutes en espagnol). Ces termes seront éventuellement regroupés lors du traitement de la rubrique. C’est bien la solidarité avec d’autres éléments présents dans le répertoire qui permet de trouver le sens pertinent en vue d’effectuer la traduction.

Wikipédia se révèle un outil bien pratique car, pour une même thématique, il propose des contenus très proches dans chaque langue : Trailers correspond au concept de //remorque// mais aussi à celui de //bande-annonce//. La fonction Images de Google permet également de visualiser le référent : ainsi, Pallets correspond à //palettes de manutention//.

On trouve également quelques phénomènes d’hyperonomase dus aux pratiques culturelles. Par exemple, l’annuaire parisien possède une seule entrée pour Cimetière, là où l’annuaire de Buenos Aires en possède trois : Cementerios (« cimetières »), Cementerios Privados (« cimetières privés ») et Cementerios Privados para Animales Domésticos (« cimetières privés pour animaux domestiques »).

La traduction d’un ATP est bien entendu possible ; en revanche, le résultat peut ne pas être utile à cause des classifications internes mentionnées plus haut et des habitudes des lecteurs. Un exemple, parmi tant d’autres : l’annuaire de Buenos Aires propose des entrées pour : Perchas (« cintres »), Aceitunas (« olives »), Sombrillas (« parasols »), Postes (« pieux »), Pollos (« poulets »), Cuarzo (« quartz [pour les résistances électriques] »), Servilletas (« serviettes [de table] ») ou Remaches (« rivets »). Aucune de ces entrées ne correspond à une quelconque entrée dans l’annuaire de Paris qui exige de rechercher plutôt les catégories auxquelles ces objets appartiennent : Accessoires pour étalage pour les cintres, Alimentation pour les olives, Accessoires de jardin pour les parasols, Fondation et consolidations des sols pour les pieux, Volailles et gibiers pour les poulets, Entreprises d’électricité pour le quartz, Articles de la table pour les serviettes ou Outillages pour les rivets. Quel intérêt alors de traduire aceitunas par olives ? Ce qui veut dire que la traduction d’un ATP exige une réorganisation complète de la structure du document notamment pour la version papier. Traduire est alors aussi adapter à la lecture d’un public aux exigences trop diverses et variées pour pouvoir être satisfaites du point de vue de l’éditeur.

La difficulté réside donc dans les catégorisations qui sont faites par chaque annuaire en fonction des pratiques culturelles et des pratiques de consultation de l’annuaire. La traduction d’un ATP, quant à elle, nous amène aux besoins de l’analyse terminologique.

6. Un annuaire terminologique ?

Aussi curieuse qu’elle puisse paraître, la question mérite d’être posée. La démarche onomasiologique est à l’oeuvre en permanence et le discours des experts est nécessaire parce qu’il s’agit, dans de nombreux cas, de communication entre spécialistes (par exemple : de l’ignifugation ou de l’héliciculture) ou encore d’unités peu fréquentes dans la langue générale, par exemple, Zunchos (//armature métallique de renforcement du béton//) cité plus haut. Comparons également l’entrée sous la forme technique Hipoclorito, à la forme courante lavandina (en Argentine [lejía en Espagne]), qui correspondent, respectivement, à la forme technique hypochlorite de sodium et à la forme courante eau de Javel. L’annuaire de Buenos Aires opte pour le terme technique et non pour la forme courante dans le pays, absente dans l’annuaire, dont l’achat n’est pas seulement destiné aux industriels ou aux spécialistes du domaine.

Les ATP ne sont pas une compilation organisée de termes ; en revanche, ils en contiennent beaucoup, notamment si on les considère sous l’aspect des domaines de connaissance, d’activité et d’exploitation (de Vecchi, 2004). Ainsi, les domaines de connaissance représentés comprennent la construction, la mécanique automobile, la restauration, la chimie, la médecine ou le transport, parmi tant d’autres. À l’intérieur de ces domaines, des activités se précisent et on distingue alors, par exemple, différents types de transports : internationaux, aériens, fluviaux et maritimes, réfrigérés… ou bien d’automobiles, de charges, de combustibles, de documentations commerciales, de bétail, de gaz liquide, de liquides, de machinerie lourde, de passagers, de matières dangereuses, de produits chimiques, de personnes handicapées, de services logistiques ou de fonds. Pour chacun de ces domaines d’activité, les entreprises proposent des produits et services distincts et produisent leurs propres termes « maison » qui renvoient à des domaines d’exploitation spécifiques.

Certaines distinctions terminologiques sont notables : ainsi, Sogas (« cordes en fibre » exclusivement confectionnées en matériau végétal) et Cuerdas (« cordes ») renvoient à des notions spécialisées, mais peu connues du public. Les rubans de décoration utilisés en mercerie, souvent colorés, sont appelés vivos (littéralement, « vifs ») et peu connus ailleurs que dans le domaine de la confection de tissus. Les chariots à deux roues appelés en France diables sont dits Zorras (« renardes »), la difficulté de traduction apparaît alors dans les deux sens. Les dérivés du mica sont appelés Micanitas. Lonas désigne, selon le domaine, des tapis (de boxe) ou des bâches (dans les deux cas des //tissus de protection très résistants//) ; leur finalité permettra d’identifier le commerçant ou le fabricant à l’intérieur de la rubrique. Enfin, les caféterias et les cantines de France ne correspondent pas exactement aux Cafeterías (//vente et consommation de café et de mets non élaborés//) et aux Cantinas de l’Argentine (//restaurants modestes, d’origine italienne, où l’on chante parfois//). Il faut donc faire attention aux faux-amis culturels.

Les collocations sont parfois utiles pour affiner une traduction lorsqu’un concept peut présenter des variations. Ainsi, parmi les //laminés métalliques//, on trouve en espagnol Chapas (« tôles ») et Hojalata (« fer-blanc »). Si techo (« toit ») est en collocation avec chapa : un techo de chapa (« toit en tôle »), il ne l’est pas avec hojalata : techo de hojalata (« toit en fer-blanc »). De la même manière, on trouvera envase de hojalata (« contenant [boîte] en fer-blanc »), mais non envase de chapa (« contenant [boîte] en tôle].

7. Conclusion

L’exploration des ATP ouvre des perspectives inattendues et devrait inciter à des lectures faites sous différents angles, qu’il convient de faire avant l’abandon (probable) des formats papier lié à la constante montée en puissance des bases de données. En tant que corpus, il présente des caractéristiques qui le distinguent des corpus habituels et qui méritent d’être examinées de façon approfondie. Les outils tels que les concordanciers permettent de regrouper et d’analyser les formes qui vont conceptuellement être réunies (comme le concept de //transport//) mais séparées dans l’activité dans des champs très différents. Il s’agit d’un corpus en deux étapes : les rubriques proprement dites que nous avons explorées et les rubriques avec les entreprises concernées avec, souvent, des publicités ou encadrements qui contiennent des textes très limités quantitativement mais denses qualitativement étant donné que tous les éléments lexicaux appartiennent à un même champ d’utilisation et qui permettent de mieux cerner la rubrique. Par exemple dans les rubriques, Siliconas (« Silicones ») peut être mis en rapport avec : Aceite de siliconas (« Huile de silicone »), Juntas de siliconas (« Joints d’étanchéité ») ou Masillas (« Mastics »), mais séparé des Prótesis de siliconas (« prothèses en silicone ») qui ont leur propre entrée en dépit du fait qu’il s’agit du même matériel.

Sémantiquement, les classifications dont les ATP font état nous renvoient aux comportements des consommateurs et des citoyens profondément ancrés dans des pratiques inscrites dans leur histoire. C’est justement l’histoire des entreprises et, à travers elles, l’histoire de l’économie d’une région ou d’une ville qui apparaît en toile de fond dans les annuaires téléphoniques professionnels.

La traduction de ce corpus atypique devient un exercice acrobatique pour rendre non seulement compte de tous ces phénomènes dans une autre langue, mais aussi dans d’autres cultures et dans d’autres pratiques sociales. Par ailleurs, si toutes les rubriques issues des catégorisations faites par les éditeurs des ATP à l’échelle d’un pays étaient réunies, le volume de données serait considérable et nécessiterait, autant en version monolingue que multilingue, une autre manière d’exploration. Ceci nous oriente nettement vers la linguistique de corpus qui permet d’explorer des contextes plus vastes de réalisation des unités présentes dans les ATP.