Article body

L’ouvrage décrit ici s’inscrit dans la collection Benjamins’s Translation Library consacrée à la traduction sous toutes ses formes. Son éditeur, Harold Somers, du University of Manchester Institute of Science and Technology (UMIST), est bien connu pour sa vaste expérience de recherche et d’enseignement dans le domaine de la traduction automatique. Pour la réalisation de ce collectif, il s’est entouré de spécialistes du milieu de la recherche et de l’enseignement ainsi que du secteur privé. L’ouvrage est avant tout destiné aux traducteurs, mais tous les langagiers le consulteront avec intérêt.

L’objectif de Somers est de clarifier, d’expliquer et d’exemplifier l’influence des ordinateurs sur le travail des langagiers. L’auteur désire aussi permettre aux lecteurs de cerner non seulement ce que la technologie peut apporter comme solutions aux problèmes du traducteur, mais aussi ce qu’elle ne peut pas faire. L’ouvrage aborde autant la traduction automatique (TA) que la traduction assistée par ordinateur (TAO).

Le premier chapitre, rédigé par l’éditeur (Harold Somers) fait acte d’introduction. On y trouve un bref historique de la traduction automatique depuis les idées à la base des premières recherches, en passant par la conception des premiers systèmes, jusqu’aux pistes exploitées dans les plus récentes recherches.

Somers consacre le chapitre 2 au « poste du traducteur ». La première partie de ce chapitre porte sur l’origine de ce concept et sur les divers outils pouvant s’intégrer au poste. Parmi ceux-ci, on compte l’inévitable traitement de texte (compteur de mots, correcteur orthographique, dictionnaire des synonymes), les technologies en concurrence avec le dictaphone, les outils d’éditique ainsi que les langages de balisage et de structuration des documents électroniques (HTML, SGML). Le lecteur peut ensuite consulter une courte section consacrée aux dictionnaires électroniques et aux banques de terminologie suivie d’une présentation des fonctionnalités les plus courantes des systèmes de TA et de TAO commerciaux. L’utilité des corpus unilingues et bilingues pour le travail du traducteur est aussi soulignée.

Issues d’une idée lancée au début des années 1970, les mémoires de traduction constituent fort probablement la technologie d’automatisation de la traduction la plus répandue auprès des traducteurs. Dans le chapitre 3, Harold Somers présente les méthodes d’élaboration des mémoires de traduction, les techniques d’appariements utilisées par les logiciels et les critères d’évaluation de ces logiciels. Le chapitre se termine par une mise en opposition des mémoires de traduction à la traduction automatique fondée sur l’exemple afin de permettre aux lecteurs de bien distinguer les deux concepts.

Dans le quatrième chapitre, Lynne Bowker (Université d’Ottawa) s’intéresse à un autre type de logiciel que l’on retrouve de plus en plus fréquemment dans la boîte à outils du traducteur : les systèmes de gestion de la terminologie. Après un bref historique des banques de terminologie et un aperçu des éléments qui composent une fiche terminologique traditionnelle, l’auteure passe en revue les particularités et les avantages des systèmes de gestion terminologique. Une présentation des techniques d’extraction automatique de termes clôt ce chapitre.

Le chapitre 5 est consacré au domaine en forte croissance qu’est la localisation. Bert Esselink (Lionbridge – Amsterdam) brosse un tableau très complet de cette sphère d’activités en opposant la localisation à la traduction. Il passe en revue les particularités d’un projet de localisation, la chaîne de travail propre au domaine et les divers intervenants d’un tel projet. Il présente aussi un survol de la technologie mise à contribution et termine sur une présentation de l’industrie de la localisation.

Harold Somers aborde, dans le chapitre 6, le sujet du traitement informatique des « langues minoritaires ». Tel que mentionné par l’auteur, ce concept est quelque peu subjectif puisque ces langues, d’un point de vue démographique, sont largement majoritaires étant donné qu’elles regroupent une bonne partie des 20 langues ayant le plus grand nombre de locuteurs au monde (hindi, bengali, malais, cantonais, etc.). Les sujets touchés sont la saisie au clavier, le traitement de texte, la reconnaissance optique des caractères, la correction orthographique, la correction grammaticale, les dictionnaires électroniques, les thésaurus, les systèmes de TA et de TAO, et les corpus bilingues.

Au chapitre 7, Sara Laviosa de l’Università degli di Bari traite de l’exploitation des corpus par le traducteur. Madame Laviosa propose une typologie des corpus pour la traduction, un recensement des recherches à visée descriptive effectuées sur corpus dans le cadre de la traduction et des exemples d’utilisation des corpus pour la formation des traducteurs. Enfin, elle traite rapidement de l’exploitation des corpus par le traducteur professionnel.

Doug Arnold (University of Essex) explique en détail, au chapitre 8, ce qui fait de la traduction un problème si difficile pour l’ordinateur. Ce chapitre constitue une très bonne introduction à la traduction automatique et aux défis qui se posent à chacune des étapes du processus de traduction par l’ordinateur : l’analyse du document en langue source, l’étape de transfert et la génération du texte en langue cible. Le chapitre se termine sur une présentation des approches moins classiques que sont la TA fondée sur l’exemple et la TA fondée sur la statistique.

Collègue d’Harold Sommers à l’UMIST, Paul Bennett brosse, dans le chapitre 9, un tableau des fondements linguistiques des systèmes de traduction automatique. Les techniques décrites par l’auteur permettent de mieux comprendre comment l’ordinateur manipule le matériau linguistique.

Les lecteurs intéressés à se procurer un système de traduction automatique seront heureux de consulter le chapitre rédigé par John Hutchins (University of East Anglia), acteur bien connu du monde de la TA. Dans le chapitre 10, l’auteur procède à un recensement des systèmes commerciaux de TA et de TAO.

Pour leur part, Scott Bennett (Denville, New Jersey ; ex-employé de la société Logos) et Laurie Gerber (Language Technology Broker, San Diego ; ex-employée de la société Systran) présentent le point de vue des concepteurs de logiciels de TA. Le chapitre 11 révèle la face cachée de ces logiciels. On y discute aussi de l’évaluation de leur performance et de l’utilisation d’un système commercial au sein d’une entreprise.

En 1997, la société AltaVista s’associait à Systran pour lancer le portail Babelfish, première percée majeure de la TA dans le grand public. Accessible gratuitement, ce site a été le premier portail de traduction automatique disponible dans Internet. Au chapitre 12, Jin Yang et Elke Lang (Systran Software, Inc.) décrivent cette aventure sous divers angles : les défis techniques, la réaction du public et la rétroaction obtenue, l’analyse des documents soumis, etc.

Au chapitre 13, John White (PRCNorthrop Grumman Information Technology) traite de l’une des préoccupations principales soulevées par la traduction automatique : l’évaluation des systèmes. L’auteur présente les diverses approches envisageables pour l’évaluation des logiciels tout en soulignant l’importance de déterminer le public cible de l’évaluation : les utilisateurs, les gestionnaires, les concepteurs, les distributeurs ou encore les investisseurs. Parmi les différents types d’évaluation soulevés, on compte l’étude de faisabilité, l’évaluation à l’interne par les concepteurs, l’évaluation de l’utilisation, de la convivialité et de l’adéquation ainsi que l’évaluation comparative. L’auteur effleure aussi les nouvelles approches de validation automatique des traductions produites par un système.

Eric Nyberg, Terako Mitamura (Carnegie Mellon University) et Willem-Olaf Huijsen (University of Utrecht) ont collaboré à la rédaction du chapitre 14. Ils abordent le sujet des langues contrôlées (LC) et des contraintes typiques de ce type de rédaction. Cet exercice peut avoir deux objectifs très distincts, soit rendre le texte plus facile à comprendre par un humain, soit le rendre plus facile à analyser par un ordinateur. Premièrement, les auteurs passent en revue les bienfaits et les inconvénients des langues contrôlées. Ensuite, ils procèdent à un recensement des LC les plus connues, à une description des principes de vérification et de correction des LC ainsi qu’à une évaluation de la valeur ajoutée de ce type de rédaction. Enfin, le sujet du recours à la langue contrôlée en vue de la traduction automatique est soulevé ; pour terminer, les auteurs présentent une histoire de cas, celle de Caterpillar Inc. réalisée en collaboration avec l’Université Carnegie Mellon et le Carnegie Group Inc.

Rédigé par Harold Somers, le chapitre 15 constitue une suite logique au précédent puisqu’il traite des sous-langues (sublanguages) et des particularités linguistiques de ce type de discours. L’auteur décrit en détail le système de TA le plus connu consacré à une sous-langue : Météo.

L’inclusion de logiciels de traduction automatique en entreprise a donné naissance à un tout nouveau type d’activité, la postédition. Cette dernière consiste en la correction humaine de la sortie machine d’une traduction automatique. Au chapitre 16, Jeffrey Allen (Mycom France) tente de cerner les tâches du postéditeur, son profil et les divers niveaux de révision d’un document produit par un système de TA. Le chapitre se termine sur des exemples tirés de sociétés qui ont mis en place des guides de postédition.

Le dernier chapitre de ce livre, rédigé par Somers, porte sur l’utilisation des outils de TA et de TAO pour l’enseignement de la traduction et pour les apprenants d’une langue. Selon Somers, les étudiants en traduction devraient être en mesure d’évaluer la qualité d’un système de TA, d’effectuer la postédition, d’enrichir les dictionnaires, de proposer des contraintes de rédaction afin de faciliter la traduction automatique et d’intégrer les outils de TA dans leur environnement de travail. L’auteur suggère aussi quelques scénarios d’intégration de la traduction automatique dans le cadre des cours de langue seconde.

Cet ouvrage offre une vision d’ensemble réaliste des possibilités offertes par l’utilisation de l’ordinateur dans le cadre du travail de traduction. La grande majorité des chapitres débutent par un survol historique du sujet abordé, ce qui permet aux lecteurs qui maîtrisent moins bien un sujet de l’approfondir si désiré. Chose précieuse, tous les chapitres incluent aussi une section qui suggère des lectures complémentaires qui permettent aux lecteurs d’aller chercher de l’information supplémentaire.

À mon avis, l’objectif de vulgarisation énoncé par Somers dans l’introduction a été atteint. L’ouvrage se veut didactique et est destiné aux traducteurs désireux d’en savoir plus sur le traitement informatique de la langue dans le cadre du processus de traduction. Les auteurs permettent aux lecteurs de cerner ce que la technologie peut leur apporter tout en soulignant les progrès qui restent à accomplir. Ils tracent ainsi très clairement les frontières de l’automatisation.

On peut cependant déplorer l’absence d’un glossaire qui serait un compagnon de route extrêmement utile. De plus, le livre est lui-même victime du problème du traitement informatique des « langues minoritaires », soulevé au chapitre 6. En effet, on peut considérer que les défis de la manipulation des langues « exotiques » ne sont pas traités avec l’importance qu’ils méritent.

Malgré ces quelques petits défauts, cet ouvrage deviendra sûrement incontournable pour les lecteurs à la recherche d’une vue d’ensemble du domaine de la traduction automatique et de la traduction assistée par ordinateur. Les étudiants, les professionnels, les enseignants et les passionnés de la langue y trouveront tous un intérêt certain.