Meta
Journal des traducteurs
Translators’ Journal
Volume 67, Number 1, April–May 2022 Pour de nouvelles méthodes en traductologie quantitative Exploring New Methods in Quantitative Translation Studies Guest-edited by Meng Ji and Michael Oakes
Table of contents (19 articles)
-
In Memoriam – André Clas
-
Éditorial
-
Introduction: Quantitative methods in health, environmental, and theoretical translation research
-
La traduction automatique des textes faciles à lire et à comprendre (FALC) : une étude comparative
Silvia Rodríguez Vázquez, Abigail Kaplan, Pierrette Bouillon, Cornelia Griebel and Razieh Azari
pp. 18–49
AbstractFR:
Au cours de la dernière décennie, les langages contrôlés (LC) ont toujours été l’objet d’une attention accrue en traduction automatique (TA). La majorité des études ont porté sur l’impact des LC sur la qualité du produit final de la TA, mais très peu d’entre elles se sont intéressées à l’impact de la TA sur l’accessibilité des textes cibles pour les personnes à besoins particuliers. Cet article vise à combler cette lacune. Il cherche à déterminer, par le biais d’une étude linguistique comparative, si les systèmes de TA génériques constituent une option viable pour produire, à partir de textes simplifiés sources, des textes cibles faciles à lire et à comprendre (FALC). Nous avons testé trois outils génériques de TA (DeepL, Google Translate et Yandex) avec des textes FALC de trois domaines différents, dans quatre paires de langues. Les résultats montrent que DeepL est l’outil le plus performant et que l’espagnol et les textes administratifs restent ceux qui occasionnent le plus de problèmes pour la TA. En ce qui concerne l’évaluation de l’accessibilité linguistique, les problèmes aux niveaux lexical et stylistique sont les plus nombreux. Même si la TA ne produit pas encore des textes FALC acceptables, notre étude en souligne le potentiel et met l’accent sur la difficulté de créer du contenu multilingue accessible pour tous.
EN:
Over the last decade, controlled languages (CL) have received increased attention in machine translation (MT) research. The vast majority of studies have dealt with the impact of CLs on the quality of the final MT output, but very little work has focused on the impact of MT on the accessibility of target texts for people with special needs. This article represents a first attempt to bridge this gap. We present a comparative linguistic study that seeks to explore whether MT systems are a viable option for translating texts that are easy to read and understand (EtR). We tested DeepL, Google Translate, and Yandex with EtR texts from three different domains in four language pairs. Findings show that DeepL is the highest-performing system, and that Spanish and administrative texts in particular seem to present more challenges. The evaluation of the MT output in terms of linguistic accessibility indicates that the highest number of issues are found at a lexical and stylistic level. Although MT systems do not generate EtR texts of acceptable quality yet, our study highlights the potential of this tool, as well as the challenges of creating multilingual content that is accessible for all.
ES:
A lo largo de la última década, la aplicación de lenguajes controlados (LC) ha sido objeto de estudio en numerosos trabajos de investigación sobre traducción automática (MT). Muchos de ellos se han centrado en analizar el efecto del uso de LC en la calidad del producto final, pero apenas existen estudios que hayan explorado el impacto de la TA en la accesibilidad de los textos meta para las personas con discapacidad. El presente artículo busca contribuir al estado de la cuestión en dicha materia. A través de un estudio lingüístico comparativo, hemos querido comprender si los sistemas de TA son una opción viable para traducir textos en lectura fácil (LF). En el estudio se evaluaron tres sistemas (DeepL, Google Translate y Yandex) con textos en LF de tres campos diferentes, en cuatro combinaciones lingüísticas. Los resultados indican que DeepL es el sistema más eficiente, y que el español y los textos administrativos presentan más dificultades para la TA. En términos de accesibilidad lingüística, se han observado más problemas a nivel léxico y estilístico. Si bien la TA todavía no genera contenido en LF de una calidad aceptable, nuestro estudio destaca el potencial de este tipo de herramientas, así como los retos que supone crear contenido multilingüe que sea accesible para todos.
-
Revisiting simplification in corpus-based translation studies: Insights from readability research
Thomas François and Marie-Aude Lefer
pp. 50–70
AbstractEN:
Ever since the publication of Laviosa’s (1998a; 1998b) pioneering work, the study of lexico-syntactic simplification has held centre stage in corpus translation research concerned with the typical features of translated texts. The simplification hypothesis states that translated texts are simpler than non-translated texts. The convergence hypothesis, also discussed by Laviosa (1998a; 1998b), but less so in follow-up studies, is that translated texts are more homogeneous than original texts, that is they display less variance. To date, simplification has mostly been operationalised in CBTS as type-token ratio, lexical density, core vocabulary coverage, list head coverage and average sentence length. Relying on these parameters, previous research has produced mixed results, with simplification varying across translation modalities, language pairs and registers. The present article sets out to revisit the simplification and convergence hypotheses through the lens of NLP-informed readability research. In particular, we rely on a larger set of simplification indicators and make use of multivariate statistical techniques. We present a simplification study of Europarl corpus data in French translated from English and in non-translated French. The results show that translated French is simpler than original French, lexically and syntactically. We also find evidence of convergence that shows that translators smooth out cross-speaker lexical heterogeneity in translated parliamentary proceedings.
FR:
Depuis les travaux de Laviosa (1998a ; 1998b), les études de corpus se sont souvent penchées sur le phénomène de simplification lexico-syntaxique, afin de déterminer si les textes traduits sont plus simples que les textes non traduits. Laviosa (1998a ; 1998b) traite également de l’hypothèse de convergence, selon laquelle les textes traduits sont plus homogènes que les textes non traduits. Jusqu’à présent, cette question a cependant suscité moins d’intérêt que la simplification. En traductologie de corpus, la simplification a été opérationnalisée à l’aide de cinq paramètres principaux. Sur la base de ceux-ci, les études ont montré que la simplification varie en fonction des modalités de traduction, des paires de langues et des registres analysés. Notre article a pour objectif de revisiter ce type de recherche à travers le prisme des études de lisibilité. En particulier, nous utilisons un ensemble plus fourni de paramètres de simplification et avons recours à des statistiques multivariées. Nos analyses portent sur des données en français tirées du corpus Europarl (français traduit de l’anglais et français non traduit) et montrent que le français traduit est plus simple, d’un point de vue lexical et syntaxique, que le français non traduit. Une tendance à la convergence lexicale est également mise au jour en français traduit, ce qui semble indiquer que les traducteurs lissent les différences lexicales entre les orateurs de la langue source.
ES:
Desde que Laviosa publicara su trabajo pionero sobre la simplificación léxico-sintáctica en traducción (1998a; 1998b), esta ha ocupado un lugar destacado en los Estudios de Traducción. De acuerdo con esta hipótesis, los textos traducidos son más simples que los no traducidos. La hipótesis de la convergencia, también elaborada por Laviosa, pero con menor seguimiento en el campo en investigaciones posteriores, postula que los textos traducidos son más homogéneos que los textos originales. Hasta la fecha, la simplificación se ha abordado en los estudios de traducción basados en corpus como la relación tipo-caso, la densidad léxica, la cobertura del vocabulario básico, la cobertura del list head, y la longitud media de la oración. Teniendo en cuenta estos parámetros, investigaciones previas han ofrecido resultados diversos, en los que se observa que la simplificación varía en función de las modalidades de traducción, pares de lenguas o registros. El objetivo de este artículo es revisitar las hipótesis de simplificación y convergencia a la luz de la investigación sobre legibilidad informada por el procesamiento de lenguaje natural. Para ello, nos basamos en un conjunto de indicadores de simplificación más amplio e hicimos uso de técnicas de estadística multivariante. Analizamos la simplificación en datos de francés traducido del inglés y en francés original, extraídos de Europarl. Los resultados muestran que el francés traducido es más simple que el no traducido, tanto a nivel léxico como sintáctico. También observamos casos de convergencia, de acuerdo con la cual los traductores minimizarían la heterogeneidad léxica entre interlocutores en la traducción de las actas parlamentarias.
-
The Multilingual Corpus of Survey Questionnaires: A tool for refining survey translation
Diana Zavala-Rojas, Danielly Sorato, Lidun Hareide and Knut Hofland
pp. 71–93
AbstractEN:
This article describes the design and compilation of the Multilingual Corpus of Survey Questionnaires (MCSQ), the first publicly available corpus of international survey questionnaires. Version 3.0 (Rosalind Franklin) is compiled from questionnaires from the European Social Survey, the European Values Study, the Survey of Health, Ageing and Retirement in Europe, and the Wage Indicator Survey in the (British) English source language and their translations into eight languages (Catalan, Czech, French, German, Norwegian, Portuguese, Spanish and Russian). Documents in the corpus were translated with the objective of maximising data comparability across cultures. After contextualising aims and procedures in survey translation, this article presents examples of two types of problematic translation outcomes in survey questionnaires: The first type relates to the choice of idiomatic terms or fixed expressions in the source text. The second type relates to cases where the semantic variation of translation choices exceeds the scope allowed to maintain the psychometric properties across languages. With these examples, we aim to demonstrate how corpus linguistics can be used to analyse past translation outcomes and to improve the methodology for translating questionnaires.
FR:
Cet article décrit la conception et la compilation du Multilingual Corpus of Survey Questionnaires (MCSQ), le premier corpus de questionnaires d’enquêtes internationales accessible au public. La version 3.0 (Rosalind Franklin) est compilée à partir des questionnaires de l’Enquête sociale européenne, de l’European Values Study, de l’Enquête sur la santé et le vieillissement et la retraite en Europe, et du WageIndicator Survey dans la langue de départ, anglais (britannique), et leurs traductions en huit langues (catalan, tchèque, français, allemand, norvégien, portugais, espagnol et russe). Les documents du corpus ont été traduits en vue de maximiser la comparabilité des données entre les cultures. Après avoir contextualisé les objectifs et les procédures de traduction d’enquête, cet article présente des exemples de deux types de résultats de traduction problématiques dans les questionnaires d’enquêtes : le premier type concerne le choix de termes idiomatiques ou d’expressions fixes dans la langue de départ. Le deuxième type concerne les cas où la variation sémantique des choix de traduction dépasse la portée autorisée pour maintenir les propriétés psychométriques à travers des langues. Avec ces exemples, nous souhaitons démontrer comment la linguistique de corpus peut être utilisée pour analyser les résultats de traduction passés et pour améliorer la méthodologie de traduction de questionnaire.
ES:
Este artículo describe el diseño y la compilación del Multilingual Corpus of Survey Questionnaires (MCSQ), el primer corpus público de cuestionarios de encuestas internacionales. La versión 3.0 (Rosalind Franklin) se compila a partir de cuestionarios de la Encuesta Social Europea, el European Values Study (EVS), la Encuesta de Salud, Envejecimiento y Jubilación en Europa, y el WageIndicator Survey en el idioma de origen (inglés británico) y sus traducciones a ocho idiomas (catalán, checo, francés, alemán, noruego, portugués, español y ruso). Los documentos del corpus se tradujeron con el objetivo de maximizar la comparabilidad de los datos entre culturas. Después de contextualizar los objetivos y procedimientos en la traducción de encuestas, este artículo presenta ejemplos de dos tipos de resultados de traducción problemáticos en cuestionarios de encuestas. El primer tipo se relaciona con la elección de términos idiomáticos o expresiones fijas en el texto original. El segundo tipo se relaciona con los casos en los que la variación semántica de las opciones de traducción excede el alcance permitido para mantener las mismas propiedades psicométricas en todos los idiomas. Con estos ejemplos, nuestro objetivo es demostrar cómo se puede utilizar la lingüística de corpus para analizar los resultados de traducción y mejorar la metodología de traducción de cuestionarios.
-
Méthodes d’exploitation des corpus pour la traduction de termes complexes
Melania Cabezas-García and Pilar León-Araúz
pp. 94–118
AbstractFR:
La traduction des termes complexes pose souvent des problèmes sur différents plans. D’une part, dans le texte source, ils doivent être bien identifiés et compris, puis correctement traduits. Cependant, la solution à ces problèmes ne se trouve pas toujours dans les ressources terminologiques telles que les dictionnaires ou les bases de données, de sorte que le traducteur doit recourir à d’autres outils riches en informations, comme les corpus. Pour en tirer le meilleur parti, il faut connaître les différentes méthodes d’exploitation des corpus offertes par les systèmes d’analyse actuels. Cependant, ces dernières sont souvent inconnues, ce qui génère une réticence de la part des traducteurs à utiliser des corpus (Bowker 2004 ; Gallego-Hernández 2015 ; Loock 2016). Dans cet article, nous développons un protocole pour faciliter la compréhension et la traduction des termes complexes à l’aide de corpus parallèles et comparables. Nous illustrons la procédure avec des termes complexes de l’anglais, que nous traduisons en français et en espagnol.
EN:
Translating multiword terms can pose problems at different levels. First, they need to be correctly identified and understood in the source text with a view to translating them. However, the answer to these questions cannot always be found in terminological resources such as dictionaries or databases. Therefore, translators must use other information-rich resources such as corpora. In order to make the most of them, the diverse corpus query techniques available in current corpus analysis tools must be mastered. However, these techniques are often unknown, which results in the reluctance of many translators to use corpora (Bowker 2004; Gallego-Hernández 2015; Loock 2016). This paper presents a step-by-step protocol that facilitates the comprehension and translation of multiword terms by means of parallel and comparable corpora. The procedure is illustrated with English multiword terms, which are translated into French and Spanish.
ES:
La traducción de los términos compuestos puede presentar complicaciones a distintos niveles. Por una parte, en el texto origen es necesario identificarlos y comprenderlos de forma adecuada, para después trasladarlos correctamente a la lengua meta. Sin embargo, la respuesta a estas cuestiones no siempre se encuentra en los recursos terminológicos como diccionarios o bases de datos, de forma que el traductor debe recurrir a otras herramientas ricas en información como son los corpus. Para sacar el máximo partido, se deben conocer las distintas técnicas de interrogación de corpus que ofrecen los sistemas de análisis actuales. Sin embargo, estas a menudo se desconocen, lo que genera reticencia por parte de los traductores al uso de los corpus (Bowker 2004; Gallego-Hernández 2015; Loock 2016). En este artículo desarrollamos un protocolo paso a paso con el que se facilita la comprensión y traducción de los términos compuestos con la ayuda de corpus paralelos y comparables. Para ello, ilustramos el procedimiento con términos compuestos del inglés, que traducimos hacia el francés y el español.
-
Pour une traductologie de corpus exploratoire : méthodologie d’analyse d’un corpus de rapports du GIEC et de leurs traductions
Aurélien Talbot, Camille Biros and Caroline Rossi
pp. 119–142
AbstractFR:
L’articulation entre la théorie et la pratique a toujours été problématique en traductologie. Or, dès le départ, une des promesses de la traductologie de corpus a été de proposer une méthode pour articuler fermement la théorie à la pratique. Dès le départ aussi, la traductologie de corpus a ranimé l’ambition théorique de mettre au jour des lois et des universaux. Le poids de la statistique en traductologie de corpus semble ainsi l’avoir en partie détournée de son inspiration empirique et de la promesse d’une articulation entre théorie et pratique. À rebours de cette tendance, nous présentons ici les résultats d’une étude qui s’inscrit dans le champ d’une « traductologie critique fondée sur corpus » et permet de renouer avec l’une des promesses initiales de la traductologie de corpus, pour mettre en valeur certains problèmes spécifiques à une situation et à un contexte de traduction donnés. À partir d’une analyse statistique exploratoire dans le logiciel R des synthèses des rapports du GIEC et de leurs traductions en français et en espagnol, sur la période allant de 1990 à 2014, nous montrons qu’une traductologie de corpus exploratoire et critique apporte un éclairage sur le travail empirique des traducteurs institutionnels, notamment par l’analyse des choix terminologiques et de reformulation.
EN:
There have always been tensions between theory and practice in Translation Studies. Corpus-based Translation Studies (CTS) have emerged with the promise of offering a method for firmly articulating theory to practice. However, from the outset, CTS have also revived the theoretical ambition of uncovering laws and universals. Overall, the use of statistics in CTS thus seems to have partly diverted it from its empirical grounding and from the promise of articulating theory and practice. Against this trend, we present the results of a study conducted within Critical Corpus-based Translation Studies (CCTS) in which we return to one of the initial promises of Corpus-based Translation Studies and highlight problems tied to a given situation and context of translation. We have used the R software to perform exploratory statistical analyses of the Summaries of IPCC reports and their translations into French and Spanish over the period from 1990 to 2014. Our results show that an exploratory and critical corpus-based framework sheds light on the empirical work of institutional translators, notably through the analysis of terminological and phrasing choices.
ES:
El vínculo entre teoría y práctica siempre ha planteado problemas en traductología. Desde el inicio, una de las promesas de los estudios de traducción basados en corpus ha sido proponer un método para vincular firmemente la teoría con la práctica. Sin embargo, desde el principio, dichos estudios han reavivado la ambición teórica de descubrir leyes y universales. De hecho, parece que el uso de la estadística en los estudios de traducción basados en corpus los desvió de su inspiración empírica. A contrapelo de esta tendencia, presentamos en este artículo los resultados de un trabajo realizado en el marco de los «estudios críticos de traducción basados en corpus» con miras de retomar una de las promesas iniciales de los estudios de traducción basados en corpus y destacar algunos problemas específicos de una situación y contexto de traducción determinados. Basándonos en un análisis estadístico exploratorio con el programa R de las síntesis de los informes del IPCC y de sus respectivas traducciones al francés y al español, en el período de 1990 a 2014, queremos demostrar que un estudio crítico de traducción basado en corpus puede arrojar luz sobre el trabajo empírico de los traductores institucionales, en particular mediante el análisis de las opciones terminológicas y de reformulación elegidas.
-
The function of recurrent word-combinations in English translations from three different languages
Signe Oksefjell Ebeling
pp. 143–169
AbstractEN:
This article compares phraseological tendencies in translated vs. non-translated English through functionally classified 3-word sequences. The study builds on previous research that compared 3-grams in fiction texts originally written in English with fiction texts translated from Norwegian. The current investigation adds English translations from two additional languages – German and Swedish – with the aim of establishing to what extent the tendencies noted for English translations from Norwegian extend to English translations from other languages. Thus the study contributes to the discussion of translation universals and translation as a third code. At the level of 3-gram functions, it has been uncovered that English originals and translations share similar functional characteristics in eight of the fourteen categories identified. Of the remaining six, four show statistically significant differences between originals and translations, regardless of source language. Based on a more qualitative study of four specific 3-grams from two of these categories, it is concluded, in line with the previous studies, that the most likely explanations are source language(s) shining through and the (potentially universal) tendency for translators to use a smaller and more fixed set of expressions in their translations.
FR:
Cet article compare les tendances phraséologiques dans les textes anglais traduits et non traduits en utilisant des séquences de trois mots classés selon leur fonctionnement. L’étude s’appuie sur des études antérieures qui comparent des trigrammes dans des textes anglais originaux de fiction avec des textes de fiction traduits du norvégien. À l’enquête actuelle s’ajoutent des textes anglais traduits de deux langues supplémentaires – l’allemand et le suédois – dans le but d’établir dans quelle mesure les tendances constatées dans les textes anglais traduits du norvégien sont comparables aux tendances observées dans des textes traduits d’autres langues. Ainsi, l’étude contribue à la discussion des universaux de la traduction et de la traduction comme troisième code. Sur le plan des fonctions de trigrammes, on a découvert que les originaux et les traductions anglaises partagent des caractéristiques fonctionnelles similaires dans huit des quatorze catégories identifiées. Sur les six autres, quatre montrent des différences statistiquement significatives entre les originaux et les traductions, quelle que soit la langue source. Une étude plus qualitative de quatre trigrammes spécifiques de deux de ces catégories conclut, comme c’est le cas pour les études précédentes, que ceci probablement s’explique par le fait que des éléments de la langue source transparaissent dans la traduction, et que les traducteurs ont une tendance (potentiellement universelle) à utiliser un ensemble relativement limité et fixe d’expressions dans leurs traductions.
ES:
Este artículo compara las tendencias fraseológicas en inglés traducido frente a inglés no traducido a partir de secuencias de 3 palabras clasificadas funcionalmente. El estudio se basa en investigaciones previas que comparan trigramas en textos de ficción escritos originalmente en inglés con textos de ficción traducidos al inglés del noruego. La investigación actual agrega traducciones al inglés de dos idiomas adicionales, alemán y sueco, con el objetivo de establecer en qué medida las tendencias observadas para las traducciones al inglés del noruego se extienden a las traducciones al inglés de otros idiomas. Este estudio contribuye así a la discusión de los universales de la traducción y la traducción como un tercer código. A nivel de funciones de trigramas, se ha descubierto que los originales y las traducciones en inglés comparten características funcionales similares en ocho de las catorce categorías identificadas. De las seis restantes, cuatro muestran diferencias estadísticamente significativas entre los originales y las traducciones, independientemente del idioma de origen. Basado en un estudio más cualitativo de los cuatro trigramas específicos de dos de estas categorías, se concluye, en línea con los estudios previos, que las explicaciones más probables son el idioma o idiomas de origen que se hacen visibles y la tendencia (potencialmente universal) de los traductores a utilizar un conjunto de expresiones más pequeño y más fijo en sus traducciones.
-
La traductologie de corpus et la traduction journalistique historique
Mairi McLaughlin
pp. 170–189
AbstractFR:
Cet article est situé au croisement de deux domaines de recherche en traductologie : la traductologie de corpus et la recherche sur la traduction journalistique. Il intègre les acquis de ces deux courants pour développer une approche qui permet d’identifier la présence de la traduction dans un journal historique de langue française, la Gazette de France (1632-1792). À travers une série d’études de cas inspirées par les soi-disant « universaux » de traduction, il teste l’hypothèse commune que le cahier de la Gazette de France qui s’intitule Nouvelles ordinaires se compose de dépêches traduites à partir de gazettes en langues germaniques. En confirmant cette hypothèse, les résultats apportent un appui supplémentaire aux recherches sur l’histoire de la presse et soulignent la valeur herméneutique de l’universel de l’interférence.
EN:
This article is situated at the intersection of two subfields in translation studies: corpus-based translation studies and news translation research. It draws on both of these fields to develop an approach that allows us to identify the presence of translation in an historical French newspaper, the Gazette de France (1632-1792). Through a series of case studies inspired by so-called translation “universals,” it tests the widespread assumption that the section of the newspaper called Nouvelles ordinaires is made up of dispatches translated from gazettes published in Germanic languages. By confirming this hypothesis, the results support research carried out on the history of the press and underscore the hermeneutical value of the universal of interference.
ES:
Este artículo se sitúa en la intersección de dos sub-disciplinas en el campo de la traducción: la traducción basada en corpus y la investigación de la traducción periodística. Parte de ambas de estas sub-disciplinas para desarrollar un método que nos permite identificar la presencia de la traducción en un periódico histórico francés, el Gazette de France (1632-1792). A través de una serie de casos prácticos inspirada por unos supuestos “universales” de la traducción, pone a prueba la suposición generalizada de que una sección del periódico, llamada Nouvelles ordinaires, está compuesta de Comunicaciones traducidas de boletines publicados en lenguas germánicas. Al confirmar dicha hipótesis, los resultados apoyan la investigación de la historia de la prensa y enfatizan el valor hermenéutico del universal de la interferencia.
-
Comparaison d’un texte original et de ses rétrotraductions : que disent les mesures textométriques ?
Olivier Kraif and Pascale Roux
pp. 190–216
AbstractFR:
Cet article présente les premiers résultats de l’analyse d’un corpus littéraire composé de poèmes et d’un essai, ainsi que de leurs 16 rétroversions en français, après traduction dans 8 langues, typologiquement et diachroniquement diversifiées (l’italien, l’allemand, l’arabe, le farsi, le japonais, le coréen, le latin et le grec ancien). Cet ensemble fait l’objet d’une approche interdisciplinaire, interrogeant la rétrotraduction d’un point de vue textométrique et stylistique. À partir d’une évaluation de la distance traductionnelle entre les textes alignés (originaux et rétroversions), fondée sur la longueur, l’indice Dice et la stabilité des lemmes, trois hypothèses principales sont éprouvées : les textes sont-ils davantage transformés lorsqu’ils sont passés par une langue distante du français ? Les poèmes subissent-ils des distorsions plus grandes que l’essai en prose ? Le corpus rétrotraduit peut-il être un outil herméneutique pour l’analyse du texte original ? Pour étudier ces différents aspects dans une perspective de linguistique de corpus outillée et de stylistique française, nous proposons une méthodologie d’alignement multitextuel et de mesures textométriques, s’appuyant sur l’étiquetage et la lemmatisation des unités. L’étude stylistique prend appui sur ces mesures pour aborder ce multitexte riche et complexe. Menée sur un ensemble de taille réduite, l’analyse vise à la mise en place de procédures reproductibles sur d’autres corpus de versions traduites d’un texte dans une même langue.
EN:
This article presents the first results of the analysis of a literary corpus composed of poems and an essay, as well as their 16 retroversions in French, after translation into 8 languages, typologically and diachronically diversified (Italian, German, Arabic, Farsi, Japanese, Korean, Latin and ancient Greek). This corpus has been studied from an interdisciplinary point of view, mixing textometric data and stylistic observations. Starting from an evaluation of the translational distance between the aligned texts (originals and retroversions), based on length, Dice index and lemma stability, three main hypotheses are tested: are the texts more deeply transformed when they have been retro-translated through a language distant from French? Are the poems more distorted than the prose essay? Can the retro-translated corpus yield hermeneutic clues for the analysis of the original text? In order to study these different aspects from a perspective of corpus linguistics and French stylistics, we propose a methodology of multi-textual alignment and textometric measurements, based on tagging and lemmatisation. The stylistic study is based on these measures to address this rich and complex multi-text. Conducted on a small set, the analysis aims at setting up procedures that can be reproduced on other corpora of translated versions of a text in the same language.
ES:
Este artículo presenta los primeros resultados del análisis de un corpus literario compuesto por poemas y un ensayo, así como sus 16 retroversiones en francés, tras su traducción a 8 idiomas, tipológica y diacrónicamente diversificadas (italiano, alemán, árabe, farsi, japonés, coreano, latín y griego antiguo). Este corpus se ha estudiado desde un punto de vista interdisciplinar, mezclando datos textométricos y observaciones estilísticas. A partir de una evaluación de la distancia traslativa entre los textos alineados (originales y retroversiones), basada en la longitud, el índice de Dice y la estabilidad de los lemas, se ponen a prueba tres hipótesis principales: ¿se transforman más profundamente los textos cuando han pasado por una lengua distante del francés? ¿Están los poemas más distorsionados que el ensayo en prosa? ¿Puede el corpus retraducido ser una herramienta hermenéutica para el análisis del texto original? Para estudiar estos diferentes aspectos desde una perspectiva de la lingüística de corpus y de la estilística francesa, proponemos una metodología de alineamiento multitextual y de mediciones textométricas, basada en el etiquetado y la lematización. El estudio estilístico se basa en estas medidas para abordar este rico y complejo multitexto. Realizado sobre un conjunto reducido, el análisis pretende establecer procedimientos que puedan reproducirse en otros corpus de versiones traducidas de un texto en el mismo idioma.
-
Quantitative questions on big data in translation studies
Christopher D. Mellinger
pp. 217–231
AbstractEN:
As corpus-based translation studies continues to expand, researchers have employed data analytic techniques from neighbouring disciplines, such as corpus linguistics, to explore a wider variety of research questions. The field has evolved from early frequency-based approaches to corpus-based translation studies to now include more advanced statistical analyses to understand the complex web of variables encapsulated by the translation process. Big data analytic techniques that originated in data analytics and related quantitative fields could be usefully applied to research questions in translation and interpreting studies. To assess their applicability, this article first outlines what distinguishes big data from general corpora in translation and interpreting studies, identifying how data volume, variety, and velocity are applicable properties to be considered in corpus-based translation and interpreting studies research. Then, the article presents three types of big data analysis techniques, namely crosslingual and multilingual data analysis, sentiment analysis, and visual analysis. These analyses are presented in conjunction with potential research areas that would benefit from these complementary analytical approaches. The article concludes with a discussion of the implications of big data analytics in corpus translation studies, while charting the trajectory of a more quantitative, corpus-based approach to translation studies.
FR:
Au fur et à mesure que les études de traduction basées sur les corpus continuent de se développer, les chercheurs ont utilisé des techniques d’analyse de données de disciplines adjacentes telles que la linguistique des corpus pour explorer davantage de questions de recherche. Le domaine a évolué depuis les premières approches basées sur la fréquence jusqu’aux études de traduction basées sur des corpus pour inclure désormais des analyses statistiques plus avancées qui aident à comprendre le réseau complexe de variables qui composent le processus de traduction. Les techniques d’analyse de données massives dérivées de l’analyse des données et des domaines quantitatifs reliés pourraient être appliquées avec succès pour répondre aux questions de recherche des études de traduction et d’interprétation. Pour évaluer leur applicabilité, cet article décrit d’abord ce qui distingue les données massives des corpus généraux dans les études en traduction et en interprétation, en identifiant comment le volume, la variété et la vitesse des données sont des propriétés applicables à prendre en compte dans les études de traduction et d’interprétation basées sur le corpus. L’article présente ensuite trois types de techniques d’analyse des données massives, à savoir l’analyse des données translinguistiques et multilingues, l’analyse des sentiments et l’analyse visuelle. Ces analyses sont présentées conjointement avec les domaines de recherche potentiels qui pourraient bénéficier de ces approches analytiques complémentaires. L’article se termine par une réflexion sur les implications de l’analyse des données massives pour les études de traduction de corpus, tout en décrivant la trajectoire d’une approche plus quantitative, basée sur le corpus, pour les études de traduction.
ES:
A medida que los estudios de traducción basados en corpus siguen expandiéndose, los investigadores han empleado técnicas de análisis de datos de disciplinas adyacentes como la lingüística de corpus para explorar un mayor número de preguntas de investigación. El campo ha evolucionado desde los primeros enfoques basados en la frecuencia hasta los estudios de traducción basados en corpus para incluir ahora análisis estadísticos más avanzados que permiten comprender la compleja red de variables que integra el proceso de traducción. Las técnicas de análisis de datos masivos que derivaron de la analítica de datos y los campos cuantitativos relacionados podrían aplicarse de forma satisfactoria para dar respuesta a las preguntas de investigación de los estudios de traducción e interpretación. Para evaluar su aplicabilidad, artículo, en primer lugar, esboza la distinción entre los datos masivos y los corpus generales en el contexto de los estudios de traducción e interpretación, centrándose en el volumen, la variedad y la velocidad de los datos como propiedades aplicables a ser consideradas en la investigación de estudios de traducción e interpretación basados en corpus. A continuación, el artículo presenta tres tipos de técnicas de análisis de datos masivos: análisis de datos translingüísticos y multilingües, análisis de sentimientos y análisis visual. Estos análisis se presentan conjuntamente con posibles áreas de investigación que se beneficiarían de estos enfoques analíticos complementarios. El artículo concluye con una reflexión sobre las implicaciones de la analítica de datos masivos para los estudios de traducción de corpus, al mismo tiempo que se perfila la trayectoria de un enfoque más cuantitativo, basado en corpus, para los estudios de traducción.
Documentation
Comptes rendus
-
Egea Pozo, María del Mar y Rodríguez Rodríguez, Francisco, eds. (2019): Insights into audiovisual translation and comic translation. Changing perspectives on films, comics and videogames. Córdoba: Universidad de Córdoba, 213 p.
-
Hartmann, Esa et Hersant, Patrick, dir. (2019) : Au miroir de la traduction. Avant-texte, intratexte, paratexte. Multilinguisme. Paris : Éditions des archives contemporaines, 228 p.
-
Robinson, Douglas (2019) : Transgender, translation, translingual address. Londres/New York : Bloomsbury, 288 p.
-
Pajević, Marko (2019): The Henri Meschonnic Reader: A Poetics of Society. Edinburgh: Edinburgh University Press, 320 p.
-
Caliendo, Giuditta et Oster, Corinne (2020) : Traduire la criminalité : Perspectives traductologiques et discursives. Lille : Presses universitaires du Septentrion, 260 p.
-
Medhat-Lecocq, Héba (2021) : Terminologie comparée et traduction. Approche interdisciplinaire. Paris : Éditions des archives contemporaines, 260 p.
-
Tao, Li and Kaibao, Hu (2021): Reappraising Self and Others: A Corpus-Based Study of Chinese Political Discourse in English Translation. Singapore: Springer, 194 p.