Introduction

Les chiffres et les lettres peuvent-ils se marier ? 15 ans de recherches au LADT[Notice]

  • Sylvia Kasparian

…plus d’informations

  • Sylvia Kasparian
    Université de Moncton

Le projet de ce numéro thématique de la Revue de l’Université de Moncton a germé à l’occasion du 50e anniversaire de l’Université de Moncton, et sa parution coïncide avec le 15e anniversaire de la fondation du Laboratoire d’analyse de données textuelles de l’Université de Moncton (LADT). L’objectif de ce numéro est de proposer une rétrospective des recherches dans le domaine de l’analyse de données textuelles menées dans le cadre du Laboratoire de façon à mettre en valeur la variété et la richesse de ces travaux. Depuis sa création en septembre 1999, ce laboratoire de pointe est dirigé par Sylvia Kasparian avec l’aide, au fil des ans, des professeurs James de Finney et Gisèle Chevalier, ainsi que de plusieurs assistants et techniciens de recherche, dont Louise Caissie, Chantal Richard, Philippe Desjardins et Raymond Blanchard. Le LADT est niché à la Faculté des arts et des sciences sociales (FASS) de l’Université de Moncton, au Département d’études françaises depuis ses débuts. Mis sur pied par deux professeurs du Département d’études françaises, Sylvia Kasparian (linguiste) et James De Finney (littéraire), le Laboratoire est le fruit de plusieurs collaborations avec des statisticiens, informaticiens, linguistes et littéraires d’Europe. Ceux-ci appartiennent au mouvement de la statistique textuelle amorcé par Charles Muller et transformé par l’apport de l’Analyse Factorielle de Correspondance (analyse statistique avancée) développée par le célèbre mathématicien-statisticien Benzécri et ses élèves, Lebart, Salem et Reinert. C’est autour de ces chercheurs, qui ont développé le domaine de la textométrie ou logométrie, que s’est construit le Réseau européen d’analyse statistique de données textuelles, dans lequel s’inscrit le LADT. Interdisciplinaire, ce réseau fait appel à la collaboration de mathématiciens, statisticiens, linguistes, psychologues, sociologues, littéraires, économistes, médecins, artistes et autres chercheurs. C’est également ce réseau qui organise tous les deux ans les Journées d’analyse de données textuelles (JADT), un lieu d’échanges entre théoriciens et utilisateurs des outils d’ADT. Des logiciels adaptés à chaque domaine sont développés par le réseau, et le Laboratoire d’analyse de données textuelles collabore avec leurs concepteurs dans le cadre de divers projets. Plusieurs chercheurs européens affiliés au réseau ont donné des conférences et des stages de formation dans le cadre des activités du Laboratoire, entre autres, Étienne Brunet, Damon Mayaffre (Université de Nice), Claude Condé et Max Silberztein (Université de Franche-Comté), Jean Moscarola (Université de Savoie), William Martinez (CNRS, Paris), Pascal Marchand (Université de Toulouse) et Adolfo Morrone (ISTAT, Rome). Le Laboratoire de recherche en analyse de données textuelles se veut un espace interdisciplinaire, dynamique et ouvert où se côtoient des disciplines aussi diverses que la sociologie, les sciences politiques, l’histoire, la linguistique, la littérature, l’éducation, la musique, l’informatique et la statistique. L’intérêt commun des collaborateurs du LADT a toujours été l’analyse des textes de tout genre, à la recherche de significations et de sens invisibles à l’oeil nu. Les logiciels dont le laboratoire s’est équipé permettent, telle la loupe de Sherlock Holmes, de grossir certains traits, de faire ressortir un élément ou une structure dans des masses de données qui peuvent paraître insignifiantes au premier abord. Ils permettent ainsi de cartographier un texte, de rendre saillant l’organisation thématique des textes, les « mondes lexicaux » qui les composent, les représentations véhiculées par rapport à une thématique particulière, etc. Enquêtes, textes littéraires, politiques, philosophiques, publicitaires, articles de journaux, entretiens de type sociologique ou psychologique, idéogrammes chinois, textes codifiés, partitions de musique, etc., tout genre de « texte » est exploitable par ces logiciels, notamment les gros volumes de textes. Le mot texte est donc pris plutôt dans le sens de texte informatique pouvant contenir des caractères, des symboles qui représentent des mots (dans …

Parties annexes