Abstracts
Résumé
L'exposé a trait à l'analyse de textes disponibles sur support lisible par ordinateur. Il est centré sur la présentation d'un analyseur expérimental dont l'objectif est d'obtenir d'un texte une indexation thématique par des moyens automatiques.
L'analyseur exploite des bases de données extraites de dictionnaires généraux de langue (monolingues, comme LDOCE, Longman Dictionary of Contemporary English, ou bilingues, comme Le Robert & Collins, dictionnaire français - anglais/english - french dictionary).
L'indexation recherchée est obtenue par une double technique de contraste: contraste d'une part entre le profil thématique du texte à analyser, évalué par consultation des dictionnaires, et un profil thématique plus neutre évalué dans les mêmes conditions sur un texte ou corpus de textes choisi comme référence; contraste d'autre part entre le vocabulaire du texte et celui des dictionnaires consultés.
Il est fait état d'une large expérience où le corpus anglais LOB (Lancaster-Oslo/Bergen) a servi à la fois d'objet d'analyse et de corpus de référence.
L'indépendance des techniques utilisées vis-à-vis de la langue analysée est soulignée, ce qui rend leur application possible à la langue française.
Download the article in PDF to read it.
Download