Abstracts
Résumé
Stratégie pour la détection semi-automatique des néologismes de presse – Les auteurs présentent l'Observatori de Neologia de Barcelona (OBNEB). L'un des objectifs de l'organisme est la détection de la néologie formelle dans la presse écrite. L'article expose les concepts de base qui sont en rapport avec la néologie. Puis il décrit les méthodes de travail de l'OBNEB. Ensuite, les caractéristiques du corpus sont détaillées. Ce corpus est riche de sept millions d'occurrences provenant du dépouillement de textes journalistiques. Les premiers essais d'extraction semi-automatique des néologismes ont été menés à partir de ces données. Enfin, les auteurs expliquent le fonctionnement du logiciel qui est utilisé pour repérer et pour traiter les néologismes. Ce logiciel a été mis au point à l'Institut universitari de lingüística aplicada de la Universitat Pompeu Fabra. D'autres informations sur les travaux des auteurs peuvent être consultées à l'adresse suivante : « http://www.iula.upf.es ».
Abstract
A Strategy for the Semi-Automatic Detection of Press Neologisms – The Observatori de Neologia de Barcelona (OBNEB) was created in order to automatize the detection of formal neologisms found in the press. In this article the basic concepts related to neology are introduced together with the process carried out at the OBNEB. The features of the Corpus of the University of Barcelona are presented in detail. Composed of seven millions of occurrences taken from press texts, this corpus was used to test a programme for the semi-automatic extraction of neologisms. Finally, the authors show how the programme developed at the Institut de Lingüística Aplicada manages to fulfill this task. Further information about the authors and their work can be found in "http.V/www.iula.upf.cs".
Download the article in PDF to read it.
Download