Abstracts
Résumé
La présente contribution fait état d’un projet de recherche dont l’objectif principal est de conceptualiser la relation chef (une relation de hiérarchie s’établissant à l’intérieur d’un groupe ou d’une organisation) du point de vue de la sémantique lexicale. Le deuxième objectif de ce travail est de définir un lexique trilingue (structuré par domaine) identifiant cette relation. Pour proposer une description complète de la relation chef, nous avons étudié d’un point de vue contrastif des données extraites de corpus monolingues et multilingues (parallèles et comparables) en français, en anglais et en allemand. Les noms propres de ces corpus ont été étiquetés, lemmatisés et annotés. Des patrons lexico-syntaxiques permettant une extraction automatique des expressions linguistiques de la relation chef ont été définis dans les trois langues.
Mots-clés :
- noms propres,
- sémantique lexicale,
- relation de hiérarchie,
- corpus,
- annotation
Abstract
This paper presents a research paper from the lexical semantics domain. The project aims to provide a complete conceptual description of the relation chief (establishing a hierarchy inside a group of humans or an organization). The second goal of the project is to define a trilingual lexicon, structured by domains, identifying this relation. For our purpose, we study linguistic data from monolingual and multilingual, parallel and comparable corpora, available in English, in French and in German. The corpora have been tagged, lemmatized and annotated for proper names. A multilingual base of lexico-syntactic patterns has been defined to automatically extract chief relation.
Keywords:
- proper names,
- lexical semantics,
- hierarchy relation,
- corpora,
- annotation
Appendices
Bibliographie
- Baker, Collin, Fillmore, Charles J., et al. (2003) : The Structure of the Framenet Database. International Journal of Lexicography. (16)3 : 281-296.
- Cruse, Alan D. (1986) : Lexical Semantics. Cambridge : Cambridge University Press.
- Fellbaum, Christiane (1998) : WordNet : An Electronic Lexical Database. Princeton : MIT Press.
- Fillmore, Charles J. (1968) : Lexical entries for verbs. Dordrecht : D. Reidel.
- Fillmore, Charles J. (1985) : Frames and the semantics of understanding. Quaderni di Semantica. (6)2 : 222-254.
- Friburger Nathalie et Maurel Denis (2004) : Finite-state transducer cascade to extract named entities in texts. Theoretical Computer Science. 313 : 94-104.
- Fritzinger, Fabienne, Kisselew, Max, et al. (2009) : Werkzeuge zur Extraktion von signifikantenWortpaaren als Web Service. In : Wolfgang Hoeppner, Angela Klutsch, Marc Lechtenfeld et Nino Simunic (dir.) Symposium « Sprachtechnologie und eHumanities ». (GSCL Symposium Sprachtechnologie und eHumanities, 26-27 Februar 2009, Universität Duisburg-Essen) Duisburg : Bteilung für Informatik und Angewandte Kognitionswissenschaft Fakultät für Ingenieurwissenschaften Universität Duisburg-Essen, 32-43. Consulté le 30 juillet 2011, http://duepublico.uni-duisburg-essen.de/go/technische-berichte/2009/01
- Gross, Gaston (2011) : Classification sémantique de collectifs humains. Cahiers de lexicologie. 98(1) : 65-81.
- Gross, Gaston (1995) : À propos de la notion d’humain. In : Jacques Labelle et Christian Leclère (dir.) Lexiques-Grammaires comparés en français : actes du colloque international de Montréal. (1er colloque international, 3-5 juin 1992, Montréal), 71-80.
- Ide, Nancy et Veronis, Jean (1994) : MULTEXT : Multilingual Tools and Corpora. Proceedings of COLING 1994 - The 15th International Conference on Computational Linguistics (15th International Conference on Computational Linguistics [COLING 1994], August 5-9, 1994, Kyoto) Vol. 1, 588-592. Consulté le 14 mars 2014, http://anthology.aclweb.org//C/C94/C94-1097.pdf
- Kraif, Olivier (2000) : Extraction automatique de correspondances lexicales : évaluation d’indices et d’algorithmes, Actes de TALN 2000, 16-18 octobre 2000, Lausanne, p. 225-236.
- Lyons, John, Cambridge University Press, Oct. 27, 1977.
- Mel’Čuk, Igor (dir.) (1984) : Dictionnaire explicatif et combinatoire du français contemporain, vol. I. Montréal : Les Presses de l’Université de Montréal.
- Mel’Čuk, Igor (dir.) (1988) : Dictionnaire explicatif et combinatoire du français contemporain, vol. II. Montréal : Les Presses de l’Université de Montréal.
- Mel’Čuk, Igor (dir.) (1992) : Dictionnaire explicatif et combinatoire du français contemporain, vol. III. Montréal : Les Presses de l’Université de Montréal.
- Mel’Čuk, Igor (dir.) (1999) : Dictionnaire explicatif et combinatoire du français contemporain, vol. IV. Montréal : Les Presses de l’Université de Montréal.
- Mel’Čuk, Igor, Clas, A., et al. (1995) : Introduction à la lexicologie explicative et combinatoire. Louvain-la-Neuve : Duculot.
- Miller, George (1995) : WordNet : A Lexical Database for English. Communications of the ACM, vol. 38, n° 11 : p. 39-41.
- Paumier, Sébastien (2000) : Nouvelles méthodes pour la recherche d’expressions dans de grands corpus. In Anne Dister (dir.) Actes des troisièmes journées Intex (13-14 juin 2000, Université de Liège). Revue, Informatique et Statistiques dans les sciences humaines. 36(1-4) : 289-295. Consulté le 14 mars 2014, http://promethee.philo.ulg.ac.be/RISSHpdf/annee2000/Articles/SPaumier.pdf
- Ruppenhofer, Josef, Ellsworth, Michael, et al. (2010) : FrameNet II : Extended Theory and Practice. Berkeley. Consulté le 14 mars 2014, http://framenet2.icsi.berkeley.edu/docs/r1.5/book.pdf.
- Steinberger, Ralf, Pouliquen, Bruno, et al. (2006). The JRC-Acquis : A multilingual aligned parallel corpus with 20+languages, Proceedings of LREC’2006, Italy.
- Steinberger, Ralf, Eisele, Andreas, et al. (2012) : DGT-TM : A freely available Translation Memory in 22 languages. In Nicoletta Calzolari, Khalid Choukri et al. (dir.) Proceedings of the Eight International Conference on Language Resources and Evaluation. (LREC’12, 21-27 May 2012, Istanbul). European Language Resources Association. Consulté le 14 mars 2014, http://arxiv.org/pdf/1309.5226.pdf
- Tran, Mickaël et Maurel, Denis (2006) : Prolexbase - Un dictionnaire relationnel multilingue de noms propres. Traitement automatique des langues (TAL). 47(3) : 115-139.
- Vossen, Piek (dir.) (1998) : EuroWordNet – A Multilingual Database with Lexical Semantic Networks. Dordrecht : Kluwer Academic Publishers.