Abstracts
Résumé
Les récents efforts visant à favoriser la diffusion et la circulation de l’information en format numérique ont contribué au phénomène de l’infobésité (information overload). Il est désormais important de concevoir des outils de recherche d’information plus adaptés aux besoins des utilisateurs afin de leur permettre de récupérer les documents pertinents répondant à leurs besoins informationnels. Dans cet article, nous ferons état, dans un premier temps, de certaines observations sur les conséquences découlant des limites des outils traditionnels en recherche d’information numérique. Dans un deuxième temps, nous exposerons les concepts et les techniques de base du domaine de la fouille de textes, en insistant sur les opérations de classification et de catégorisation automatiques. Finalement, nous montrerons comment certaines techniques de fouille de textes peuvent contribuer au développement d’une nouvelle génération d’outils de recherche d’information.
Abstract
The recent efforts to increase the dissemination and circulation of information in numeric format have led to a phenomenon known as information overload. It is now imperative to develop retrieval tools that are better adapted to the users' needs and that will enable them to retrieve relevant documents that meet their information needs. In this article, we will begin with a summary of observations of the consequences of the limits of the traditional tools used in numeric information retrieval. Following this, we will describe the concepts and techniques of textual searching, emphasizing automatic classification. Lastly, we will demonstrate how certain textual searching techniques contribute to the development of a new generation of information retrieval tools.
Resumen
Los recientes esfuerzos tendientes a favorecer la difusión y la circulación de la información en formato digital han contribuido al fenómeno de la infobesidad (sobrecarga de información). Es importante, de aquí en adelante, diseñar herramientas de búsqueda de información que se adapten mejor a las necesidades de los usuarios a fin de facilitarles la recuperación de documentos pertinentes que respondan a sus necesidades informacionales. En este artículo, realizaremos, en un primer momento, ciertas observaciones sobre las consecuencias que derivan de los límites de las herramientas tradicionales para la búsqueda de información digital. En un segundo momento, expondremos los conceptos y las técnicas de base del dominio del registro de textos, insistiendo sobre las operaciones de clasificación y de categorización automáticas. Finalmente, mostraremos cómo determinadas técnicas de registro de textos pueden contribuir al desarrollo de una nueva generación de herramientas de búsqueda de información.