Vous êtes sur la nouvelle plateforme d’Érudit. Bonne visite! Retour à l’ancien site

Dossier

Codex Ultor : Vers des fondations conceptuelles et théoriques pour de nouvelles recherches sur les livres et les environnements documentaires

  • Ray Siemens,
  • Claire Warwick,
  • Richard Cunningham,
  • Teresa Dobson,
  • Alan Galey,
  • Stan Ruecker,
  • Susan Schreibman et
  • L’équipe du projet Implementing New Knowledge Environments (INKE) [1]

…plus d’informations

  • Ray Siemens
    Université de Victoria

  • Claire Warwick
    University College London

  • Richard Cunningham
    Université Acadia

  • Teresa Dobson
    Université de la Colombie-Britannique

  • Alan Galey
    Université de Toronto

  • Stan Ruecker
    Université de l’Alberta

  • Susan Schreibman
    Académie royale d’Irlande

Cet article a été traduit par J.-F. Delannoy et paraîtra sous peu, en version anglaise, dans Digital Studies / Le champ Numérique.

Corps de l’article

Introduction

Ce document présente les bases conceptuelles et théoriques du travail entrepris par le groupe de recherche INKE (Implementing New Knowledge Environments / Mise en oeuvre de nouveaux environnements documentaires), une importante équipe de recherche internationale et interdisciplinaire comprenant plus de 35 chercheurs affiliés à plus de 20 institutions. Nous nous sommes rassemblés pour étudier différents éléments concernant la lecture et les textes numériques et imprimés. L’équipe INKE est composée de chercheurs et de partenaires directement impliqués dans les domaines liés aux études textuelles, à l’ergonomie, à la conception d’interfaces et la gestion de l’information. Notre but est de contribuer à la mise au point de nouveaux environnements d’information/connaissance numérique qui tirent parti des pratiques textuelles antérieures. Nous avons d’ores et déjà établi des fondations pour identifier les caractéristiques des interfaces numériques qui répondent aux attentes et aux besoins d’une large population de lecteurs professionnels, personnels et « naïfs ». Cet article présente le raisonnement qui sous-tend notre recherche, ainsi que ses objectifs.

Nos travaux produisent des prototypes fonctionnels d’interface de lecture susceptibles de transformer notre façon d’aborder les documents numériques que nous lisons à titre personnel et professionnel. Pour ce faire, notre recherche en Études textuelles (ÉT) répond à la nécessité de mieux comprendre quels sont les composants des objets textuels existants qu’il est essentiel d’actualiser dans de nouveaux objets et appareils de lecture numériques; notre recherche portant sur l’ergonomie ou l’expérience de l’utilisateur (EU) étudie les caractéristiques du rapport de l’utilisateur avec les environnements imprimés et numériques; notre recherche sur la conception d’interface (ID) vise à enrichir la lecture continue et les études universitaires impliquant des environnements numériques par l’entremise d’interfaces; et, par des processus itératifs faisant participer tous les groupes, notre recherche sur la gestion de l’information (GI) produit des prototypes d’interfaces numériques de lecture qui favorisent des schémas de lecture active et tirent parti de corpus dynamiquement intégrés.

Objectifs de recherche

Nous observons un changement de paradigme dans la façon dont l’information est produite, diffusée, reçue et conservée. Malgré tous nos efforts depuis l’avènement d’Internet, nous continuons à nous efforcer de savoir mieux concevoir les documents numériques et, pour les véhiculer, des systèmes fonctionnels et souples qui améliorent l’expérience de l’utilisateur et les possibilités de recherche. Bien que la textualité numérique ait fait beaucoup de progrès – la simplification de l’interdépendance hypertextuelle, l’inclusion de contenu multimédia, les stratégies pour imiter l’apparence et les fonctions de l’imprimé et l’intégration poussée de bases de données dans des environnements de recherches et de lecture – nous identifions un besoin immédiat de concevoir de nouveaux environnements documentaires qui peuvent augmenter la complexité des modes permis par le texte numérique tout en essayant d’égaler les niveaux de fonctionnalités et de familiarité offerts par l’imprimé.

Cette problématique fondamentale de recherche a été abordée initialement au travers de consultations financées par une bourse de développement du Programme de réseaux de recherches stratégiques du CRSH. Sous le titre « Mise en oeuvre de la nouvelle machine à connaissances : interaction homme-machine et livre électronique », ces consultations ont réuni des chercheurs et des partenaires directement impliqués dans le domaine, dotés d’une expertise interdisciplinaire dans plus de 90 domaines et sous-domaines allant de la philosophie et des études culturelles à la conception de la communication visuelle et à la robotique. À l’issue de ces consultations, les chercheurs ont conclu que les principales raisons des limitations actuelles des livres et documents électroniques sont dues au fait qu’ils sont encore fondés de manière prédominante sur les formes textuelles de l’imprimé. Les recherches et les développements sur ces documents numériques se sont surtout focalisés sur l’imitation de l’apparence de l’imprimé – une approche fondée sur les modèles critiques et textuels importés de l’imprimé sans bien les comprendre. Hélas, une telle approche ne tire pas suffisamment parti des possibilités techniques de la simulation informatique et ne parvient pas à tirer avantage des possibilités informatiques de l’utilisation du texte dans des environnements de lecture dynamique, dans lesquels le lecteur est capable, par exemple au moyen d’interactions standardisées, de contrôler et de modifier le format et le contenu du texte [2].

Pour profiter de tous les avantages du traitement informatisé de ces objets numériques, nos travaux ont suggéré que la recherche en ce domaine commence par repenser le noyau critique et les modèles textuels des points de vue suivants : [1] l’évolution des technologies de lecture et d’écriture de l’antiquité à l’époque actuelle; [2] la mécanique et la pragmatique associées aux formes écrites de la connaissance; [3] les stratégies de lecture et d’organisation de ces formes; et [4] les possibilités d’informatisation latentes dans les formes écrites et manifestes dans la technologie émergente.

Sur ces bases, notre groupe de recherche s’efforce de comprendre comment mieux combiner les avantages traditionnels de l’imprimé et la flexibilité des environnements de lecture numériques intégrés pour profiter pleinement des possibilités techniques du support électronique. Nous essayons de :

  • documenter les caractéristiques des formes textuelles antérieures en tant que contexte pour la mise en oeuvre des nouveaux environnements documentaires;

  • faire progresser la compréhension de la façon dont la lecture des textes et l’utilisation de l’information sont affectées par leur présentation sous forme numérique multimédia;

  • conceptualiser les nouveaux environnements documentaires, et mettre au point des outils pour produire une structure de données accessibles et flexibles;

  • renforcer le contrôle exercé par l’utilisateur ou les éléments d’ergonomie;

  • mettre en oeuvre de nouvelles métaphores visuelles et intégrer la fonctionnalité de gestion de réseaux sociaux;

  • créer des prototypes d’interfaces dynamiques pour les nouveaux environnements documentaires.

Notre équipe de recherche interdisciplinaire atteindra ces objectifs en utilisant des méthodologies provenant de toutes les disciplines représentées, en faisant intervenir des approches innovantes de la formation à la recherche et de sa diffusion, pour aboutir à la mise à disposition des prototypes d’interfaces et d’environnements numériques de lecture, directement et au travers de nos partenaires.

L’importance du prototypage comme activité de recherche : Le processus de prototypage dans le cadre de nos travaux comporte la réalisation d’un modèle informatique fonctionnel qui concrétise les résultats de notre effort de recherches et, en tant qu’objet d’étude lui-même, est modifié itérativement en fonction de la recherche et des tests. Dans ce cadre, un prototype est une interface ou une visualisation servant à concrétiser les bases théoriques établies par nos travaux, de sorte que la théorie qui inspire la création du prototype puisse elle-même être testée avec des utilisateurs (d’après Rockwell et Sinclair [3]; voir également l’étude de McCarty sur la modélisation dans ce contexte [4]). Les prototypes informatiques comme celui que nous proposons dans le cadre de nos travaux sont distincts des systèmes de production en ceci que le prototype, dans le cadre général du fonctionnement visé, se focalise sur une fonctionnalité pertinente pour la recherche (par exemple la description visuelle d’un système entièrement opérationnel, ou l’aspect visuel du système considéré indépendamment); les systèmes de production doivent être entièrement opérationnels et sont souvent obtenus par un processus faisant intervenir la réalisation de plusieurs prototypes. Un exemple d’un outil prototypique intégralement opérationnel dans un environnement numérique de lecture est une interface expérimentale que nous appelons le Table des contextes dynamique (Dynamic Table of Contexts) (Figure 1) [5], qui se base sur un codage interprétatif du document pour combiner une table des matières (table of contents en anglais) classique avec un incrément interactif. Le lecteur utilise la Table des contextes dynamique comme outil pour parcourir le document en choisissant une entrée dans l’incrément et en la situant dans la table des matières – chaque élément comportant un hyperlien vers l’emplacement correspondant dans le fichier.

Figure 1

La Table des contextes dynamique est une expérimentation combinant la table de matières avec un index interactif créé à partir de code XML interprétatif, indiqué ici sous forme de nuage d’étiquettes.

La Table des contextes dynamique est une expérimentation combinant la table de matières avec un index interactif créé à partir de code XML interprétatif, indiqué ici sous forme de nuage d’étiquettes.

-> Voir la liste des figures

Les prototypes de taille importante que nous prévoyons créer dans notre recherche associent des formes textuelles fondamentales et leurs dérivés qui constituent la plupart des environnements de lecture professionnels et personnels : l’édition savante, dont notamment les Internet Shakespeare Editions (ISE), les Folger Shakespeare Editions et la Bibliothèque du Nouveau Monde (PUM); la monographie universitaire, telle que Du papyrus à l’hypertexte de Christian Vandendorpe); la poésie et la fiction de création, représentée dans les fonds de la Electronic Literature Organization (ELO); et la collection de périodiques académiques et d’essais, comme celle du Public Knowledge Project (PKP; Willinsky) et le Companion to Digital Humanities des éditions Blackwell (dir. Schreibman, Siemens et Unsworth). Ces prototypes comprennent également une large gamme d’autres types de textes : une oeuvre numérisée (initialement créée sous forme imprimée); une oeuvre publiée directement sous forme numérique (créée entièrement sur un support numérique, sans source imprimée); une oeuvre comportant un apparat interprétatif complexe; une oeuvre interactive; une oeuvre très codée; des oeuvres dans d’autres formats de fichier; une oeuvre basée sur la Toile; des oeuvres dans différents genres; des oeuvres en français et en anglais; et une oeuvre dynamique. Tous les projets puiseront des documents (et réciproquement, en apporteront) aux projets existants mis en oeuvre par l’équipe de recherche et nos partenaires de recherche.

Collectivement, notre recherche est axée sur les questions suivantes :

Comment la lecture a-t-elle changé depuis l’avènement de médias numériques, et comment l’histoire des pratiques textuelles peut-elle enrichir l’avenir? Pour répondre à cette question nous devons comprendre « la présence humaine dans tout texte enregistré [6] », en combinant une étude approfondie des objets matériels avec une étude interprétative des activités humaines [7]. Les techniques de la lecture minutieuse et de l’étude rigoureuse des documents qui ont été longtemps appliquées aux imprimés et aux manuscrits doivent être élargies aux objets numériques et aux environnements documentaires en ligne dans toutes leurs formes multimédias [8]. Nous jetterons un pont entre l’étude des textes imprimés et numériques pour mettre au point un vocabulaire technique permettant de décrire les caractéristiques saillantes des textes numériques, le terme « texte » couvrant ici, comme chez McKenzie, « tout texte enregistré » dans toute la gamme multimédia. Ce vocabulaire et son soubassement théorique inspirent les travaux de l’ensemble du projet, et nos activités de prototypage tiennent compte de la transmission matérielle de tous les objets de cette sorte (manuscrit, imprimé et numérique).

Comment notre expérience de l’information a-t-elle changé depuis l’avènement des technologies numériques et d’Internet? Bien que la lecture soit le principal fondement intellectuel et culturel des sociétés alphabétisées et l’activité fondamentale principale des universitaires, nous ne savons guère comment la lecture et la façon dont nous faisons l’expérience de l’information sont modifiées et étendues dans les environnements des nouveaux médias [9]. Au cours de la première moitié des années 90, les spécialistes en sciences humaines se sont grandement intéressés aux possibilités du texte numérique, et ont pensé que l’expérience de la lecture et de l’accès à d’information allaient changer profondément du fait du support numérique et de l’intégration des médias tels que le son, les images fixes et la vidéo [10]. Cependant, ces déclarations prophétiques n’étaient pas fondées sur une recherche systématique auprès des utilisateurs. Même si un certain nombre d’études impliquant des utilisateurs ont été effectuées concernant la conception de l’interface et le génie logiciel, et d’autres auprès de lecteurs de littérature scientifique [11], peu de progrès ont été réalisés dans la compréhension de la façon dont les médias numériques peuvent affecter l’expérience des lecteurs d’objets littéraires ou multimédia, tous deux imprimés et numériques [12].

Figure 2

La visualisation en Sunword visualization permet au lecteur de comparer rapidement les auteurs d'un corpus en fonction de métadonnées disponibles pour chaque auteur.

La visualisation en Sunword visualization permet au lecteur de comparer rapidement les auteurs d'un corpus en fonction de métadonnées disponibles pour chaque auteur.

-> Voir la liste des figures

Quelles nouvelles caractéristiques pouvons-nous concevoir pour améliorer les environnements d’informations numériques et leurs interfaces en fonction de la connaissance que nous avons des besoins de l’utilisateur, des comportements et des contextes culturels? Étant donné les possibilités émergentes des nouveaux médias, il reste à comprendre et mettre au point des méthodes et des modèles permettant de : [1] renforcer le contrôle exercé par le lecteur sur les textes numériques; [2] tester des prototypes qui abordent les questions soulevées par la métaphore de la page imprimée et donnent aux lecteurs et aux chercheurs un meilleur contrôle de leurs activités en :

  • revenant sur la notion des limites de page;

  • concevant des outils visuels expérimentaux liés à la barre de défilement;

  • concevant des moyens avancés de marquage et d’annotation;

  • mettant en oeuvre de nouvelles métaphores numériques issues par exemple de la sculpture ou de la visualisation plutôt que du codex;

  • explorant des possibilités pour l’affichage parallèle et les outils connexes [13];

[3] créer des outils qui fusionnent la culture de lecture avec des prototypes de logiciel social; et [4] concevoir des prototypes qui refondent et présentent de façon originale les genres du document imprimé et examinent certains genres émergents qui sont, dès le départ, sous forme numérique.

Les modèles théoriques de la représentation du contenu textuel sont dans leur phase initiale et ne tiennent pas entièrement compte des dimensions visuelle et logique des textes. Le processus de lecture implique de comprendre non seulement la structure logique du contenu, comme le souligne la Text Encoding Initiative (TEI), mais également l’intégration des indications visuelles fournies par la typographie et la disposition du texte [14]; la disposition du texte peut aider la lecture et la mémoire visuelle, car la capacité d’une personne à rechercher de l’information dépend en partie d’indices spatiaux cohérents d’un acte de la lecture à l’autre [15]. De plus, les rapides progrès en matière de logiciel et de matériel informatique apportent des possibilités inconnues il y a à peine cinq ans dans les environnements complexes dans lesquels nous travaillons : il suffit de mentionner les grands écrans, les microprocesseurs plus rapides, la bande passante accrue et le papier électronique [16] ainsi que les nouveaux modes sensoriels d’interaction [17]. Étant donné les possibilités naissantes offertes par les nouveaux médias, il demeure essentiel de mettre au point des méthodes et des modèles qui repensent les conventions du document imprimé et examinent les genres émergents qui sont numériques dès le départ, tels que la « e-littérature », afin de comprendre comment la culture de la lecture est affectée par l’avènement d’environnements informatiques « sociaux », tels que le célèbre Web 2.0, Facebook et l’environnement de Web sémantique présenté Twine.

Comment pouvons-nous améliorer la conception ou le traitement des données qui sous-tendent et répondent aux besoins des personnes qui utilisent des environnements d’information numérique? Un problème majeur posé par le support électronique est celui de trouver les moyens de permettre au lecteur de documents numériques de stocker, chercher, partager, annoter et faire circuler l’information plus efficacement [18]. Les approches traditionnelles sont dominantes, même pour les ressources de recherche les plus récentes, mais s’avèrent insuffisantes pour plusieurs raisons, notamment : les informations numériques sont instables; leur volume double tous les trois ans [19]; et il y a profusion de formats de données. Il existe de grandes stratégies pour aborder ces questions : le principal défi de la recherche pour les archives ou les corpus volumineux est de fournir des moyens d’organisation et d’accès à un corps de documents en très forte expansion et aux formats hétérogènes; le principal défi de la recherche par rapport aux objets eux-mêmes est de fournir des informations contextuelles à l’intention des producteurs et des consommateurs d’environnements dynamiques de lecture. Notre recherche combine le meilleur de plusieurs stratégies de gestion des connaissances : la vitesse et la puissance du moteur de recherche; des méthodes d’analyse textuelle approfondie utilisées par la communauté académique; des corpus codés uniformément dans des domaines de connaissance donnés; et des résultats détaillés enregistrés par les utilisateurs au moyen de technologies de gestion de réseaux sociaux, c’est-à-dire ce qu’on appelle maintenant les « outils Web 2.0 [20] ».

Un exemple d’un prototype représentant une approche importante (même si elle est d’envergure modeste) d’un aspect de ce travail est fourni par notre projet Sunword (Figure 2), qui affiche des noms d’auteurs disposés en cercle, leur taille et leur emplacement étant déterminés selon des critères fixés par le lecteur. Le but est d’afficher le contenu d’une grande collection en faisant apparaître les différences entre les auteurs, selon des critères simples comme le nombre de titres ou le nombre de mots, ou de critères plus sophistiqués disponibles comme les citations ou le nombre d’exemplaires vendus.

Méthodes de recherche

Notre programme de recherche interdisciplinaire est organisé autour de la convergence de quatre approches corrélées, chacune étant représentée par un groupe focalisé sur ce domaine : Études textuelles, Expérience de l’utilisateur, Conception d’interface et Gestion de l’information. Les activités de recherche de l’ensemble de l’équipe relèvent de plusieurs grands sous-domaines auxquels sont associées diverses méthodologies, comme nous l’expliquons ci-dessous :

Travaux universitaires sur les textes numériques. Pour un universitaire spécialiste des textes, un livre n’est pas un objet inerte légué par un événement historique, mais plutôt une point de convergence de documents physiques, de métaphores, de relations humaines, de préconceptions culturelles et d’interventions de lecteurs. L’érudition textuelle est donc idéalement une synthèse d’approches et de méthodes disciplinaires. Au cours du 20e siècle, l’étude de la transmission matérielle des textes et de l’interaction entre les humains et les textes a subi le mouvement de spécialisation qui a segmenté une grande partie du monde académique, notamment en Amérique du Nord. Vers la fin du 20e siècle, cette tendance avait suscité un certain nombre d’approches possibles, dont beaucoup ne communiquaient pas, voire ignoraient, l’existence des autres. Dans une étude portant sur le nouveau domaine connexe de l’histoire du livre, Leslie Howsam schématise trois grandes divisions disciplinaires : 1) l’histoire, qui se concentre sur « l’action (agency), le pouvoir et l'expérience » par rapport aux livres, à la lecture et à la publication; 2) la littérature, qui voit le texte comme objet d’interprétation, et considère les actualisations matérielles et historiques des textes comme partiellement constitutives de leur signification; et 3) la bibliographie, focalisée sur les livres et les documents en tant qu’objets reflétant les modalités de leur fabrication [21]. Pour expliquer l’évolution de l’étude du livre, on peut aussi l’aborder du point de vue national. La tradition française d’histoire du livre s’est développée à partir de l’École historiographique des Annales vers la moitié du 20e siècle et a imposé un angle d’approche socio-historique à l’étude des livres et des publications, plaçant ces activités dans un large contexte social [22]. L’histoire du livre traditionnelle ne faisait pas assez cas des complexités matérielles des livres eux-mêmes, mais on peut faire le reproche inverse à son homologue anglo-américaine, la New Bibliography. À la suite des travaux d’A.W. Pollard, W.W. Greg et R.B. McKerrow, et plus tard ceux de Fredson Bowers et de G. Thomas Tanselle, la bibliographie anglo-américaine, résolument empirique, a limité l’approche des livres à la description de leur aspect physique, à la reconstruction de leur fabrication et aux hypothèses sur les manuscrits ayant servi à la rédaction de livres imprimés – souvent au service d’une notion idéalisée du travail de l’auteur par rapport au processus d’impression, que la New Bibliography prétendait retracer, au moyen d’une théorie probablement peu rigoureuse (il en existe de nombreux aperçus discutables; on trouvera des descriptions dans Wilson [23] et dans Maguire [24]).

De la division entre ces approches, toutes deux ont pâti. Par exemple, la bibliographie est par nature une discipline très spécialisée qui exige des années de formation et de longues heures de travail méticuleux pour produire une connaissance qui ne s’applique souvent qu’à des contextes très étroits. Bien que cette connaissance puisse radicalement changer notre vision d’un objet culturel (par exemple le premier in-folio de Shakespeare [25]), la bibliographie passe mal auprès des non-spécialistes. En revanche, d’autres domaines comme l’étude des médias et l’histoire intellectuelle proposent des documents très accessibles sur l'histoire de la technologie. Marshall McLuhan, par exemple, a été interviewé par Play-Boy et a fait une apparition dans Annie Hall de Woody Allen. Mais il leur manque un vocabulaire techniquement rigoureux pour décrire leurs documents putatifs; ils traitent un concept comme celui de livre sous forme de boîte noire qui cache sa complexité interne. Dans une critique qui s’appliquerait à McLuhan et à ses disciples tels qu’Elizabeth Eisenstein et Bruno Latour, Adrian Johns a fait valoir que « la vision de l’imprimé chez les spécialistes de l’histoire culturelle s’est trop souvent arrêtée aux portes de l’imprimerie [26] »; réciproquement, Johns note que les bibliographes « ont souvent été trop modestes dans leurs objectifs historiographiques [27] ». Étant donné les enjeux plus élevés que les technologies numériques apportent à l’étude des formes textuelles et la tentation d’un déterminisme facile pour aborder ces enjeux [28], l’étude des nouveaux environnements documentaires doit trouver l’équilibre entre une vision globale et les détails frappants. Le groupe d’études textuelles INKE, dont le travail est décrit ci-dessous, procède selon ce que David Greetham décrit comme « la croyance dans l’interrelation disciplinaire de tous les aspects de l’étude du texte d’un livre [29] », et cherche à synthétiser les meilleurs aspects des approches du passé dans une étude focalisée de l’historicité du manuscrit, de l’imprimé et des textes numériques.

INKE fait de l’érudition une de ses quatre divisions de très haut niveau, et ce, pour plusieurs raisons fondées sur l’idée que le passé est un prologue. Même si les pratiques passées ne déterminent pas nécessairement l’avenir, l’étude des nouvelles technologies textuelles dans un contexte historique peut révéler des configurations d’usage culturel et de signification qui relient les environnements documentaires passés et futurs en un même continuum. Le groupe d’études textuelles est donc très axé sur le récent mouvement de rejet à la fois du déterminisme, des schémas de changement révolutionnaire et de la stricte segmentation de la technologie en périodes (généralement associés aux travaux de Walter Ong, de Marshall McLuhan et d’Elizabeth Eisenstein), et préfère les approches qui examinent les continuités et les discontinuités à long terme, la superposition de technologies anciennes et nouvelles, et la multiplicité d’effets sociaux et culturels qui en résultent [30]. Les études textuelles dotent INKE de nouvelles solutions par rapport aux modèles « successionnistes » périmés de la technologie et de la société, et d’un vocabulaire et d’un ensemble de méthodes pour étudier les détails. Plusieurs vues dominantes sur les nouveaux médias commettent de nouveau, comme McLuhan et Eisenstein, l’erreur de négliger l’examen attentif des documents primaires tels que les livres imprimés et manuscrits aux périodes où ils se généralisent, et ainsi ne donnent souvent pas la place qu’elle mérite à la particularité irréductible, voire inépuisable, des objets créés par l’Homme. En tant que discipline qui relie les processus mécaniques tels que l’industrie du livre aux modes interprétatifs tels que des études littéraires et l’histoire culturelle, l’érudition textuelle est fondamentalement qualitative dans ses méthodes. Cette discipline partage l’orientation idéographique caractéristique des sciences humaines, en produisant de la connaissance à partir de l’étude de cas particuliers, par opposition à la tendance normative de la science à formuler des généralisations à partir de données abondantes mais très régularisées [31]. Cette orientation qualitative et interprétative permet à INKE d’étudier des activités humaines comme la lecture et la production de sens dans des termes méthodologiques non disponibles aux sciences cognitives traditionnelles. En conclusion, selon Greetham, « les universitaires textuels étudient le processus (les étapes historiques de la production, de la communication et de la réception des textes), et non simplement le produit (le texte résultant de cette production, de cette communication et de cette réception) [32] ». Cette attention au processus permet aux études textuelles d’étendre naturellement leurs méthodes aux textes numériques et, avec le souci du contexte, représente un lien méthodologique fondamental entre toutes les composantes d’INKE.

Figure 3

Notre collaboration de recherche. Ce diagramme illustre les quatre sous-groupes de recherche (qui se recouvrent), intégrés à nos partenaires et aux parties intéressées, ainsi que les produits livrables (unidisciplinaires ou multidisciplinaires), y compris les prototypes.

Notre collaboration de recherche. Ce diagramme illustre les quatre sous-groupes de recherche (qui se recouvrent), intégrés à nos partenaires et aux parties intéressées, ainsi que les produits livrables (unidisciplinaires ou multidisciplinaires), y compris les prototypes.

-> Voir la liste des figures

Pour comprendre comment la textualité numérique affectera des pratiques de lecture, le groupe ST recensera les caractéristiques essentielles des formes textuelles historiques et des pratiques humaines correspondantes. La recension « du meilleur du passé », pour ainsi dire, fournira le vocabulaire essentiel et le cadre théorique permettant de mettre en oeuvre de nouveaux environnements documentaires et c'est cette combinaison qui assurera une meilleure compréhension des changements de forme des documents humains. Le domaine émergent de l’érudition textuelle numérique s’efforce d’imiter le modèle de D.F. McKenzie visant à comprendre « la présence humaine dans tout texte enregistré [33] ». À la suite de McKenzie, nos objets d’étude abordent des objets tels que rouleaux, journaux, transcriptions des récits oraux, photographies, magazines à faible tirage, manuscrits de poèmes et de pièces de théâtre, littérature électronique, jeux vidéo, versions multiples de films et documents d’archives non publiés. Dans un champ d’une telle ampleur, le groupe s’intéresse à toutes sortes d’objets humains, numériques comme analogiques: [1] l’intérêt de l’histoiredes livres pour les livres en tant que médiateurs primaires des relations humaines [34] et pour le livre comme texte à échelle humaine; [2] la focalisation de la bibliographie sur la relation complexe entre les textes (aspect langage) et les livres (aspect objet physique) [35] ; et [3] l’intérêt de la théorie littéraire pour les complexités de forme, de contenu et de matérialité [36].

Le groupe ST reliera également l’étude des environnements imprimés et celle des environnements numériques pour définir un vocabulaire technique permettant de décrire les caractéristiques saillantes des objets électroniques, en se fondant sur la recherche archivistique portant sur l’histoire de la conception de livres, de l’impression et de la bibliographie. Cette phase abordera également la focalisation sur le multimédia inhérente à l’érudition textuelle numérique [37] en associant les méthodes bibliographiques traditionnelles aux nouvelles formes de récit numérique, telles que la littérature électronique et les jeux vidéo. Le vocabulaire technique résultant sera utilisé dans les activités de prototypage des autres groupes qui tiendront compte de la communication matérielle (sous forme imprimée et électronique) des textes. C’est cette phase de travail qui produira les premières publications du groupe.

Pour décrire la complexité de nos formes textuelles actuelles, le groupe ST compilera également une base de connaissance de dispositifstextuels (mise en oeuvre en ligne au moyen d’un logiciel disponible gratuitement) illustrant les dispositifs, les technologies et les pratiques cognitives de communication sous forme textuelle. Cette base contiendra un ensemble complet d’éléments fac-similés d’exemples de polices de caractères, de typographie en colonnes, de notes marginales, de tables, de diagrammes, de « volvelles » (éléments mobiles dans les livres [38]), d’incréments, d’images, de pages de titre et de mécanismes de contrôle des erreurs – autant d’éléments d’architecture d’information pré-numérique des livres que nos applications numériques doivent reconfigurer. Cette connaissance sera recueillie par la consultation d’archives, l’utilisation de sources bibliographiques et la communication avec des partenaires.

Évaluation de l’expérience de l’utilisateur. La recherche sur l’expérience de l’utilisateur vise à comprendre comment les gens utilisent des ressources et systèmes d’information, que l’information elle-même soit sous forme analogique (par exemple imprimée) ou sous forme numérique. Il est important de comprendre les utilisateurs de ressources numériques, leurs besoins, ce qu’ils ont plaisir à faire et la place dans leurs vies de l’utilisation de l’information sous forme imprimée et sous forme numérique – faute de quoi le public visé risquerait fort de rejeter les ressources créées [39]. Par exemple, près d’un tiers de l’ensemble des ressources numériques accessibles publiquement dans les disciplines des sciences humaines reste inutilisé [40]. Pourtant, nous savons que les universitaires utilisent les technologies qui correspondent bien à leur activité [41], particulièrement si elles leur permettent d’économiser du temps ou des efforts [42]. On peut donc penser que les ressources d’information doivent être mieux conçues pour être adaptées aux besoins et aux comportements de leur population d’utilisateurs.

En discutant de la façon dont les lecteurs abordent les espaces hypermédias, Dobson et Willinsky [43] mentionnent trois vastes études de la recherche dans ce domaine qui indiquent des résultats contradictoires : [1] les travaux de 1999 à 2005 sont examinés par Salmerón, Cañas, Kintsch et Fajardo [44]; [2] les travaux de 1990 à 1999 sont examinés par Dillon et Gabbard [45] et Unz et Hesse [46]. Sur ces études, Dobson et Willinsky notent qu’il est clairement « difficile de synthétiser cette littérature à cause de la profusion de variables [47] ». Par exemple, les types de ressources numériques utilisées dans diverses études diffèrent considérablement en termes de structure d’hyperliens, de présence ou absence d’indices anticipés d’organisation, d’indices sur la direction des liens, de niveau d’intégration d’éléments multimédia, etc. De même, les groupes de participants varient considérablement en termes d’expérience des médias numériques, d’expertise du domaine, de style d’apprentissage et de préférences. De plus, les tâches assignées à ces participants vont « de la simple remémoration aux tâches analytiques complexes telles que la rédaction d’un essai [48] », et l’approche méthodologie varie elle aussi, des méthodes extensives visant à aboutir à des conclusions générales sur la population considérée aux méthodes intensives destinées à éclairer les comportements et les préférences dans une configuration donnée.

L’approche à adopter pour observer l’utilisateur dans le cadre du projet INKE a donc présenté un défi. Les études d’utilisateurs ont été l’apanage du domaine de l’interaction homme-machine (IHM : en anglais HCI : Human-Computer Interaction); cette approche domine à plusieurs égards; cependant, comme le précise Cairns, l’IHM semble s’inscrire dans un paradigme de test de signification d’hypothèse nulle (Null Hypothesis Significance Testing : NHST) et en fait, « le niveau des rapports statistiques et de l’analyse est faible. » Une grande majorité des publications comportent des problèmes substantiels; il faut donc approcher leur contribution à la connaissance en les mettant fortement en question [49] ». Cairns pense que le domaine de l’IHM n’est pas le seul dans ce cas : « On sait bien en psychologie et en sciences sociales que le test de signification est mal compris des étudiants, des professeurs et des chercheurs [50] ». Vu, entre autres, la variété de méthodologies possibles et les problèmes des diverses approches, INKE a choisi de se concentrer sur l'approche dite de l’utilisation en contexte, très utilisée en bibliothéconomie et en sciences de l’information, notamment dans les travaux portant sur les utilisateurs des sciences humaines. Ce type de recherche souligne l’importance des espaces de lecture authentiques, tels que les bibliothèques, les bureaux et le domicile, plutôt que les laboratoires. Il souligne également le rôle joué par les émotions et affects irrationnels des utilisateurs et des documents avec lesquels ils interagissent [51]. Nous avons choisi cette approche, car, au bout du compte, nos décisions sur la façon dont nous utilisons l’information, la sélection de documents et ce que nous choisissons d’en lire, la façon dont nous le lisons et l’endroit de lecture ne sont pas toujours guidés par des processus cognitifs rationnels mais aussi par ce que nous ressentons, par ce que nous aimons et n’aimons pas au sujet de l’information, par les contextes effectifs où nous nous trouvons, qu’ils soient physiques ou numériques. L’approche d’INKE vise à saisir ce genre d’information, et à appréhender avec justesse les habitudes de lecture des usagers, en utilisant les méthodes ethnologiques décrites ci-dessous. Cette recherche doit donc produire des prototypes mieux adaptés à la vie quotidienne et à la pratique professionnelle des lecteurs.

Dans le domaine des études de l’information, il existe de nombreux travaux sur les besoins d’information et les pratiques de recherche de l’information des universitaires en sciences humaines [52]. Le travail pionnier de Stone a montré que l’assortiment et les types de documents dont ont besoin les utilisateurs des sciences humaines est beaucoup plus large que pour d’autres profils universitaires. Ils ont besoin de sources primaires telles que livres imprimés, manuscrits, images, enregistrements sonores et de nombreux types de documents historiques. Ils ont besoin également de sources secondaires telles que monographies et journaux. Chronologiquement, ces documents peuvent couvrir plusieurs siècles pour les sources primaires et, pour les textes secondaires classiques, plusieurs décennies, ce qui n’est pas le cas dans de nombreux autres domaines comme les matières scientifiques, qui tendent à se focaliser sur la recherche récente [53]. Bates [54] a également effectué une série d’études sur la manière dont les chercheurs en sciences humaines trouvent et utilisent des informations; ces études ont eu beaucoup d’influence parce qu’elles ont montré que les utilisateurs des sciences humaines créent souvent de la connaissance par la réinterprétation et la synthèse d’information existante, plutôt que par la création de données nouvelles. Ils ont également une très vaste connaissance de leur domaine mais peuvent choisir d’utiliser sélectivement les références, au moyen de citations directes de travaux directement pertinents pour ce qu’ils cherchent à montrer plutôt qu’en fournissant de longues listes d’auteurs du domaine. Ces préférences se traduisent dans les standards les plus courants de citation bibliographique tels que MLA (sciences humaines) et APA (sciences « dures » et sciences sociales). Ellis a également prouvé que pour trouver de nouvelles informations, les spécialistes des sciences humaines ont tendance à suivre les notes de bas de page et les références (enchaînement) plutôt que d’effectuer des recherches par mots-clé. Par conséquent, le genre d’environnement documentaire nécessaire aux spécialistes des sciences humaines devrait différer de celui conçu, par exemple, pour les scientifiques – et pourtant, comme l’indiquent Palmer et Neumann [55], ceci est rarement pris en compte dans la conception des interfaces. Les recherches d’INKE auprès des utilisateurs visent donc à savoir quels sont les environnements numériques adaptés à ces besoins.

Le groupe EU examinera les processus complexes qui sont à l’oeuvre dans l’étude des documents dans les environnements imprimés et numériques, et plus précisément les formes que nous étudions en priorité, dont : l’édition savante; la monographie scolaire, le journal savant et le recueil d’essais; et la littérature électronique. Nous situerons les exigences quant aux prototypes réalisés par notre groupe CI, puis nous les testerons. Nous effectuerons des études sur des personnes qui travaillent sur des objets des sciences humaines dans différents contextes et avec différents buts, dont l’étude. Ces objets peuvent utiliser un seul mode de représentation (par exemple un langage alphabétique) ou plusieurs (par exemple : alphabet, représentation iconique, son, image); ils peuvent être de structure simple ou complexe; et ils peuvent contenir des notes marginales, des annotations et d’autres formes de texte lié. Chacune de ces variables peut modifier la réponse cognitive et affective, comme le montrent des études empiriques de l’utilisateur dans des environnements numériques [56]; les lecteurs peuvent également adopter différentes positions physiques et attitudes mentales selon les propriétés formelles du texte et de l’objet de lecture [57].

Nous utiliserons donc une approche d’utilisation en contexte, et nous étudierons le contexte plus vaste de l’expérience de l’utilisateur plutôt que les tâches prises séparément [58]. C’est une forme d’ethnométhodologie [59] qui cherche à étudier dans leur complexité les façons dont les gens utilisent et attachent du sens aux objets des sciences humaines dans le cadre de leurs pratiques habituelles de recherche et de lecture, et comment ils transmettent cette interprétation. Les utilisateurs participants seront choisis parmi des groupes ayant une haute probabilité d’utiliser les principales formes textuelles abordées dans notre étude (indiquées ci-dessus) à titre de partenaires et de parties intéressées (écoles et universités). Nous travaillerons avec eux dans leur cadre normal (par exemple bureau ou bibliothèque plutôt que laboratoire) pour observer comment ils se servent de divers objets imprimés et numériques. Nos méthodes s’inspirent d’une approche holistique de l’expérience de l’utilisateur [60] soulignant l’importance de l’étude des aspects affectifs et émotifs du comportement ainsi que ceux basés sur la prise de décision cognitive rationnelle. Selon cette approche, l’utilisation des environnements d’information numériques est influencée autant par le plaisir d’utilisation que par les aspects pratiques. Par exemple, les spécialistes des sciences humaines sont influencés par leurs impressions par rapport aux environnements physiques [61], et réagissent fortement sur le plan émotionnel aux différents espaces de l’information, physiques comme numériques [62].

Les études feront intervenir des observations, des entretiens, des commentaires à haute voix, des analyses de journaux et carnets d’utilisateur (logs). Pour l’étude des carnets, nous demandons aux utilisateurs de prendre des notes détaillées de leur travail pendant un certain temps. Les carnets sont analysés pour repérer les schémas d’activité, les zones de problèmes et la façon dont les participants font la transition entre lecture de documents physiques et lecture de documents numériques [63]. Ceci est essentiel, car les praticiens des sciences humaines possèdent des compétences sophistiquées de manipulation de l’information et des modèles mentaux riches des environnements d’information physiques, mais ils peuvent éprouver des difficultés à les appliquer dans le monde numérique [64]. Les entretiens semi-structurés nous permettent de clarifier comment les gens utilisent les environnements d’information physiques et numériques et de déterminer les besoins, les préférences et l’expérience antérieure éventuelle de ces environnements. Par exemple, certains chercheurs en sciences humaines sont des utilisateurs enthousiastes d’information sous forme numérique [65] mais préfèrent les ressources informationnelles génériques telles que des pages Web de bibliothèques et de fonds d’archives, ou les collections de référence en ligne [66] au genre d’objet numérique comparable à un livre universitaire [67].

Pendant les observations, un chercheur s’assied à côté d’un participant dans son environnement normal et l’observe pendant qu’il utilise un document imprimé ou une ressource numérique. Le chercheur demande au participant de faire des commentaires sur ce qu’il fait, et pourquoi. De telles méthodes explorent également tous les problèmes que les utilisateurs peuvent rencontrer par rapport à l’environnement numérique, ou tout ce qui peut les décourager de les utiliser, par exemple : nom peu clair, interface difficile à utiliser, ou nécessité de télécharger des données [68]. Nous enregistrerons des interactions avec les systèmes informatiques à l’aide de logiciels tels que Camtasia et Morae, et nous utilisons des appareils photo numériques non intrusifs et des enregistreurs sonores pour enregistrer le comportement de l’utilisateur.

Pour les données de transcriptions d’entretiens et de réponses écrites, on utilisera systématiquement un logiciel d’analyse qualitative des données tel que NVivo. On identifiera et on codera les traits pour faire apparaître des configurations des données, selon une approche appelée « phénoménologie assistée par moyens numériques » (numerically aided phenomenology [69]). Les données vidéo seront examinées à l’aide du système d’analyse vidéo de Morae. Cette combinaison d’approches ethno-méthodologiques sera complétée par des résultats d’étude d’activité et par l’analyse quantitative des détails des sessions utilisateurs tels que les temps de lecture, les cheminements et le comptage des clics. Notre but est de comprendre et décrire de façon détaillée le rapport des utilisateurs des sciences humaines aux documents imprimés et numériques et la façon dont ces documents pourraient être mieux conçus pour répondre à leurs besoins. Nous réaliserons ces études en collaboration avec les partenaires de recherche spécifiques mentionnés ci-dessous, et d’autres.

Prototypage d’interfaces. Il existe plusieurs approches de la réalisation de prototypes, en partie indépendantes de l’étude ultérieure des prototypes (voir ci-dessus la partie Évaluation de l’expérience de l’utilisateur). Une approche traditionnelle consiste à situer un point faible d’une interface existante et de suggérer une amélioration. Cette méthode a l’avantage de fournir une base pour comparer les fonctionnalités d’un système et de sa nouvelle version expérimentale. On peut coupler cette approche avec la modélisation de l’utilisateur en fonction de ses buts [70], où le concepteur associe les fonctionnalités aux buts, puis teste la capacité du système à favoriser l’atteinte des buts. L’inconvénient d’une approche axée sur les buts est qu’elle peut aboutir à des conceptions inutilement restrictives. Il est simple, en théorie, de situer les buts, mais on ne peut y réduire tout le comportement humain [71].

Une autre stratégie procède par interactions itératives avec des utilisateurs potentiels du système, en utilisant l’approche centrée sur l’utilisateur ou des méthodes de conception participatives [72]. Cette approche permet au chercheur d’incorporer des éléments d’ergonomie qui n’existent pas encore sous format numérique, et d’apporter des correctifs par la discussion et l'observation plutôt que selon la séquence « interrogation des utilisateurs », « production d’un prototype » et « test ». L’inconvénient de cette stratégie est qu’il n’y a pas toujours de point de comparaison pour les nouveaux éléments d’ergonomie : il faut des méthodes spécifiques pour les étudier isolément. On risque aussi de perdre du temps à créer des fonctionnalités inutiles en dehors du contexte des utilisateurs impliqués dans l’étude.

Une variante déjà utilisée de la conception centrée sur l’utilisateur consiste à produire un jeu de personnages et de scénarios [73] qu’on peut utiliser dans les discussions pour mieux diriger le travail de l’équipe et communiquer les orientations aux autres parties intéressées. Ces personnages et ces scénarios peuvent être créés de toutes pièces par l’équipe de concepteurs ou fusionner ce qui a été recueilli par d’autres méthodes sociologiques comme les questionnaires ou les entretiens. Les inconvénients de la conception axée sur utilisateur se font sentir en particulier si les utilisateurs tiennent lieu de concepteurs.

Une autre approche a été popularisée par Gaver et al.  [74] : elle crée et met en oeuvre des « sondes culturelles » sous forme de prototypes robustes introduits dans l’environnement vécu de participants choisis. Ces prototypes sont souvent des créations très imaginatives, telles que le « tissu de mémoire » et le « suiveur d’avions ». En incorporant l’objet conçu dans leur vie quotidienne pendant plusieurs semaines ou plusieurs mois, les participants peuvent donner des indications sur son utilisation réelle, ainsi que des éléments d’ergonomie découverts par hasard, sans avoir été précédemment considérés par les concepteurs. Une approche connexe est celle désignée sous le nom de « conception affective [75] » ou « conception émotive [76] », où le chercheur essaie non seulement d’aider les activités intellectuelles de l’utilisateur mais aussi de favoriser la dimension affective. On trouve un exemple de cette approche dans les travaux d’Adrian Cheok, dont le laboratoire Mixed Reality, à Singapour, a produit plusieurs innovations destinées à soutenir les interactions avec des animaux domestiques, avec l’environnement naturel et entre petits-enfants et grands-parents [77].

Le point commun de toutes ces méthodes est la possibilité de comprendre par la pratique. Si un prototype est plus qu’un ensemble de fonctionnalités et peut être vu comme la concrétisation d’une théorie, la fabrication et la mise à l’essai d’un prototype représente une forme de théorisation explicitement liée à la logistique de la mise à disposition d’éléments d’ergonomie à d’autres personnes dans l’environnement virtuel. Pour le projet INKE, nous proposons d’appliquer toutes ces stratégies, entre autres, pour la conception de prototypes.

Figure 4

Le diagramme en glyphe du Magic Circle compare l’usage de certains mots chez différents auteurs d’une collection. Au choix du lecteur, les valeurs peuvent être affichées et réparties en fonction de métadonnées de la collection telles que la date de parution, l'éditeur ou un autre critère.

Le diagramme en glyphe du Magic Circle compare l’usage de certains mots chez différents auteurs d’une collection. Au choix du lecteur, les valeurs peuvent être affichées et réparties en fonction de métadonnées de la collection telles que la date de parution, l'éditeur ou un autre critère.

-> Voir la liste des figures

Les chercheurs du groupe Conception d’interfaces (CI) mettront au point une série d’interfaces innovantes pour permettre aux lecteurs de travailler avec les objets numériques. Nous nous intéressons surtout aux plates-formes Internet, en partageant avec les groupes EU et ST des recherches sur d’autres dispositifs tels que le papier électronique, les appareils portatifs et les écrans tactiles installés sur un mur ou sur un bureau, qui affectent le processus de lecture ou de visionnement. Comme ces technologies évoluent rapidement, nous n’avons pas lié nos plans de prototypage à de nouveaux appareils en particulier. (Par exemple, il y a cinq ans l’utilisation d’un iPod pour regarder des films aurait été aussi inconcevable que l’impact des systèmes de jeu à capacités textuelle programmables et connectables à Internet, ou l’initiative des ordinateurs portables à 100 $ [78] ou l’omniprésence d’appareils comme le Blackberry [79].)

Pour mettre au point des interfaces de prototype, nous suivrons un cycle de recherches qui commence par leur construction à partir de conseils des collègues des groupes EU et ST. Le groupe CI créera des croquis qui seront soumis à un examen itératif par les participants de recherche. Ces croquis proviendront en partie des discussions avec les autres groupes, et en partie de nos travaux sur la consultation d’Internet et la visualisation dans les sciences humaines. (Nous distinguons la visualisation dans les sciences humaines de la visualisation scientifique, qui porte surtout sur des données numériques, car pour nous il s’agit de texte et d’images en tant qu’éléments visuels susceptibles d’un mode d’affichage innovant.) Les membres du groupe CI ont déjà réalisé plus d’une douzaine de prototypes interactifs [80], parmi lesquels des systèmes qui :

  • assurent un affichage dynamique de textes de théâtre à l’usage des acteurs, des metteurs en scène et des étudiants (Watching the Script);

  • facilitent la navigation graphique fine dans des fonds textuels codés et de documents isolés (Mandala Browser);

  • fournissent une rétroaction visuelle aux chercheurs en sciences humaines au cours d’une fouille de données (Oil and Water Browser[81];

  • affichent en parallèle des textes à lire (The Versioning Machine).

Notre méthode éprouvée de conception fait participer directement les utilisateurs : ils sont consultés à chaque étape du processus. Les approches vont de la conception axée sur l’utilisateur par la pratique, où les lecteurs sont consultés à différentes étapes du processus (mais les informations tirées de leurs réponses sont manipulées par les concepteurs et les programmeurs avant que les lecteurs soient consultés de nouveau) à la conception participative, au cours de laquelle les participants de recherche deviennent des collaborateurs actifs dans l’évolution de la définition du prototype et sont présents lors des processus de décisions de conception et de programmation.

Nous mettrons au point et testerons une série de schémas d’interfaces et de petits prototypes à partir desquels nous réaliserons un environnement de travail en donnant aux utilisateurs l’accès aux données du banc d’essai. Nos objets de banc d’essai appartiendront aux quatre groupes mentionnés ci-dessus : l’édition savante, la monographie universitaire, la collection de périodiques universitaires et d’essais, et des formes de littérature électronique. Un exemple simple de prototype permettant de parcourir des collections de chacun des quatre groupes est notre graphique Magic Circle (Figure 4, ci-dessus), qui combine les métadonnées de collection (informations sur la collection) avec les détails de plus bas niveau sur le vocabulaire caractéristique, au moyen de listes basées sur de simples fréquences de mots ou sur des mesures plus sophistiquées comme le rapport logarithmique de probabilité (Log Likelihood Ratio) de Dunning. Ces travaux bénéficient beaucoup de l’implication des partenaires de recherche en première ligne.

Gestion de l’information. Notre objectif ici est d’offrir aux utilisateurs des moyens d’organiser et d’accéder à la masse croissante de documents numériques de format hétérogène, de façon optimale. Une des contributions les plus significatives de nos travaux auprès de tous les groupes sera de créer des prototypes d’environnements d’information permettant d’intégrer et de référencer une série d’objets connexes, en tenant compte de leur format et de leur type (par exemple texte, son ou images). Pour cela, nous créerons les bases informationnelles de quatre prototypes d’environnements numériques de lecture dans les domaines du banc d’essai de l’équipe. Un important travail initial consistera à créer des collections de documents qui serviront de contenu contextuel de base pour la lecture et le visionnement dynamiques, en étudiant et en mettant en oeuvre des technologies de corpus nécessaires pour construire les corpus primaires et secondaires concernant nos environnements de lecture, en anglais et français, au travers de nos partenariats de recherches. Nous automatiserons également le processus de recueil et de stockage d’informations pour qu’elles puissent être facilement reliées et récupérées (par l’intermédiaire de méta-données).

Figure 5

Exemple de classification thématique [82]

Exemple de classification thématique82

-> Voir la liste des figures

Dans l’environnement dynamique de lecture centré sur le document que nous allons prototyper, une problématique de recherche importante est la fourniture d’informations contextuelles précises au lecteur au bon moment, pour améliorer sans l’interrompre l’activité de lecture. Notre recherche essaie de combiner les meilleurs éléments de plusieurs stratégies de gestion des connaissances : la vitesse et la puissance du moteur de recherche sur Internet; les capacités d’analyse textuelle en profondeur (comme celles explorées par TAPoR [83]); des ensembles de connaissance codés de façon uniforme couvrant des domaines de recherche donnés (comme ceux fournis par la TEI, Early English Books Online, Creation Partnership [84], le Réseau canadien de documentation pour la recherche [RCDR] et Proquest); et des résultats détaillés enregistrés par l’utilisateur fournis par des technologies collaboratives de gestion de réseaux sociaux. Cette recherche exigera la mise au point et l’adaptation de systèmes qui [1] facilitent la navigation et l’interaction dynamique avec un texte et les documents primaires et secondaires concernés, [2] permettent la mise à jour dynamique des documents primaires et secondaires et [3] fournissent des outils d’interaction entre lecteurs, tout en s’appuyant fortement sur les corpus servant de base de lecture. Nous adapterons et créerons des outils de traitement et d’analyse pour naviguer dans des corpus volumineux, en intégrant les outils de TAPoR et des outils de gestion de réseaux sociaux (mentionnés ci-dessus, par exemple Sinclair [85]), ainsi que des outils au service de différents processus de lecture. Nous appliquerons également des techniques d’exploitation des données (regroupement [clustering] de textes, catégorisation automatique basée sur des algorithmes d’apprentissage machine, extraction d’entités, etc.) aux environnements de lecture numériques. Nous étudierons comment les techniques de fouille de données (data mining) utilisées pour chercher et rassembler des données [1] peuvent faciliter la lecture de documents numériques à l’aide de cartes thématiques comme dans l’exemple de Sunword ci-dessus et dans la Figure 5, et [2] peuvent être adaptés à la lecture de documents numériques [86].

Des corpus seront hébergés dans plusieurs systèmes de gestion de connaissances tels que Fedora, et nous ferons en sorte que les documents puissent être utilisés dans différents systèmes d’information sans être liés à un corpus donné (nous profiterons pour ceci de partenariats avec, notamment, ebrary, Transliteracies et KARL). Cet aspect de nos travaux s’appuiera aussi sur le travail des partenaires indirectement affiliées, comme NINES (Networked Infrastructure for Nineteenth-century Electronic Scholarship : infrastructure en réseau pour l’érudition électronique sur le 19e siècle), le projet Aquifer de la Digital Library Foundation, Many Eyes d’IBM, MONK (Metadata Offer New Knowledge) et SEASR (Software Environment for the Advancement of Scholarly Research).

Conclusion

Cet article a présenté la motivation et les bases théoriques et conceptuelles du groupe de recherche INKE. Grâce à la subvention de recherches du CRSH « Mise en oeuvre de la nouvelle machine à connaissances : interaction homme-machine et livre électronique » (2005/6), notre programme de recherche contribue à la mise au point essentielle de nouveaux environnements documentaires numériques qui tirent parti des pratiques du passé et innovent en fonction de notre connaissance des lecteurs et des utilisateurs dans les environnements documentaires modernes. Notre équipe comporte des chercheurs et partenaires de premier plan dans les domaines des Études textuelles, de l’Expérience de l’utilisateur, de la Conception d’interfaces et de la Gestion de l’information et a déjà posé les fondations pour identifier les caractéristiques d’interfaces textuelles numériques répondant aux attentes et aux besoins d’une vaste communauté de lecteurs professionnels et non professionnels. Notre groupe, nécessairement interdisciplinaire et international, et fondé au sein des sciences humaines et des sciences sociales, a déjà créé des réseaux pertinents qui intègrent des partenaires de recherche et des parties intéressées. Nos travaux produisent des prototypes fonctionnels d’interfaces de lecture susceptibles de transformer notre rapport aux documents numériques que nous lisons à titre personnel et professionnel. Notre recherche en Études textuelles répond au besoin de mieux comprendre quels sont les composants des objets textuels existants dont la présence est essentielle dans les nouveaux objets et dispositifs de lecture numériques; notre recherche en Expérience de l’utilisateur situe les caractéristiques du rapport de l’utilisateur d’environnements imprimés et numériques; notre recherche en Conception d’interface vise à enrichir la lecture continue et l’érudition faisant intervenir des environnements numériques dans l’interface; et, par des processus itératifs faisant participer tous les groupes, notre recherche en Gestion de l’information permet la construction de prototypes d’interfaces de lecture numériques qui favorisent la lecture active et s’appuient sur des collections de documents richement intégrées.

Parties annexes