Corps de l’article

Introduction

L’indexation par sujet connaît une longue tradition en bibliothéconomie. La pratique archivistique a quant à elle privilégié, d’une part, le créateur (la provenance) pour la classification, et d’autre part, les noms propres pour l’indexation. Pourtant, les archivistes ont aussi à créer des accès sujet, essentiellement avec des noms communs. De nos jours, on constate des pratiques professionnelles différentes quant à l’indexation par sujet dans les bibliothèques et les services d’archives. Dans le but de présenter la spécificité de l’indexation par sujet en archivistique, nous considérons les ressemblances et les différences relatives à l’objet de l’indexation, aux principes organisationnels et aux techniques de description propres à chacune des deux disciplines, à partir d’une revue de la littérature. Il s’agit notamment de savoir si les archivistes peuvent reprendre tels quels les lignes directrices ou les outils d’aide à l’indexation produits dans une perspective documentaire.

Après la définition des concepts principaux de notre sujet, nous identifions les ressemblances et les différences de l’indexation par sujet en bibliothéconomie et en archivistique. Nous analysons des normes qui peuvent baliser le travail de l’indexeur, afin d’évaluer si elles peuvent aiguiller un archiviste dans le cadre de son travail. La question du vocabulaire, centrale pour l’indexation, est abordée transversalement dans les dernières sections.

Définitions et précisions

Les définitions qui suivent sont des définitions fonctionnelles qui sont fournies au lecteur afin de s’entendre sur les notions principales de cet article.

Les disciplines : bibliothéconomie et archivistique

Nous envisageons l’indexation par sujet dans la perspective des deux disciplines que sont la bibliothéconomie et l’archivistique. La bibliothéconomie est la discipline qui définit les opérations d’une bibliothèque (gestion, organisation, etc.). L’archivistique est la discipline qui a pour objet les documents d’archives, de leur création à leur destruction ou conservation permanente (évaluation, acquisition, classification, description, préservation, diffusion).

Les documents d’archives, le fonds d’archives

Nous entendons documents d’archives au sens suivant : documents produits ou reçus automatiquement et organiquement par un créateur (personne physique, morale ou famille) dans le cadre de ses activités ou fonctions, et que l’on conserve pour leur valeur de témoignage ou d’information générale[1]. Nous précisons que nous employons le mot documents d’archives au sens d’« archives définitives », parfois appelées « historiques ». Nous ne traitons pas ici d’archives courantes ni intermédiaires. Les archives sont généralement regroupées en fonds d’archives. Le fonds d’archives est l’accumulation naturelle et organique des documents d’un créateur, organisée en fonction des activités et des fonctions de celui-ci.

L’indexation

L’indexation consiste à représenter le contenu d’un document par des expressions linguistiques. Mais dans quel but indexe-t-on ? « L’indexation est une activité intellectuelle qui a un but pratique, retrouver rapidement de l’information. » (Weinberg 2009, 2287, notre traduction) ; « Indexer, c’est l’acte de pointer vers. » (Jacob & Shaw 1998, 156, notre traduction) Par l’association de localisateurs aux expressions linguistiques, l’index peut permettre de retrouver l’évocation d’un concept dans un ensemble documentaire, que ce soit un document dans une collection ou une section particulière dans un document. La section de cet article intitulée « L’indexation, processus et activité » détaille les étapes de l’indexation en tant que processus et en tant qu’activité.

L’index

L’indexation a pour produit l’index. Un index est un relevé systématique des concepts pertinents pour la recherche en fonction des usagers du milieu où se pratique l’indexation. Les concepts prennent une forme à laquelle on associe un ou plusieurs localisateurs. Un localisateur est un indice de localisation tel que la page ou la cote, ou bien un renvoi voir vers une entrée qui présente, elle, un localisateur. En bref, l’index contient la liste des termes d’indexation et leur localisation. C’est le résultat du rapprochement entre des notions issues des documents examinés (concepts) et des expressions linguistiques permettant la recherche ultérieure de ces notions (termes d’indexation). Étant donné que l’indexation a recours à des mots et des expressions linguistiques pour construire les termes d’indexation, nous considérons qu’elle repose fondamentalement sur des principes linguistiques (Amar 2000).

Il existe plusieurs types d’index. La norme NF ISO 999:1996, Principes directeurs pour l’élaboration, la structure et la présentation des index, décrit cinq types d’index courants : 1) index des sujets ; 2) des auteurs ; 3) des noms et des noms géographiques ; 4) des titres de documents et ; 5) de numéros et de codes (comme le numéro de brevet, l’ISBN et les dates de création ou de publication) (Organisation internationale de normalisation 1996). Il sera question ici des index des sujets ou index thématiques.

L’indexation par sujet

L’indexation par sujet — ou indexation thématique — est la représentation, par des termes d’indexation, des sujets présents dans les documents et décomposés en concepts. En général, l’indexation porte sur tous les types de notions présents dans les documents indexés, tandis que l’indexation thématique ne s’occupe que des sujets, et des sujets pertinents par rapport à la mission du centre d’archives et des intérêts de ses usagers (Bureau canadien des archivistes (BCA). Groupe de travail sur l’indexation par sujet 1992, 135-136). De manière schématique, un sujet est ce dont parle un document ; par exemple, un livre sur les chiens a comme sujet les chiens. Un fonds d’archives, par exemple le Fonds Wilfrid-Pelletier, porte sur la personne de Wilfrid Pelletier en traitant de sa vie, de ses activités, de ses réalisations et de ses relations. Le journal intime d’une jeune fille est non seulement d’elle — elle en est l’auteure et la créatrice — mais ce document apporte également des informations sur elle — elle en est donc également le sujet. La frontière entre créateur et sujet n’est pas toujours évidente en archivistique (BCA 1992, 50). Les ouvrages autobiographiques portent également ce risque d’ambiguïté entre créateur et sujet, mais ce risque est beaucoup plus présent dans une collection de documents d’archives que dans une collection de bibliothèque. En effet, dans la collection d’un service d’archives, les documents sont rassemblés justement en fonction de leur capacité à témoigner de leur créateur et à parler de lui. Ils disent donc nécessairement quelque chose du créateur.

L’indexation par sujet en archivistique

En 1992, le BCA présente, dans un rapport spécialement rédigé sur l’indexation thématique des archives, trois principes qui distinguent l’indexation par sujet des archives de l’indexation par sujet en bibliothéconomie : le respect des fonds (l’unité de traitement), les niveaux de classement (la hiérarchie) et le principe du général au particulier (1992, 29). Dans la section de cet article intitulée « L’indexation des documents d’archives », nous tentons de montrer comment ces principes et d’autres entrent en jeu dans l’indexation des archives, et nous essayons de savoir s’ils la distinguent de l’indexation pratiquée dans les bibliothèques.

« À trop vouloir se distinguer des bibliothèques et des techniques bibliothéconomiques, les archivistes ont jeté le bébé avec l’eau du bain et ont négligé sans raison valable l’accès sujet. » (Pugh 1982, 42, notre traduction) Or, les demandes d’archives se font principalement par accès sujet (Pugh 1982, 40 ; Gagnon-Arguin 1998, 92 ; Lévesque 2002, 36). Les recherches s’effectuent maintenant souvent en dehors des bâtiments des institutions, par des outils en ligne (Duff 2002, 334). Quand ils sont devant un ordinateur ou un appareil électronique du même type, les usagers se comportent de manière similaire, quelle que soit l’institution à laquelle ils envoient leur requête ; ils sont googlisés (Yu-Young 2004). Avec l’avènement du Web sémantique, qui repose sur des métadonnées notamment thématiques (pour ne pas dire principalement thématiques), nous pensons que la quête par sujet des usagers ne réduira pas.

Les archivistes ont privilégié le créateur pour délimiter les fonds d’archives ainsi que les activités et fonctions afin de constituer les niveaux hiérarchiques décrivant au mieux le contexte de création. C’est le contexte de création qui donne toute sa signification aux archives (Cardin 2001, 118). En bibliothéconomie, un ouvrage s’insère dans une classification thématique et est indexé par sujet. Il peut également être muni d’un index thématique en fin de volume. En archivistique, le seul accès par sujet est l’index qui porte sur des ensembles de documents tels que la collection d’un service d’archives ou un fonds d’archives. C’est pour cela que l’indexation sujet revêt une telle importance en archivistique : elle favorise indéniablement l’accès.

L’indexation, processus et activité

Qu’est-ce que l’indexation ? Nous avons présenté une définition générale dans la section précédente. Nous allons maintenant examiner en détail en quoi elle consiste. Pour ce faire, nous l’abordons sous deux angles très différents, à savoir l’aspect cognitif et l’aspect pratique. À partir de la vision d’ensemble que nous tirons d’une revue de la littérature, nous identifions une étape préliminaire lors de laquelle la différence d’objet documentaire en bibliothéconomie et en archivistique joue un rôle.

Sur le plan cognitif : étapes du processus

L’indexation étant un processus fondamentalement linguistique (Amar 2000) et le langage prenant sa source dans les rouages de notre esprit (Aitchison 2003), il nous est apparu nécessaire d’envisager l’indexation d’un point de vue cognitif. Les sciences cognitives étudient les opérations mentales et les processus qui englobent celles-ci (Bonin 2007). Les idées et concepts prennent peu à peu la forme d’expressions linguistiques. Nous ne débattrons pas duquel des deux, du langage ou de la pensée, est premier, mais nous considérons que le langage et la pensée concourent conjointement à la communicabilité des idées sous la forme de mots.

Le processus d’indexation comporte deux étapes principales (Figure 1) : l’analyse des documents afin d’identifier les concepts qu’il comprend, et la représentation de ces concepts en termes d’indexation. Les concepts sont issus de l’analyse pratiquée sur les documents à indexer (identification et sélection des concepts) et les termes d’indexation sont choisis pour représenter ces concepts au mieux par la personne qui indexe. Ce dernier choix s’effectue en fonction de plusieurs paramètres tels que l’unité de traitement, l’institution et ses habitudes de fréquentation, les sujets fréquemment recherchés ou le vocabulaire employé par les usagers dans leurs requêtes (Couture 2005, 330 ; voir BCA 1992, 58 pour l’identification d’autres facteurs).

Figure 1

Le processus d’indexation

Le processus d’indexation

-> Voir la liste des figures

Bertrand-Gastaldy, Giroux, Lanteigne et David, dans l’article « Les produits et processus cognitifs de l’indexation humaine », ont mené une étude sur l’indexation du point de vue cognitif. Ils décrivent l’indexation ainsi : « L’opération d’indexation comporte deux étapes : la première consiste à extraire le “contenu” d’un document ; la seconde à le représenter par une série de mots-clés qui serviront de portes d’accès lors d’un repérage subséquent. » (1994, 31) Ces deux étapes — analyse et représentation — constituent le coeur du processus de l’indexation et sont fréquemment identifiées par les auteurs s’intéressant à l’indexation comme processus.

Pour Langridge (1989), l’analyse des sujets et la traduction en langage documentaire sont deux sous-processus de l’indexation. L’auteur a mené une étude en milieu professionnel sur l’analyse du sujet pour l’indexation documentaire.

Lancaster, dont le manuel sur l’indexation et le résumé a formé nombre d’indexeurs, de la première édition en 1991 à la troisième en 2003, indique que, malgré l’absence de consensus terminologique pour décrire l’indexation, il faut s’assurer de « distinguer l’étape de l’analyse conceptuelle de celle de la traduction dans l’indexation » (Lancaster 2003, 21, notre traduction).

Selon Champagne et Chouinard, pour procéder à l’indexation, « il s’agit de déterminer l’information qui doit être retenue, puis de choisir les termes ou les expressions qui vont l’exprimer » (1987, 118).

Dans le cadre d’une comparaison de l’indexation pratiquée dans ces deux disciplines que sont l’archivistique et la bibliothéconomie, nous nous demandons si le processus est différent selon que l’indexeur est archiviste ou bibliothécaire. Champagne et Chouinard poursuivent leur définition de l’indexation en précisant : « Un tel processus s’applique à toute démarche d’indexation, qu’elle soit le fait d’un documentaliste, d’un bibliothécaire ou d’un archiviste. » (1987, 118) Ainsi, nous retiendrons que le processus d’indexation se découpe en deux opérations principales — l’analyse et la représentation — et que cette opération mentale serait similaire quelle que soit la profession de la personne qui indexe.

Sur le plan pratique : étapes de l’activité

Envisageons le côté pratique de l’indexation. Pour cela, nous avons consulté des normes internationales et nationales, puisqu’elles sont créées pour encadrer le travail concret des indexeurs et qu’elles décrivent un modèle vers lequel tendre. Nous avons également consulté les articles de chercheurs qui ont mené des recherches empiriques sur l’indexation en milieu professionnel, afin d’avoir une meilleure idée du déroulement concret de l’activité d’indexation.

La norme BS 6529:1984, de par son titre seulement, identifie trois phases dans le processus d’indexation : Recommandations relatives à l’étude des documents, la définition de leur contenu et le choix des termes d’indexation (British Standards Institution 1984). Malgré des dates d’édition non chronologiques, le préambule de cette norme indique qu’elle est elle-même basée (elle n’y est toutefois pas équivalente) sur la norme ISO 5963:1985, Documentation — Méthodes pour l’analyse des documents, la détermination de leur contenu et la sélection des termes d’indexation (Organisation internationale de normalisation 1985). Cette dernière norme formule différemment les intitulés des trois phases. « L’étude des documents » (BS 6529:1984) constitue le premier contact entre l’indexeur et le document en vue de son indexation. Il s’agit, pour la norme ISO 5963:1985, de la première des trois étapes de l’indexation : « l’examen du document », aussi appelée « familiarisation » par Rowley (1988). Pour Hovi (1989), il s’agit d’un « survol attentif du document » (notre traduction). Finalement, la norme NF Z 47-102:1993 — l’équivalent national français de la norme ISO 5963:1985, avec « modifications rédactionnelles » — détaille trois « phases de la reconnaissance des concepts » dont la première est l’« appréhension du contenu total du document ». Cette étape préliminaire est celle dont fait l’objet la section suivante.

Une étape préliminaire à l’indexation : la lecture

Plusieurs recherches empiriques ont permis d’approfondir les différentes étapes que suit l’indexeur lors du processus d’indexation. Hormis l’identification des concepts principaux et la représentation de ces concepts dans un langage à vocation documentaire, étapes que nous avons déjà vues dans la section portant sur l’aspect cognitif de l’indexation, la littérature pointe une étape préliminaire. Ainsi, pour procéder à l’analyse des documents à indexer, il faut au préalable « lire » les documents, c’est-à-dire en prendre connaissance et comprendre les informations envisagées. La « lecture » n’est pas une étape anodine. Pour Farrow (1991), la lecture d’un texte s’effectue non pas pour acquérir des connaissances, mais pour réaliser une tâche. Pour Endres-Niggemeyer (1998, 109), il s’agit non pas de lire distraitement ou de parcourir un texte, mais d’y rechercher les éléments pertinents à la réalisation d’une tâche.

La lecture du document inclut non seulement un contact physique, visuel, sonore ou autre, entre l’indexeur et le document, mais aussi la compréhension au moins partielle du contenu véhiculé par celui-ci. C’est pourquoi Hovi parle dans un premier temps de « survol attentif du document », mais aussi, dans un second temps, de l’« établissement de la signification » (Hovi 1989, cité par Endres-Niggemeyer 1998, 102).

Il existe plusieurs types de lecture, dont par exemple l’appréhension visuelle d’un document, la lecture en diagonale, la lecture partielle à des endroits clés du document, la lecture du document entier, la lecture orientée vers une tâche. Dans la vie de tous les jours, nous expérimentons également plusieurs manières de lire. Par exemple, nous ne lisons pas de la même manière le journal du dimanche matin avec un bon café qu’une recette de cuisine dans le but de suivre précisément les instructions énoncées. Pour Endres-Niggemeyer (1998, 36), la lecture des documents est une lecture orientée vers la tâche (task-oriented reading) et diffère donc si la personne indexe, résume ou classifie le document lu.

Quand un bibliothécaire ou un archiviste lit pour indexer, il commence déjà l’identification des concepts, leur sélection et leur représentation. C’est dans ce sens que la norme ISO 5963:1985 indique que les trois étapes — lecture, analyse et représentation — « ont tendance à se chevaucher dans la pratique » (ISO 1985, 2). La lecture est une étape incontournable de l’indexation. Pourtant, pour nous, elle reste une étape préliminaire et ne fait pas partie du coeur de l’indexation. Elle appartient à d’autres processus tels que le résumé, comme l’a clairement montré Endres-Niggemeyer (1998). Ainsi, pour nous, du point de vue cognitif, l’indexation est identique en bibliothéconomie et en archivistique.

Le Tableau 1 propose une vision d’ensemble de l’indexation en tant que processus ou activité, selon les auteurs cités. Les diverses étapes y sont rattachées aux auteurs qui les ont mentionnées.

Tableau 1

Le découpage de l’indexation

Le découpage de l’indexation

-> Voir la liste des tableaux

Dans le Tableau 1, les éléments qui, selon nous, constituent de manière stricte l’indexation sont ceux qui sont liés aux deux étapes de l’indexation identifiées dans la définition : l’analyse et la représentation.

Dans cette vision d’ensemble que favorise la lecture du Tableau 1, nous pouvons constater que l’étape de la lecture est tout autant décrite que les étapes d’analyse et de représentation. Mentionnons que Langridge (1989) parle également de la construction d’une entrée d’index. Après la représentation, il est vrai que les termes d’indexation doivent être mis en forme et ordonnés en une présentation optimale pour l’usager et dans le souci de la plus grande accessibilité. Une norme s’y consacre entièrement : la norme BS 3700:1988, intitulée Recommandations pour la préparation des indexes [sic] des livres, périodiques et d’autres documents (British Standards Institution 1988). La norme internationale ISO 999:1996 Information et documentation — Principes directeurs pour l’élaboration, la structure et la présentation des index inclut deux sections sur la présentation des index. La section 8 s’intitule « Classement des entrées à l’intérieur de l’index » et la section 9 a pour titre « Présentation des index imprimés » (Organisation internationale de normalisation 1996, 29-32 ; 33-37).

Une lecture différente selon le support

Nous avons vu une définition de l’indexation et les différentes étapes qui permettent de réaliser l’indexation. L’indexation s’effectue sur des documents. Ceux-ci constituent la matière première de l’indexation (Figure 1). La lecture a été présentée à titre d’étape préliminaire qui consiste en la prise de connaissance des documents, qui existent sur toutes sortes de supports. Les images traditionnelles des services d’archives et de bibliothèques représentent souvent les documents comme un royaume de papier. Pourtant, si nous consultons les catalogues de Bibliothèque et Archives nationales du Québec (BAnQ), nous pouvons remarquer qu’on nous propose des documents sur une grande diversité de supports, tant pour les archives que pour la bibliothèque.

Les collections d’archives ne comprennent pas que des documents papier et des photographies développées sur papier contenus dans des chemises épaisses. Elles contiennent des documents de divers types et accessibles sur toutes sortes de supports, comme le montre la répartition des divers chapitres des Règles de description des documents d’archives (RDDA) élaborées par le Bureau canadien des archives (2008) : documents textuels, iconographiques, cartographiques, dessins d’architectures et dessins techniques, images en mouvement, enregistrements sonores, documents informatiques, microformes, objets et documents philatéliques.

Examinons deux notices de fonds d’archives conservés par BAnQ (Annexes 1 et 2) : sept types de documents dans le Fonds Lionel-Groulx (cote CLG1), qui couvre principalement une période d’une quarantaine d’années ; neuf types de documents pour le Fonds Wilfrid-Pelletier (cote MSS20), qui couvre presque 70 ans et qui contient trois objets assez insolites : deux éventails et une baguette de direction ! Du côté des bibliothèques, nous constatons également une grande diversité de types de documents à BAnQ et ce, dès la recherche simple dans le catalogue Iris (Figure 2), tels que livres, films, musique, etc. Mais la recherche avancée offre 20 types de documents (Figure 3) tels que livres sonores, cartes postales, programmes de spectacle, etc.

Figure 2

Recherche simple — Catalogue Iris de BAnQ

Recherche simple — Catalogue Iris de BAnQ

-> Voir la liste des figures

Figure 3

Recherche avancée — Catalogue Iris de BAnQ

Recherche avancée — Catalogue Iris de BAnQ

-> Voir la liste des figures

Pour rendre compte de cette diversité des supports, les Français ont même inventé le terme de médiathèque ainsi que d’autres néologismes tels que bédéthèque, cédéthèque et ludothèque[2], qui dénotent des bibliothèques spécialisées dans un type de support.

Les organismes de normalisation ont intégré cette diversité à leurs directives. La norme NF ISO 999:1996, Information et documentation — Principes directeurs pour l’élaboration, la structure et la présentation des index, s’applique non seulement aux livres et aux documents écrits en tous genres, mais aussi aux « non-livres […] tels que les documents électroniques, les films, les enregistrements sonores, les enregistrements vidéo, les documents iconographiques, les cartes et les objets à trois dimensions » (Organisation internationale de normalisation 1996, 1). Par contre, la norme NF Z 47-102:1993, Information et documentation — Principes généraux pour l’indexation des documents, indique que « [l]a démarche d’appréhension du document est différente dans le cas d’un document audiovisuel, visuel, sonore, ou d’un objet à trois dimensions (une pièce de musée, une pièce archéologique, etc.) ». Concrètement, la phase de « lecture » du document physique — comme nous l’avons nommée dans la section précédente — n’est pas la même. Ainsi, nous avons besoin d’un instrument de lecture pour lire les documents médiatisés. Aussi, l’appréhension des objets tridimensionnels est un autre exemple : le traitement de l’information comportera alors généralement une phase incluant la visualisation de l’objet avant le traitement de l’information qui s’en dégage (Bonin 2007, 45). L’appréhension d’une photographie ne sera pas non plus la même si elle est sur l’écran d’une tablette électronique ou dans un album aux pages cornées et jaunies. Il est question ici à la fois du type de document (document textuel, iconographique, cartographique, images en mouvement, etc.) et du support (papier, numérique sur tablette, ordinateur de bureau, négatif ou autres pellicules et bandes, disque compact ou DVD, etc.) Il n’est pas question du contenu, mais bien du type de document et du support que requiert ce contenu.

Ces éléments conditionnent la phase de lecture du document, phase préliminaire à l’indexation, mais touchent-ils l’indexation ? Svenonius (1994) parle d’une différence dans les concepts selon la nature du médium, en prenant l’exemple d’oeuvres sonores et visuelles. Elle souligne la complexité des concepts issus de la lecture de ce type de document. Les concepts issus de l’analyse de ces types de documents et de supports sont extrêmement difficiles à étiqueter. Ainsi, pour Svenonius (1994, 605), selon le type de document, la difficulté de l’indexation n’est pas la même parce que les concepts exprimés dans des documents sonores ou visuels sont difficilement réductibles à certaines expressions linguistiques. Mais la complexité des concepts à traduire en termes d’indexation peut également poser problème lors du traitement d’un document textuel. La poésie, par exemple, est un type d’écriture qui, même en document textuel, sur un support et dans un format classique et facilement appréhendable par l’être humain, est difficile à indexer. Svenonius (1994, 605) identifie la source du problème : il s’agit de lacunes sur le plan terminologique, d’un manque de noms reconnus pour identifier tel ou tel concept, plutôt qu’un défaut de l’indexation de ne pas pouvoir représenter tel ou tel concept issu de tel ou tel type de document, sur tel ou tel support.

Quand l’indexeur passe au niveau conceptuel, la dimension physique des documents perd de son importance. Bachimont parle d’indexation conceptuelle, un type d’indexation à rapprocher de l’indexation par sujet puisqu’elles traitent toutes deux du contenu des documents :

On entend par conceptuel le fait que la représentation est indépendante du média du document et qu’elle ne porte pas sur la nature physique du document, mais sur son contenu. L’indépendance du média ne signifie pas seulement indépendance au format du document, où par exemple on représente de manière générique la couleur dominante du document, indépendamment du format d’encodage de l’image. Il s’agit plutôt de l’indépendance à la nature matérielle du document, qu’il soit visuel, sonore ou textuel.

2007, 253

L’indexation par sujet se distingue des autres types d’indexation. Les éléments de support ou le type de document peuvent faire partie de l’indexation d’un document, mais ils ne constituent pas un sujet du document. Et s’ils deviennent des clés d’accès, ils ne devraient pas figurer dans la section des clés d’accès thématiques.

Qu’il s’agisse de documents d’archives ou d’autres objets documentaires tels que des livres, des films ou des albums de musique, on retrouve des opérations génériques qui se recoupent : repérage et sélection des concepts à retenir d’une part, et représentation de ces concepts dans un code qui permet le repérage d’autre part (par le biais d’un langage documentaire contrôlé ou d’un vocabulaire libre). L’indexation est un processus cognitif en deux étapes : analyse et représentation. Et l’indexation porte aujourd’hui sur tous les types de documents et tous les types de supports. L’étape préliminaire à l’analyse (la lecture, c’est-à-dire l’appréhension et la compréhension des documents) est différente selon le type de document, mais au niveau du concept, l’indexation par sujet semble similaire en bibliothéconomie et en archivistique.

L’indexation pratiquée en archivistique et en bibliothéconomie se ressemble à la fois sur le plan du processus et sur celui de l’activité. Voyons si les caractéristiques propres aux documents d’archives ainsi que le traitement traditionnel des archives peuvent exercer une influence sur l’activité de l’indexation.

L’indexation des documents d’archives

Les normes et les sources que nous avons citées jusqu’à présent emploient généralement le singulier ; il est toujours question du document à indexer. Nous voyons là une préconception bibliothéconomique, où l’indexation se fait a priori sur un seul document à la fois[3]. En archivistique, par contre, une règle de base consiste à appliquer le principe du général au particulier, c’est-à-dire de traiter en priorité le fonds d’archives avant le dossier ou la pièce. Cette remarque nous amène à considérer les différences entre l’indexation en bibliothéconomie et l’indexation en archivistique en fonction de l’objet documentaire sur lequel porte l’indexation. Nous étudions ces différences à partir de certaines caractéristiques des archives, soit la singularité des archives, l’unité de traitement en archivistique, la hiérarchie d’un fonds d’archives et le principe du général au particulier. Nous mentionnons également l’influence que peut avoir le vocabulaire des requêtes des usagers sur les choix terminologiques à faire dans la production d’un index.

Singularité

Une première différence notable est la singularité des documents d’archives. Il n’existe pas deux fonds d’archives définitives identiques. En bibliothéconomie, l’objet documentaire est édité, publié. Les exemplaires trouvés en bibliothèque sont absolument identiques, car produits en série (Pugh 1982, 33). Nous pouvons même trouver plusieurs exemplaires au même endroit ou dans plusieurs endroits. Sont exclues ici les collections de livres rares et les collections spéciales qui récupèrent — à cause de ce statut particulier — certaines caractéristiques archivistiques : petit nombre d’exemplaires, voire un seul, exclusion du prêt, mesures de conservation particulières, traçage de la propriété, etc. Un fonds d’archives est unique. L’ensemble des documents produits ou reçus par un créateur qu’est un fonds d’archives est composé de documents existant en un seul exemplaire, et chaque document a une et une seule place dans l’organisation hiérarchique du fonds. Les fonds d’archives définitives ne représentent que 5 à 10 % de la masse documentaire originale (Couture et al. 1999, 167). En effet, un tri est effectué en fonction de critères d’évaluation. Parmi ces critères figure l’élimination des doublons. Un archiviste n’aura donc pas à indexer deux documents identiques, ce qui peut être le cas d’un bibliothécaire.

Chaque fonds étant unique, le coût de traitement (description et indexation) est très élevé car il nécessite une analyse unique et n’est jamais réutilisable. Or, en bibliothéconomie, il existe des pratiques de réutilisation et de partage des informations consignées dans une notice de bibliothèque (Poupeau 2012). Il existe même des catalogues collectifs employés par des bibliothèques similaires ou d’un même réseau (Poupeau 2012). Une telle pratique est impensable en archivistique. Pour chaque fonds d’archives, l’archiviste doit recommencer l’indexation : par l’analyse, il obtient une combinaison de concepts unique, qu’il doit ensuite traduire en termes d’indexation.

Unité de traitement

Une deuxième différence notable porte sur l’unité de traitement. En effet, l’unité de traitement en archivistique est le fonds d’archives. Les RDDA donnent une définition du fonds (curieusement, la Loi sur les archives du gouvernement du Québec mentionne le mot fonds deux fois sans le définir) :

Ensemble de documents de toute nature réunis automatiquement et organiquement, créés et/ou accumulés et utilisés par une personne physique ou morale ou par une famille dans l’exercice de ses activités ou de ses fonctions.

BCA. Comité de planification sur les norme de description 2008, D5, nous soulignons

Les normes documentaires parlent de l’indexation du document, d’un seul document à la fois. Or, en archivistique, on n’indexe généralement non pas un document mais des documents. Nous ne considérons pas ici les pièces isolées qui peuvent elles aussi exister dans un service d’archives et être indexées à la pièce, car elles constituent l’exception et non la règle. Alors, à moins de considérer le fonds d’archives comme un document, nous ne pouvons pas parler de l’indexation d’un document.

En outre, l’indexation porte non seulement sur les documents du fonds, mais aussi sur la notice de description archivistique, ce qui ajoute un document de plus à l’ensemble. La notice est le résultat d’une première analyse qui est faite par un archiviste, une analyse parfois différente de celui qui indexe. Les concepts auxquels l’indexeur accède sont donc de deux types, les uns directement issus des documents, les autres extraits d’une première analyse des documents, la description. Cette différence touche le choix des termes d’indexation. La norme NF ISO 999:1996 indique qu’« il convient de choisir les pointsd’accès [c’est-à-dire les termes d’indexation] à partir de la terminologie employée dans le document » (10, section 7.2.1.2). Dans la notice descriptive, il y a déjà des termes qui sont employés pour dénoter les concepts principaux du fonds, ce qui peut influencer les choix terminologiques effectués par l’archiviste lors de l’indexation.

Hiérarchie

La définition des RDDA nous donne une troisième caractéristique distinctive des archives par rapport aux objets documentaires conservés dans les bibliothèques : la structure interne du fonds prend la forme d’une hiérarchie qui a pour principe de diviser les activités et les fonctions :

Ensemble de documents de toute nature réunis automatiquement et organiquement, créés et/ou accumulés et utilisés par une personne physique ou morale ou par une famille dans l’exercice de ses activités ou de ses fonctions.

BCA 2008, D5, nous soulignons

En archivistique, on indexe non seulement des documents, mais des regroupements de documents. Ces regroupements sont basés sur l’organisation interne du fonds, sur sa classification. Les niveaux de classification constituent également les niveaux de description. Le niveau le plus englobant est le fonds qui se divise en séries, elles-mêmes divisées en dossiers, eux-mêmes rassemblant des pièces. Si la complexité du fonds l’exige et pour faciliter son appréhension intellectuelle, on ajoute des niveaux intermédiaires : les sous-séries et sous-sous-etc.-séries (Figure 4). Les documents physiques sont les pièces ; les niveaux supérieurs appartiennent à la classification, l’organisation intellectuelle appliquée à ces documents physiques. Le regroupement des documents est différent selon le niveau de la classification, qui est aussi le niveau de description et d’indexation. Les concepts principaux de chacun des rassemblements sont différents.

Figure 4

Hiérarchie d’une classification d’archives

Hiérarchie d’une classification d’archives

-> Voir la liste des figures

Par exemple, les documents de constitution d’une personne morale seront dans une série appelée « Constitution », indiquant dans ce cas précis l’activité de se constituer ; ce seront, pour une personne physique ou une famille, les documents d’identité et les actes qui marquent la vie d’une famille tels que l’acte de naissance, de mariage, un certificat de citoyenneté ou un passeport. Nous excluons les collections de documents d’archives qui existent dans les services d’archives parallèlement aux fonds d’archives et qui peuvent avoir différents principes de regroupement (non pas le créateur mais la thématique, le type de document, la période, etc.) Les collections n’offrent généralement pas de classification, mais présentent un ordre linéaire ou une progression, chronologique par exemple. Nous voyons alors que la structure hiérarchique typique d’un fonds d’archives n’est pas d’origine philosophique, mais plutôt organique puisqu’elle découle des activités et des fonctions du créateur.

La hiérarchie spécifique aux archives a une répercussion sur le vocabulaire employé pour leur indexation. Les normes d’indexation mentionnent généralement que l’on doit choisir un niveau de vocabulaire le plus élevé possible en spécificité : « Lorsqu’on utilise un thésaurus, il faut sélectionner le terme le plus spécifique existant pour représenter une notion donnée. » (ISO 5963:1985) En archivistique, à chaque niveau de la hiérarchie, on adapte la spécificité du vocabulaire. Le terme « établissement scolaire », s’il se trouve à un niveau élevé de la hiérarchie, tel que le fonds par exemple, dénotera un sujet général, les établissements scolaires. À un niveau inférieur, on retrouvera plutôt « école » ou « collège ». Mais la spécificité du vocabulaire est à pondérer avec la mission de l’établissement. « Elle [la spécificité de l’indexation] est très variable […]. Le niveau d’indexation restera plus général pour un catalogue de bibliothèque que pour un outil de recherche documentaire destiné à une recherche rétrospective fine. » (NF Z 47-102:1993) Par exemple, le service d’archives d’une communauté religieuse ne va pas retenir pour terme d’indexation de ses fonds le mot « religion », cela serait inutile. Par contre, dans le vocabulaire religieux, les mots « novice » ou « voeux temporaires » seraient des termes que l’on pourrait envisager et dans le vocabulaire général, les mots « coiffe » ou « recette de cuisine » pourraient être pertinents. Mais si les notices de cet établissement sont versées dans une base de données plus large, telle que celle du Réseau de diffusion des archives du Québec (RDAQ), alors il pourrait tout de même être pertinent de retenir « religion » comme terme d’indexation, afin de discriminer les fonds de cet établissement de ceux des autres institutions.

Principe du général au particulier

Parce que les archives sont regroupées en fonds d’archives, il y a pluralité de documents et hiérarchisation en niveaux de classification. À chaque niveau de la hiérarchie, on peut procéder à l’indexation. Mais en raison du principe archivistique selon lequel on doit aller du général au particulier, on doit donc d’abord indexer le niveau supérieur d’un fonds d’archives, avant d’indexer les niveaux inférieurs établis en fonction des activités ou fonctions du créateur. Il existe généralement au moins trois à quatre niveaux de description supérieurs avant d’arriver à la pièce, au document d’archives lui-même. On n’indexe aux niveaux inférieurs que si cela est nécessaire ; dans la pratique, il arrive qu’on indexe un dossier ou une pièce parce qu’ils sont très demandés par les usagers ou parce qu’on organise une exposition virtuelle et qu’il faut pouvoir retrouver ce document rapidement. Mais ces cas particuliers dérogent au principe du général au particulier. La norme ISO 999:1996 (1, section 1) parle des « points d’accès des différents niveaux utilisés dans les entrées d’index » et non des niveaux de l’indexation.

L’indexation qui porte sur chacun des niveaux doit s’adapter à son degré de précision. On parle dans l’indexation de spécificité (qualité des termes) et d’exhaustivité (quantité des termes). Ces deux critères de l’indexation doivent être adaptés au niveau de description choisi (fonds, série, dossier, pièce). Comme on procède du général au particulier, on commence par indexer le niveau du fonds puis les niveaux inférieurs. Plus le niveau est élevé dans la hiérarchie (fonds ou série), plus on retiendra des termes généraux. Plus le niveau est bas dans la hiérarchie (dossier ou pièce), plus on retiendra des termes spécifiques. Finalement, cela est à pondérer avec la mission de l’institution et ses habitudes terminologiques.

Influence des usagers

Il est notable que le choix des termes d’indexation peut être influencé par les habitudes linguistiques des usagers des services d’archives (Duff et Johnson 2001 ; Gagnon-Arguin 1998). L’entretien de référence peut s’effectuer en personne, par téléphone ou par courriel, et plus récemment par clavardage (Yu et Young 2004). Par cet entretien, l’archiviste prend conscience non seulement des thématiques qui intéressent les usagers du service d’archives, mais aussi de la manière dont ils expriment leur sujet de recherche (Duff 2002, 334). Ainsi, lorsque l’archiviste procède non seulement à l’indexation par sujet mais aussi à sa mise à jour régulière, il peut adapter l’indexation au vocabulaire utilisé par les usagers grâce à l’étude des requêtes. Ce facteur interfère avec la spécificité liée aux niveaux de description et l’archiviste est invité à en tenir compte (BCA 1992, xi, 27). « Un index efficace répond aux besoins des personnes recherchant l’information contenue dans les documents indexés. » (ISO 999:1996, 6, section 6.1) Ce principe général est valable pour les index de tous les types d’objets documentaires.

Conclusion

L’indexation par sujet en archivistique et en bibliothéconomie : du pareil au même ? Notre analyse nous permet de faire ressortir de nombreuses ressemblances et quelques différences entre l’indexation effectuée en bibliothéconomie et en archivistique.

D’après la littérature, l’indexation est un processus cognitif dont le coeur est formé de deux opérations : l’analyse des documents et la représentation par des termes d’indexation des concepts retenus. Mais, dans la pratique, en plus d’autres tâches à accomplir en vue de réaliser concrètement l’indexation de documents, une étape préliminaire majeure a été identifiée : la lecture des documents. Nous avons vu que celle-ci s’opère de différentes manières selon le type de document et le support. Pourtant, une fois que la personne qui indexe a complété l’analyse, ce sont des concepts qu’elle tente de traduire en termes d’indexation. Ainsi, nous constatons que le coeur de l’indexation par sujet est similaire pour les deux disciplines envisagées, la bibliothéconomie et l’archivistique. L’influence des usagers et l’importance de l’entretien de référence, le niveau de spécificité à adapter au milieu de l’indexation sont d’autres points communs aux deux disciplines.

La particularité de l’indexation par sujet en archivistique est liée à la particularité de son objet documentaire. Les documents d’archives sont singuliers, rassemblés en fonds d’archives et hiérarchisés selon des principes qui ne sont pas thématiques. Ceci s’explique par la volonté archivistique de rendre compte du contexte de création des documents. L’indexation archivistique a cela également de particulier qu’elle est réalisée en partie à partir des documents, et en partie (et c’est souvent la règle) à partir des notices descriptives. Parmi les instruments de recherche, la notice descriptive est le produit d’une première analyse du fonds. Les concepts identifiés dans la notice constituent une sélection effectuée par une personne qui a répondu, à un moment précis, aux intérêts des usagers. Les trois critères à retenir (personne, moment, intérêts des usagers) influencent la sélection des concepts et donc la représentation finale du fonds d’archives par l’index. Les différences entre l’objet documentaire archivistique et bibliothéconomique conditionnent l’opération préliminaire qu’est la lecture. La mise en concepts est plus complexe pour des ensembles de documents parfois très disparates et sur différents supports et de différents types, ce que sont généralement les fonds d’archives et moins souvent les objets documentaires.

Est-ce que, malgré les grandes ressemblances, les quelques différences relevées invalideraient l’application des normes documentaires aux fonds d’archives quant à l’indexation par sujet ? Le rapport sur l’indexation par sujet en archivistique du BCA indique clairement que :

Pour qu’un système d’accès sujet fonctionne efficacement dans un contexte archivistique, il faut que sa conception prenne en considération ces trois principes : le respect des fonds constitue la base de l’organisation et du classement des documents d’archives, la description doit refléter les niveaux de classement et la description procède du général au particulier.

BCA 1992, 31

Ces trois principes archivistiques sont absents des normes pour l’indexation que nous avons examinées et qui ont été rédigées dans une perspective documentaire large. Ils sont rattachés au classement et à la description archivistiques. Or, nous pouvons nous demander si, pour l’efficacité de l’indexation et l’ouverture à l’accès le plus universel possible, il est pertinent de les appliquer à l’indexation (par sujet). En effet, l’indexation a pour « but pratique [de] retrouver rapidement de l’information » (Weinberg 2009, 2287, notre traduction). Une fois l’information retrouvée selon des principes documentaires généraux, l’usager pourrait alors, si besoin est, l’interpréter en fonction des traditions de l’archivistique, c’est-à-dire en préservant le contexte de création, essentiellement par le principe de respect des fonds (unité de traitement), le principe du général au particulier et la classification par activités et fonctions.

Quelles que soient les lignes directrices choisies par un archiviste et son service d’archives, l’indexation par sujet nous paraît non plus accessoire mais essentielle à l’accessibilité des archives. Elle revêt une importance toute particulière en archivistique, car le principe de constitution des unités de traitement et le principe de division logique de la classification ne sont pas thématiques. Si la tradition a remis en cause l’indexation par sujet des archives, le comportement des usagers montre qu’ils réclament des outils leur permettant de chercher par thématique. La déclaration universelle sur les archives le stipule : « L’accès le plus large aux archives doit être maintenu et encouragé. » (Conseil international des archives 2010) De même, le code d’éthique de la profession recommande que « [l]es archivistes facilitent l’accès aux archives du plus grand nombre possible d’utilisateurs » (Conseil international des archives 1996, point 6). Il fait alors partie de la mission de l’archiviste de se mettre au service des usagers des archives en satisfaisant leur besoin d’accès par sujet.