Corps de l’article

Financée depuis 2011 par un programme national d’investissement[1] en faveur d’équipements scientifiques innovants en France, la banque d’enquêtes qualitatives (beQuali) est l’un des instruments de l’Equipex DIME-SHS[2]. Ce projet développé au Centre de données sociopolitiques[3] (CDSP) vise à doter la France d’outils en matière de collecte, d’enrichissement et de diffusion des données pour la recherche en sciences humaines et sociales. À l’instar d’autres projets européens tels que ESDS Qualidata désormais rattaché au UK Data Service, beQuali s’inscrit dans le mouvement d’ouverture des données de la recherche et propose gratuitement à la communauté scientifique en SHS un service de numérisation, de documentation, de mise à disposition et d’archivage numérique d’enquêtes qualitatives. La banque d’enquêtes répond principalement à trois besoins : préserver les données de recherche en SHS, rendre accessible des enquêtes qualitatives pour la production de nouvelles recherches et proposer des ressources pour l’enseignement des méthodes.

Dès sa création, beQuali a été confrontée à plusieurs risques inhérents à ce type de démarche, notamment à celui de voir mettre à mal l’anonymat des enquêtés ainsi qu’un risque d’erreurs d’interprétation lié à la décontextualisation des données (Bishop 2006, 2014). Les principes qui animent son développement visent à réduire ces risques en tenant compte des expériences similaires ayant eu lieu en Europe ou dans le monde. Son ambition est d’essayer de dépasser leurs limites, notamment en ce qui concerne les conditions dans lesquelles les corpus d’enquête sont reconstitués, de manière à garantir une compréhension suffisante du processus de recherche originel et de l’organisation du corpus de documents rassemblés. Pour répondre à ces différents enjeux, l’équipe beQuali a dû mettre en oeuvre un processus de traitement original, à la croisée de plusieurs pratiques documentaires, mêlant archivistique traditionnelle, bibliothéconomie, humanités numériques et documentation de données.

Cet article présentera d’abord le fonctionnement de ce service et notamment le nécessaire travail collaboratif associant le producteur et plusieurs compétences métiers. Puis, il abordera les spécificités de l’unité documentaire telle que définie et traitée dans la banque d’enquêtes, avant de décliner les choix de traitement et de documentation opérés par beQuali pour transformer ces données originales en corpus numériques enrichis et exploitables pour des usages scientifiques. La question des usages sera ensuite traitée à partir d’un retour d’expérience d’enseignement des méthodes qualitatives et à travers une présentation du catalogue et des outils d’exploration de beQuali.

Le fonctionnement du dispositif

Partager ses enquêtes sur beQuali : comment ça marche ?

Le traitement des enquêtes, de la collecte à la publication, est pris en charge par l’équipe de beQuali. Si les plateformes d’archives ouvertes (comme HAL ou Spire[4]) permettent le dépôt de publications par leurs auteurs, ce modèle ne paraissait pas adapté pour le partage des enquêtes qualitatives. Tandis que sur les premières, un dépôt correspond généralement à un fichier numérique (un article, un chapitre de livre, une thèse), les enquêtes contiennent plusieurs centaines de documents, soit autant de fichiers à documenter (décrire, nommer, dater) lors du téléversement. De plus, le fait de considérer les données de recherche comme un matériau communicable est un paramètre nouveau de la recherche. Contrairement à la littérature scientifique, les données peuvent ne pas être prêtes pour une communication en l’état, et exiger au préalable une série d’interventions. Parmi les documents collectés, on relève par exemple des transcriptions d’entretiens imprimées et non anonymisées, des fichiers nativement numériques dont les noms ou l’arborescence de classement révèlent de l’information sur les enquêtés, des cartons dans lesquels les archives d’une enquête sont mélangées avec d’autres archives sans qu’il y ait d’unité sémantique, etc. Avant la mise en ligne, beQuali prend donc en charge le classement, la numérisation, l’anonymisation, la sélection, et la documentation de ces données.

Le dépôt d’enquêtes sur le site beQuali passe aujourd’hui par un appel à propositions qui a lieu une à deux fois par an[5]. L’appel s’adresse aux chercheurs ou aux institutions ayant produit ou conservant des enquêtes qualitatives en sciences sociales. Le formulaire de proposition permet aux déposants de renseigner différentes informations décrivant l’enquête et les matériaux produits et conservés (la méthodologie employée, le type et le volume des matériaux, leur état, le caractère sensible des données, les publications). Les candidatures sont examinées et sélectionnées par le Comité scientifique et technique (CST) de beQuali, composé d’une dizaine d’experts : chercheurs et enseignants de différentes disciplines (sociologie, anthropologie, sciences politiques), spécialistes de l’IST, des archives et des humanités numériques.

Associer les producteurs dès la collecte

Une fois l’enquête sélectionnée par le CST, la collecte est formalisée par la contractualisation avec le déposant et l’institution de rattachement. Le service d’archives ou de documentation compétent est également intégré si les matériaux y sont conservés. Les documents sont transférés au CDSP le temps de leur traitement et de leur mise en ligne. Un premier rendez-vous avec les déposants permet de faire le point sur les documents conservés, en s’assurant notamment de leur état, formats et de la faisabilité technique du traitement. Cette réunion est également l’occasion de collecter un maximum d’information pour comprendre les matériaux et plus généralement la réalisation de la recherche.

Les producteurs des enquêtes sont associés aux diverses étapes de leur traitement : le protocole d’anonymisation est validé sinon coconstruit avec le chercheur, qui participe aussi à la recontextualisation de l’enquête lors d’un entretien accordé à beQuali, et peut être sollicité ponctuellement pour identifier un document.

Valeur ajoutée d’une équipe plurimétiers

Le dispositif beQuali s’est construit, dès l’origine, sur la base d’une interaction de métiers — archivistique, sciences sociales et design Web — dans le but de pouvoir appréhender et maîtriser l’ensemble des logiques et des contraintes nécessaires à la réalisation. Ce parti-pris s’est traduit par la mise en oeuvre d’une « polyphonie » indispensable à la bonne marche du projet (Both & Garcia 2014). Aujourd’hui, le dispositif repose sur une équipe projet de six personnes (documentalistes, archivistes, ingénieurs de recherche en sciences sociales), les opérations de design Web étant assurées par l’équipe informatique du CDSP. Une des spécificités de l’activité de traitement des enquêtes est que celle-ci est systématiquement réalisée par un binôme composé d’un profil archiviste/documentaliste et d’un profil sciences sociales. Traiter une enquête selon le modèle mis en place à beQuali suppose en effet de remplir un ensemble de tâches faisant appel à des expertises multiples, qui nécessitent de travailler de manière collaborative. Il faut par exemple pouvoir classer et préparer des documents papier pour la numérisation tout en organisant intellectuellement des corpus de documents souvent complexes et volumineux, en prenant bien soin en parallèle d’anticiper des problématiques comme celles de l’anonymisation ou de la contextualisation du processus de recherche. Derrière ces opérations, ce sont des savoirs et des savoir-faire très divers et étendus qui sont mobilisés dans les domaines des techniques de classement d’archives ou de contrôle qualité de numérisation, des standards internationaux de documentation des données, des théories et des méthodes des sciences sociales, etc. La stratégie de développement de beQuali s’est ainsi fortement appuyée sur la valeur ajoutée d’une équipe plurimétiers, gage de vitalité.

L’enquête qualitative : un corpus de données complexe

Les données collectées sont des corpus d’enquêtes qualitatives en sciences sociales (sociologie, science politique, ethnologie, notamment). Il s’agit de données hétérogènes et complexes à plusieurs titres.

Des données d’observation humaine, à caractère sensible

Tout d’abord, ces matériaux sont délicats de par leur nature. En effet, les enquêtes qualitatives renvoient à des données de terrain, c’est-à-dire recueillies selon des méthodes d’entretien approfondi, en face à face ou en groupe, ou d’immersion et d’observation ethnographique au plus près des enquêtés, souvent complétées par de la documentation. Ces données ainsi collectées, observées et enregistrées par un chercheur (et non par un instrument) le sont à partir d’une interaction humaine et sociale. Elles sont donc le plus souvent coproduites ou coconstruites par cette relation entre le chercheur et l’enquêté, ce qui induit un rapport intime et de confiance entre le chercheur et « ses » données, le chercheur et « ses » enquêtés. En outre, ces données interrogent des pratiques, des opinions et des situations sociales, touchant par exemple à la politique, à la religion, à la sexualité, à la santé ou à l’ethnicité. S’attachant à décrire des personnes et résultant de récits de vie et de jugements, elles sont donc souvent de nature personnelles et sensibles. Leur mise à disposition doit répondre à des contraintes juridiques fortes (droit d’auteur, réglementation informatique et libertés[6]) visant à protéger les chercheurs et les enquêtés (ou les personnes citées).

Des archives scientifiques

Ensuite, ces données sont spécifiques en raison de leur origine et de leur usage. Elles sont en effet collectées dans les archives de chercheurs ou dans les fonds d’archives de leurs laboratoires, mais seulement une fois passée « la durée d’utilité scientifique » (Both & Cadorel 2014). Ce délai renvoie au temps pendant lequel le chercheur voudra exploiter ses données pour ses recherches présentes ou futures. Ce passage au statut « d’archives » peut correspondre au moment de la retraite ou bien au passage de la publication de la thèse. Il varie d’un chercheur à l’autre et dépend toujours d’une volonté personnelle de léguer et partager son travail à d’autres, avec l’idée d’en faire profiter des collègues étudiant des problématiques connexes.

Une unité archivistique originale qui prend forme grâce au numérique

L’unité documentaire traitée par beQuali se positionne à la croisée de plusieurs pratiques documentaires. Ce sont des archives au sens du Code du patrimoine qui les définit comme « l’ensemble des documents, quels que soient leur date, leur lieu de conservation, leur forme et leur support, produits ou reçus par toute personne physique ou morale et par tout service ou organisme public ou privé dans l’exercice de leur activité » (article L211 du Livre 2 du Code du patrimoine), mais le traitement opéré par beQuali sur ces archives déroge à certaines règles de la pratique archivistique. En effet, la constitution même des corpus d’enquêtes mêle plusieurs fonds d’archives : archives de chercheurs, de laboratoires, etc. Par la multiplicité de ses sources et l’originalité de son unité, le corpus « enquête » dans beQuali s’éloigne de la logique de producteur propre à l’archivistique et se rapproche davantage de celle de la constitution de collections documentaires regroupant des documents sur la base de certaines caractéristiques (formes, support, sujet, etc.). Pour autant, le respect des fonds n’est pas mis à mal, car les outils informatiques rendent possible la création d’un artefact numérique (Both & Cadorel 2014) guidé par une logique scientifique, celle de l’enquête de terrain, sans altérer le caractère organique des fonds d’archives conservés dans les institutions.

Des corpus de recherche multiformes

Enfin, ces jeux de données sont particuliers par leur unité (de sens) et leur diversité (de formes). Dans beQuali, l’unité documentaire (ou archivistique) correspond à l’unité scientifique « enquête », c’est-à-dire qu’elle renvoie à une étude dont les bornes temporelles et le périmètre matériel sont parfois difficiles à restituer, et que seul le chercheur est en mesure de distinguer. Il peut en effet étudier un terrain géographique ou une population de manière espacée dans le temps (c’est le cas de l’enquête Les réseaux économiques souterrains de N. Murard et J. F. Laé, portant sur la revisite de familles à 30 ans d’intervalle), ou bien mener une recherche au long cours, dans plusieurs terrains complémentaires. Une enquête dans beQuali peut dès lors constituer un agrégat d’enquêtes et de terrains (comme l’enquête Choisir son école d’A. van Zanten, composée de cinq enquêtes menées de façon progressive et au gré des financements, ou celle La profession d’architecte : nouvelle théorie sociologique des professions de F. Champy dans lequel il réinvestit des matériaux d’enquêtes antérieures, depuis sa thèse.)

fIGURE 1

« Fouille » de documents au domicile du chercheur

« Fouille » de documents au domicile du chercheur

Collecte par beQuali chez un chercheur déposant.

-> Voir la liste des figures

Le corpus de matériaux sélectionnés et mis à disposition correspond également à une masse de documents allant au-delà des données de terrain stricto sensu. Cette conception large et exhaustive de la matérialité de l’enquête englobe des documents depuis la préparation du projet de recherche jusqu’à l’analyse des données et vise à résoudre la difficulté inhérente à la mise à disposition de données brutes dans une optique de réutilisation scientifique. La collecte du corpus (papier ou numérique) doit être la plus large possible afin de renseigner sur les différentes étapes du processus de recherche et de rendre possible la compréhension et l’exploitation des matériaux par d’autres chercheurs. Elle reflète ainsi les trois grandes étapes de la recherche : la préparation, la collecte et l’analyse des données. Parmi la diversité des documents collectés on peut citer par exemple des dossiers de financements, des devis, des comptes-rendus de réunion, des grilles méthodologiques, des transcriptions d’entretiens, des notes d’observation, des fiches de synthèse, des brouillons de rédactions intermédiaires.

Au-delà des contenus, les documents d’une enquête qualitative sont enfin de volume et de support divers. Variant d’un à dix cartons, une enquête peut comporter des cahiers et feuilles volantes, des cassettes audio, des vidéos, des photographies, des schémas, des magazines, des brochures, des tracts, des fichiers numériques ou encore des assemblages et des collages de tout format. Ce corpus composite, de documents en plus ou moins bon état, implique une série de traitements archivistiques, documentaires et numériques afin d’en constituer une unité numérique signifiante, mise en ligne sur un site permettant leur consultation et leur exploitation scientifique.

Quels traitements documentaires ?

Pour répondre au double objectif patrimonial et scientifique, différentes étapes jalonnent le travail de documentation des données, depuis la collecte jusqu’à l’archivage des jeux de données mis en ligne. Ce travail est réalisé en collaboration avec les producteurs des données. Il vise à restituer le plus fidèlement possible la forme et le sens des données collectées et à contextualiser leur essence et leur genèse. Les enquêtes de beQuali sont documentées « sur mesure », empruntant autant aux outils maison conçus par l’équipe et adaptés aux spécificités des données traitées, qu’aux standards de documentation et d’archivistique dans un souci de pérennité et d’interopérabilité.

Décrire finement des corpus volumineux

Une fois l’enquête collectée, un inventaire pièce à pièce (parfois jusqu’à 800 documents) décrivant l’ensemble des documents est réalisé. Description, date, nom du fichier, état du document, nombre de pages, présence de données personnelles, mise en ligne sont autant de métadonnées qui y sont répertoriées. Cet inventaire est mis à disposition sur le site sous forme de tableur et d’un instrument de recherche arborescent (plan de classement) selon le standard EAD. C’est également à ce moment que la sélection des documents à mettre en ligne s’effectue. Ainsi, certains documents peuvent être écartés de la numérisation et de la mise en ligne pour des raisons de droit de communicabilité, d’édition ou de protection des données personnelles. Il s’agit par exemple des articles consultables en ligne sur des portails de revues scientifiques (comme Cairn.info, Persée, Revues.org) ou des archives de presse. Cela peut être le cas d’une liste de contacts d’enquêtés, contenant généralement des noms et coordonnées. Dans ce cas, afin de ne pas perdre trop d’information, les données non personnelles peuvent être reprises sous la forme d’un tableau créé par beQuali et mis à disposition sur le site. Ce travail de sélection du corpus est réalisé en collaboration avec le chercheur : pour repérer les données sensibles, pour trier différentes versions d’un même document et pour choisir les matériaux les plus pertinents en vue d’une réutilisation.

fIGURE 2

Classer et décoder le vocabulaire du chercheur

Classer et décoder le vocabulaire du chercheur

Extrait de l’enquête La Formation des couples, de M. Bozon et F. Héran.

-> Voir la liste des figures

Classer en respectant l’intégrité du fonds

En parallèle de ce travail, les documents sont organisés selon un plan de classement défini par l’équipe beQuali, à partir des pratiques de plusieurs chercheurs. Cela permet d’homogénéiser le classement de chaque enquête selon quatre niveaux d’arborescence : sous-fonds (préparation, collecte, analyse, compléments), dossier, sous-dossier puis article. Nous avons défini une trame commune de classement selon ces quatre niveaux avec un système de nommage unique que nous adaptons ensuite à chaque enquête. Chaque enquête étant un cas particulier, le plan de classement lui est spécifique. Ce principe nous permet de respecter l’intelligibilité de l’enquête, de garder la trace de l’organisation du chercheur tout en permettant le fonctionnement d’outils d’exploration sur un site web. Par exemple l’enquête La Formation des couples de M. Bozon et F. Héran a été menée en trois étapes : une enquête préliminaire par entretiens, une vague d’enquête par questionnaire puis une enquête post-quantitative par entretiens menés auprès de répondants aux questionnaires. Le plan de classement à facettes nous a permis de décrire et d’inscrire ces différentes étapes dans le nommage des documents.

Le plan de classement permet également à l’utilisateur de se repérer dans la masse de documents constituant une enquête. L’enquête Choisir son école réalisée par Agnès van Zanten comporte 476 documents. Il est donc indispensable de classer les documents et de leur attribuer un nommage compréhensible par tous. Un exemple de nommage peut être « pre_meth_indv_notes » qui correspond aux notes, réalisées lors de la préparation de l’enquête, et relatives à un entretien individuel. Cela renvoie donc à l’élaboration de la méthodologie utilisée.

Préparer les documents à la numérisation

Les trombones, agrafes et post-it sont retirés afin de préparer les documents à la numérisation et également pour les conserver dans de bonnes conditions d’archivage. Chaque document est conservé dans une pochette en papier neutre. Les documents papier nécessitant d’être anonymisés le sont également à ce moment. Des post-its sont utilisés afin de cacher les informations personnelles ou confidentielles. L’anonymisation s’effectue également sur les documents nativement numériques. La plupart du temps, un hyperonyme du type « ([anonym : nom enquêté]) » ou « ([anonym : nom lieu]) » est utilisé pour remplacer l’information. L’anonymisation se fait au cas par cas après discussion avec le chercheur (Bendjaballah et al. 2018). Avant la numérisation, des réparations peuvent également être effectuées sur les documents si nécessaire.

fIGURE 3

Arborescence des fichiers d’enquête selon le nommage de beQuali

Arborescence des fichiers d’enquête selon le nommage de beQuali

Collecte par beQuali chez un chercheur déposant.

-> Voir la liste des figures

Les documents constituant l’enquête et conservés sous format papier sont envoyés à un prestataire externe afin d’être numérisés aux formats ODT (pour l’édition des transcriptions), JP2 (pour l’archivage pérenne) et PDF (pour la diffusion). Les cassettes audio sont également numérisées afin d’être conservées dans un format pérenne (WAV). Les enregistrements audio, qui posent des questions spécifiques d’anonymisation, ne sont actuellement pas mis en ligne sur le site beQuali. Une fois les documents numérisés, un contrôle qualité est effectué par l’équipe beQuali.

Documenter selon des standards internationaux et interopérables

Les transcriptions d’entretiens sont ensuite éditées sous le format XML-TEI pour la mise en ligne. Cela permet de décrire la structuration du texte (tours de paroles entre les interviewés et les enquêteurs, éléments de paraverbal, etc.). L’enquête est également documentée selon les standards de métadonnées DDI[7] et Dublin Core. L’affichage des métadonnées générales prend la forme d’une notice intitulée « l’enquête en bref » sur le site beQuali. Elle reprend les principales informations descriptives telles que l’auteur, les dates, les publications associées et le type et nombre de matériaux disponibles. Des informations de contexte de l’enquête (couverture géographique, population enquêtée, méthode de collecte, etc.) sont également renseignées au format DDI.

Contextualiser le travail de recherche : l’enquête sur l’enquête

En parallèle des différentes actions décrites ci-dessus, des entretiens sont réalisés avec le chercheur pour recontextualiser l’enquête dans une perspective de réutilisation scientifique. Ce travail donne lieu à la rédaction d’un rapport écrit intitulé « l’enquête sur l’enquête ». Il vise à apporter un éclairage scientifique et une mise en perspective historique sur le travail mené par le chercheur. L’enquête sur l’enquête retrace d’abord la carrière de ce dernier, pour se concentrer ensuite sur la genèse de l’enquête, ses modalités de réalisation (orientations théoriques, démarche choisie, options méthodologiques et péripéties du terrain), le corpus conservé, l’analyse menée sur les matériaux, ainsi que sur sa postérité et ses possibles réutilisations. L’enquête sur l’enquête constitue un outil d’aide précieux pour comprendre et s’approprier les documents d’une enquête. Elle est librement consultable sur le site beQuali sous deux formats : la lecture d’un rapport téléchargeable en format PDF ainsi que l’écoute en ligne de l’entretien oral avec le chercheur, monté et chapitré.

Une fois ces différentes étapes réalisées, les documents sont mis en ligne à la fois sur le site de beQuali (pour l’exploration des documents) et sur le portail français Quetelet[8] d’accès aux données pour les sciences humaines et sociales (pour le téléchargement de tous les fichiers d’une enquête).

Archiver les matériaux originaux et les données enrichies

Lorsque le traitement de l’enquête est terminé et que celle-ci a été mise en ligne sur le site, les documents originaux sont renvoyés aux chercheurs ou aux institutions responsables des archives pour archivage physique. L’enquête est également archivée dans sa version numérique sous des formats pérennes. Cette opération fait l’objet d’un partenariat[9] avec le Centre informatique national de l’enseignement supérieur[10] (CINES) qui est un centre de calcul et d’archivage numérique ayant reçu l’agrément du Service interministériel des archives de France[11] (SIAF) pour prendre en charge l’archivage numérique des établissements de l’enseignement supérieur et de la recherche.

En assurant la conservation pérenne des enquêtes mises à disposition, beQuali entend couvrir l’ensemble de la chaîne documentaire liée à la mise à disposition des données. En effet, sont déposés au CINES les matériaux numériques ou numérisés des enquêtes ainsi que toute la documentation créée par beQuali. Les originaux des documents sont, quant à eux, retournés auprès des producteurs (chercheurs ou services d’archives des établissements) et conservés selon les règles du réseau des archives en France[12]. Ce dispositif de mise à disposition fait l’originalité de beQuali. La banque d’enquête est actuellement la seule à proposer un archivage à proprement parler, et non le seul stockage sécurisé des données enrichies.

Le projet d’archivage pérenne est un processus assez long à mettre en place, car il requiert de l’information technique très précise afin d’assurer sur le long terme l’intégrité et l’intelligibilité des documents ainsi que la maintenance des formats. La première étape a été de définir l’unité documentaire à verser : un « paquet d’archives » correspondra à une enquête numérisée et documentée. Il a ensuite fallu déterminer — avec l’aide des équipes du CINES et en se basant sur leur outil de validation FACILE[13] — la liste des formats de fichiers qui seront versés : PDF-A, ODS, XML, XML-TEI, ODT, CSV, JPEG-2000, PNG, MPEG-4 et WAVE. Enfin, un profil de description des paquets d’archives a été défini. Cette trame, destinée à contenir les métadonnées spécifiques pour l’archivage au CINES, a été créée selon le Standard d’échange des données électroniques (SEDA) utilisé pour le versement d’archives publiques électroniques. L’information contenue dans ce « profil SEDA » est reprise dans les fichiers de métadonnées utilisés pour la mise à disposition sur le site beQuali. Le fichier de métadonnées pour l’archivage est créé automatiquement par un script informatique qui suit le mapping réalisé par l’équipe de beQuali entre les différentes métadonnées utilisées.

Quels usages ? Le cas de l’enseignement des méthodes en SHS

Une offre diversifiée

La banque d’enquêtes offre plusieurs perspectives d’utilisation, principalement à des fins de recherche et d’enseignement. L’objectif global est de faciliter la découverte et l’appropriation des enquêtes par les enseignants-chercheurs et les étudiants.

La première réponse à cet enjeu renvoie à la recherche de diversification du catalogue d’enquêtes proposées à la réutilisation, qui sont pour l’instant au nombre de huit (10 autres sont en cours de traitement). Comme le montre le tableau ci-dessous, beQuali propose un catalogue diversifié, que ce soit par les disciplines, les méthodes, les thèmes, les périodes ou encore les terrains. Cette diversité constitue un atout dans le cadre des enseignements de méthode en SHS en particulier.

tableau 1

Diversité du catalogue d’enquêtes beQuali

Diversité du catalogue d’enquêtes beQuali

Répartition du nombre d’enquêtes en traitement par catégories.

-> Voir la liste des tableaux

Par exemple, le catalogue permet de montrer la variété des méthodes de recherche, qu’il s’agisse de présenter la méthodologie de l’entretien semi-directif ou de l’observation. Il couvre aussi des thématiques recoupant les grandes disciplines enseignées en science politique ou en sociologie, que ce soit la sociologie des organisations (avec l’enquête Les Ministères de l’Enseignement supérieur en France et en Allemagne, de C. Musselin), la sociologie de l’immigration et de la famille (avec l’enquête Deux générations d’immigrés africains, de J. Barou), le genre (Des femmes en politique, de M. Sineau), les institutions politiques (Le Parlement et l’Europe, d’O. Rozenberg) ou encore le comportement électoral (Les Français et la politique, d’E. Schweisguth). Dans le cadre d’un enseignement, cette diversité des thèmes et des méthodes employées dans ces enquêtes permet de montrer aux étudiants la richesse des manières de faire une enquête de terrain en SHS. Elle leur permet de saisir non seulement les différentes méthodologies applicables à la recherche en SHS, mais aussi de comprendre qu’à des thèmes voisins ou similaires peuvent correspondre plusieurs démarches de recherche différentes. Par exemple, en Europe, les méthodologies employées par deux enquêtes de la banque sont l’entretien semi-directif (Le Parlement et l’Europe) et l’entretien collectif (Quand des Français, des Anglais et des Belges parlent d’Europe). Le catalogue des enquêtes permet ainsi de mener des analyses comparées et transverses, pour une meilleure compréhension de la recherche de terrain.

tableau 2

Diversité du catalogue d’enquêtes beQuali

Diversité du catalogue d’enquêtes beQuali

Les références SP1, S1, etc. renvoient aux identifiants des enquêtes.

-> Voir la liste des tableaux

La deuxième réponse à cet enjeu pédagogique renvoie à la conception exhaustive que beQuali donne à chaque enquête, laquelle constitue un atout majeur dans l’utilisation de la banque à des fins d’enseignement. beQuali collecte en effet tous les documents de l’enquête, depuis la préparation du projet d’enquête jusqu’à l’analyse, permettant de renseigner sur les différentes étapes du processus de recherche. Comme le montre le tableau ci-dessous, chaque enquête de la banque permet ainsi de couvrir une phase de la recherche de terrain.

Des outils d’exploration pour favoriser l’appropriation des données

Afin de simplifier l’entrée dans les enquêtes, la plateforme beQuali offre plusieurs séries d’outils d’exploration en ligne.

Une première série d’outils accompagne la compréhension du corpus de documents qui forment l’unité « enquête ». Chaque enquête peut être consultée à partir d’outils d’exploration destinés à faciliter les tris dans ces ensembles de données. Actuellement, les utilisateurs peuvent filtrer ces collections de données en choisissant un ou plusieurs critères parmi trois possibilités : analytique, géographique et temporel. Pour optimiser le fonctionnement de ces filtres, une classification commune aux différentes enquêtes a été adoptée et chaque document est indexé en fonction de ces métadonnées. Le premier tri, analytique, utilise les trois principales catégories du plan de classement des documents décrit plus haut[14]. Ce plan de classement a été explicitement construit pour refuser la dichotomie « données/documentation[15] ». Chacune de ces trois catégories permet d’explorer la composition du corpus de l’enquête selon des regards différents, qui sont suffisamment génériques et englobants pour permettre de classifier tout type d’enquête, quelles que soient ses spécificités : les grandes étapes du processus de recherche (préparation, collecte, analyse), le type d’activité précisément impliqué par le processus de recherche (par exemple, l’administration du projet, sa documentation, la réflexion méthodologique, l’enregistrement d’observations sur le terrain, la production de résultats scientifiques, etc.) ou encore les types de documents, qui objectivent plus directement la matérialité de l’enquête (par exemple, les enregistrements audio, les transcriptions, les notes, les rapports, les articles, les communications, la correspondance, etc.). La répartition des documents selon ces trois niveaux du plan de classement permet de mieux appréhender la structure documentaire de l’enquête sans être enfermé dans un seul regard, celui d’une arborescence figée de catégories et de sous-catégories ; un tel système a en effet l’inconvénient de prédéterminer les chemins d’exploration possibles, en canalisant l’approche du corpus par une série d’emboîtements successifs. Ici, au contraire, il est possible d’explorer l’enquête d’emblée par exemple du point de vue des types de documents et de voir comment ces types de documents se répartissent selon la phase de préparation, de collecte ou d’analyse — bref d’inverser l’approche spontanée qui consisterait à aller du plus général au plus spécifique. Cette approche a l’avantage d’être fidèle à l’enquête de terrain telle qu’elle se construit.

Par ailleurs, chaque document se voit attribuer d’autres métadonnées, telles que sa date et sa localisation géographique, quand l’information est disponible. La possibilité de répartition des documents sur une ligne de temps annuelle (les documents sont regroupés généralement par année) donne ainsi à voir la chronologie de l’enquête, et donc l’étalement dans le temps du processus de recherche. Leur répartition sur une carte donne quant à elle à voir la dimension géographique de l’enquête (les documents sont regroupés autour de l’unité géographique de taille la plus adaptée). Il est donc possible, quand cela est bien sûr pertinent, de manipuler la dimension comparative du processus de recherche. Ce prisme permet par exemple de montrer aux étudiants le caractère unique de chaque terrain.

fIGURE 4

Filtrage des documents par localisation géographique

Filtrage des documents par localisation géographique

-> Voir la liste des figures

Surtout, l’exploration du corpus est interactive : le principe de ce module est de dépasser les inconvénients d’une classification fixe en permettant à l’utilisateur de faire varier les modes de visualisation du corpus documentaire[16]. Fonctionnellement, les outils d’exploration permettent de filtrer dans le corpus, simultanément sur ces différents champs, analytique, temporel et géographique. Ces filtres sont interdépendants : toute action effectuée sur un des filtres se répercute automatiquement sur les deux autres. Concrètement, les trois visualisations sont affichées conjointement à l’écran. Si on filtre en sélectionnant une catégorie du plan de classement, par exemple les documents qui relèvent de la phase de « collecte », on obtiendra la répartition géographique et temporelle de ces documents sur les deux autres visualisations. Autre exemple, si on sélectionne une année donnée sur la frise temporelle, on obtiendra la répartition géographique et analytique de ces documents sur les deux autres visualisations.

Retour d’expériences

Grâce à la diversité et à la richesse aussi bien des documents et des informations disponibles sur les enquêtes que des outils d’exploration, il est possible d’engager avec les étudiants des réflexions approfondies sur la démarche d’enquête, par exemple une réflexion autour de la préparation du terrain, avec des questions telles que la construction et la sélection de l’échantillon, les modes de recueil des données ou encore le processus de production du guide d’entretien. Sur ce dernier point, les matériaux disponibles permettent souvent de montrer qu’un guide d’entretien se construit progressivement et nécessite plusieurs ajustements et corrections tout au long du terrain : par exemple, pour les enquêtes Choisir son école d’A. van Zanten et Deux générations d’immigrés africains de J. Barou, ce sont sept versions du guide d’entretien qui sont consultables. La banque permet aussi de montrer aux étudiants comment le travail d’analyse s’effectue concrètement : qu’il s’agisse de sociogrammes, de graphes, de typologies ou de fiches synthétiques, le catalogue des enquêtes en ligne permet d’expliquer comment traiter les données recueillies du terrain. Les documents d’analyse montrent aussi que ce travail se fait parfois avec tâtonnement, nécessitant un retour sur le terrain. En somme, l’ensemble des matériaux conservés permet de montrer que la recherche de terrain ne constitue pas une succession d’étapes distinctes et cloisonnées les unes des autres. Le fait de pouvoir manipuler aisément les documents selon le plan de classement, la date ou la localisation géographique vise à faciliter l’exploration de ces dimensions.

Les possibilités d’engager un travail de réflexion avec les étudiants sont renforcées par des outils permettant d’explorer les enquêtes à un niveau de granularité fin. En particulier, un affichage dynamique des transcriptions d’entretiens est rendu possible par leur édition préalable en XML-TEI. Deux séries d’éléments sont ici exploitables : les « intervenants » (les locuteurs, autrement dit le ou les enquêteurs ainsi que les individus interrogés) et le niveau de finesse de la transcription (les conventions de transcriptions du niveau verbal et paraverbal). L’outil étant interactif, on peut choisir par exemple de n’afficher que les tours de parole de l’enquêté, ou ceux de l’enquêteur, ou encore de cacher tout ou une partie des indications du paraverbal. Cet outil permet ainsi de faire travailler les étudiants sur la relation entre enquêteur et enquêté, par exemple sur la nature des échanges ou le niveau de distance entre ces deux derniers. Enfin, l’ensemble des transcriptions étant téléchargeable dans des formats utilisables avec des logiciels CAQDAS (Computer Aided Qualitative Data Analysis Systems), les étudiants peuvent faire émerger des analyses à partir des données elles-mêmes.

fIGURE 5

Options d’affichage des transcriptions d’entretien

Options d’affichage des transcriptions d’entretien

-> Voir la liste des figures

fIGURE 6

Affichage d’un fichier TEI sur le site

Affichage d’un fichier TEI sur le site

-> Voir la liste des figures

L’équipe de beQuali a l’occasion d’expérimenter l’usage des enquêtes du catalogue dans le cadre d’enseignements de master de sociologie. Plusieurs thématiques ont pu être discutées avec les étudiants : par exemple, à l’aide des transcriptions d’entretiens et de la publication finale associée à l’enquête Le Parlement et l’Europe, les étudiants ont procédé à une analyse comparée des transcriptions d’entretiens avec la publication finale en réfléchissant à des questions telles que « Que reste-t-il de l’entretien ? Quelle forme et quel contenu ? Quelle méthode d’analyse ? ».

Ce travail les a conduits notamment à constater que dans les conclusions finales tirées par le chercheur, les entretiens étaient rarement mobilisés dans leur exhaustivité. Les premiers enseignements que l’équipe tire de cette expérience sont nombreux : d’abord, sans surprise, l’appropriation des matériaux pour un enseignement demande un investissement important, tant du côté des étudiants que des enseignants, qui ne seraient pas familiers des thèmes ou des méthodes développées dans les enquêtes. De ce point de vue, l’équipe a pu constater tout l’intérêt et l’importance du travail de contextualisation qu’elle opère : beQuali produit en effet des documents qui consistent en une compilation d’informations qui n’existent nulle part ailleurs dans le corpus de documents. Il peut s’agir dans certains cas de synthèses des principaux résultats de l’enquête (notamment des catégories utilisées pour réaliser des typologies ou des classifications), présentées sous forme de tableaux. Le plus souvent, il s’agit de listes récapitulant les personnes enquêtées, éventuellement caractérisées par leurs principales propriétés sociographiques. Ces différents documents d’enrichissement des données, que ce soit l’inventaire détaillé ou l’enquête sur l’enquête, facilitent grandement l’appropriation des matériaux et la compréhension des enjeux théoriques et méthodologiques de l’enquête.

L’enquête sur l’enquête se présente comme un document particulièrement fructueux : pour saisir l’usage qui peut être fait des archives d’enquêtes pour son propre terrain, il est en effet nécessaire de comprendre comment le chercheur premier a entrepris sa propre recherche. Or, il y a généralement peu de documents (articles scientifiques notamment) dans lesquels le chercheur expose lui-même, de manière approfondie, ses propres choix, les difficultés et péripéties auxquelles il a fait face dans la constitution de son échantillon par exemple. De ce point de vue, le travail mené conjointement avec le chercheur dans le cadre de l’enquête sur l’enquête s’avère particulièrement bénéfique. Les étudiants et enseignants ont ainsi la possibilité d’écouter depuis le site de beQuali des extraits audio (cf. plus haut) dans lesquels le chercheur expose lui-même sa démarche, sans filtre d’analyse ou d’interprétation secondaire faite par un tiers.

fIGURE 7

Extraits audio de l’enquête sur l’enquête

Extraits audio de l’enquête sur l’enquête
Source : Site beQuali.fr

-> Voir la liste des figures

On comprend bien dès lors l’importance du travail de documentation réalisé à l’échelle de chaque document, en collaboration avec le ou les chercheurs premiers, qui seul permet d’aboutir à ce résultat. La définition d’un protocole de documentation commun, appliqué à chaque enquête facilite la démarche pédagogique dans la mesure où elle permet de comparer les enquêtes du catalogue les unes avec les autres à partir de problématiques identiques. Elle permet ainsi de bien faire ressortir les différences et les similitudes au-delà de la spécificité de chaque terrain.

Ensuite, faire travailler des étudiants sur un terrain « tiers » favorise la mise à distance et le développement d’un regard critique sur la recherche, ce qui facilite une réflexion plus autonome sur l’enquête de terrain. Enfin et surtout, il ressort de ces premières expériences de très nombreux questionnements et usages possibles sur la démarche de recherche, indépendamment du nombre d’enquêtes disponibles dans le catalogue. Le séquençage de chaque enquête selon les différentes phases du terrain permet de croiser les thématiques et les « entrées » dans le catalogue : par exemple, en travaillant avec les étudiants sur la phase d’analyse, il est apparu qu’il y avait suffisamment de matériaux (qu’il s’agisse des synthèses familiales dans l’enquête Deux générations d’immigrés africains de J. Barou ou des graphes dans l’enquête Représentations du champ social, attitudes politiques et changements socio-économiques de J.M. Donégani, G. Michelat et M. Simon) avec deux ou trois enquêtes pour expliquer la variété des formes que peut prendre le processus de montée en généralité.

Conclusion

Les choix de développement de la banque d’enquêtes présentés dans cet article répondent aux trois enjeux initiaux qu’il s’agissait de concilier à l’origine du projet : sauver des enquêtes de la perte et de l’oubli à un moment où les données qualitatives sont encore très peu conservées en France ; proposer des outils dynamiques pour explorer ces jeux de données complexes et denses et pour se les approprier en vue de produire de nouvelles connaissances ; ouvrir à la communauté académique l’occasion de découvrir des matériaux inédits et intéressants d’un point de vue pédagogique. Les compétences mobilisées pour construire le dispositif, le mode de fonctionnement et les priorités mises en avant ont permis de construire un outil à la fois évolutif et pérenne, d’offrir à la communauté scientifique un catalogue d’enquêtes diversifié et riche, et de répondre au besoin de préserver et de valoriser des enquêtes qualitatives.

Comparativement à d’autres centres de données similaires et précurseurs, à l’image de ESDS Qualidata ou du Finnish Social Science Data Archive, beQuali privilégie une conception élargie de ce qui constitue une enquête, en aucun cas limitée aux « données brutes », quand bien même elles sont accompagnées de leur « documentation ».

En complément, « l’enquête sur l’enquête » qui accompagne systématiquement chaque mise à disposition vise à restituer à l’utilisateur la dynamique de recherche ayant guidé le ou les auteurs de l’enquête ; elle a été pensée comme un outil permettant de découvrir l’enquête dans sa globalité avant toute réutilisation de ses matériaux. En ce sens, beQuali a été globalement conçu dans un esprit attentif « à la contextualisation, la prise en main et l’exploration des corpus » (Duchesne & Garcia 2014).

Si le site est conçu pour un type de données particulier au départ (les enquêtes menées par entretiens), de plus en plus d’enquêtes ethnographiques (menées par observation) sont entrées dans le catalogue et élargissent progressivement le plan de classement et les outils de visualisation. Ainsi, chaque nouveau type de corpus et de matériau amène son nouveau lot de questionnements méthodologiques pour ajuster au mieux les outils disponibles sur le site et présenter les documents de la manière la plus pertinente pour de nouveaux usages. De même les photos, vidéos et enregistrements audio sont voués à pouvoir être mis à disposition en ligne, dès lors que les conditions d’utilisation le permettent (accord des enquêtés pour la diffusion). En outre, si une sélection est indispensable pour pouvoir traiter des enquêtes dans une optique de réutilisation, le CST de beQuali n’a pas vocation à juger la valeur scientifique des enquêtes. L’appel à propositions est ouvert à tous types d’enquêtes entrant dans le champ des méthodes qualitatives et des sciences sociales et beQuali souhaite rester un entrepôt national, basé sur le dépôt volontaire, et un intermédiaire pour continuer à valoriser des archives sur le très long terme.

Dans un souci constant d’accompagnement des utilisateurs, l’un des objectifs de beQuali est également d’enrichir les outils permettant d’explorer les enquêtes sous de nouveaux angles. À cette fin, les premières expérimentations de la banque d’enquêtes dans un but pédagogique sont discutées dans le cadre d’un groupe de travail sur l’enseignement, mené à l’initiative de beQuali, et rassemblant des enseignants-chercheurs intéressés par la problématique de l’usage d’archives d’enquêtes pour leurs cours. Ces réflexions donnent lieu à un jeu de supports pédagogiques sur des questions pratiques d’enseignement qui seront disponibles prochainement sur le site de beQuali. Une journée d’étude organisée à l’initiative de beQuali permettra de faire la synthèse de ces premières conclusions et de dégager des pistes pour développer des corpus d’enquête simplifiés et « prêts à l’emploi » de façon à proposer des modules permettant aux enseignants et aux étudiants de se saisir de manière plus didactique des enquêtes disponibles.

Par ailleurs, beQuali entend permettre les revisites de terrain et les réanalyses de corpus constitués pour certains il y a plusieurs dizaines d’années. À l’instar d’initiatives déjà réalisées (Abrial et al. 2017), la démarche de beQuali favorise en effet la réappropriation des matériaux afin d’éclairer autrement les terrains et les analyses qui en sont faites. Il s’agira de développer ces premières expérimentations en sensibilisant notamment les chercheurs et doctorants à l’occasion de journées d’études ou de conférences. beQuali est déjà engagée sur ce terrain avec des communications réalisées dans le cadre des réseaux Mate-SHS (Réseau Méthodes Analyses Terrains Enquêtes en SHS) et ECPR (European Consortium for Political Research).

À ce titre, l’équipe de beQuali participe régulièrement[17] à des journées d’étude thématiques dans le cadre de réseaux professionnels, notamment sur la confidentialité des données, les archives de la recherche, l’enseignement ou encore l’analyse secondaire. L’équipe intervient régulièrement dans les laboratoires de sciences sociales pour sensibiliser la communauté scientifique à la conservation des données de recherche et accompagner les chercheurs et les professionnels de l’IST qui souhaitent préparer ou anticiper le partage d’enquêtes sur un entrepôt.