Corps de l’article

Introduction

L’industrie du livre vit, depuis une quinzaine d’années, des mutations importantes face au développement des technologies de l’information et de la communication. Plusieurs études se sont intéressées à l’analyse des transformations de l’industrie, de l’offre et de la demande des livres (Benhamou 2014, Benghozi 2011, Chartron & Moreau 2012). Le numérique transforme également l’économie des métadonnées des livres qui, originellement, servent à les décrire et à faciliter leur accès. Le développement des chaînes d’édition en langage structuré XML (eXtensible Markup Language) déplace la production de métadonnées vers l’amont de la chaîne du livre. Par ailleurs, dans l’économie du Web, la visibilité et l’accessibilité des livres dépendent de ces métadonnées et l’exposition dans le Web de données introduit encore un nouvel enjeu de valorisation (Domange 2013). Certains éditeurs de livres, principalement ceux qui sont adossés à des groupes opérant sur des marchés internationaux, sont conscients que leur visibilité et, a fortiori, leurs ventes passent désormais par la libération et la distribution ouverte à large échelle des métadonnées de leurs catalogues (Meynadier 2014).

Par ailleurs, dans la chaîne du livre papier, la production des métadonnées se partageait entre différents acteurs publics et privés : bibliothèques, agences bibliographiques, intermédiaires marchands. La question est alors de savoir ce qui change dans la valeur ajoutée par chacun de ces acteurs. Est-ce que la production numérique affecte le « marché des métadonnées » qu’organisaient des acteurs comme Electre, Decitre, Tite-Live en France? Avec l’avènement du Web de données, bascule-t-on dans une économie publique des métadonnées du livre? Éditeurs et bibliothèques ont-ils une convergence renforcée dans la production des métadonnées du livre?

L’objectif de cet article est de rendre compte de l’organisation actuelle de la production des métadonnées du livre, de pointer les évolutions en cours en terme de partage des rôles. L’évolution des services numériques nous conduira à anticiper un avenir partagé entre des types de métadonnées propres à l’identité des différents acteurs.

Contexte et enjeux renouvelés pour les métadonnées du livre

Afin de cerner les enjeux des mutations numériques associés au livre dans le contexte français et plus précisément ceux relevant de la production, de la distribution de ses métadonnées, nous avons recherché les articles publiés sur deux plateformes portant une offre significative académique en sciences de l’information et de la communication (Cairn.info, Revues.org) mais avons considéré également une littérature professionnelle majeure au niveau national (Bulletin des Bibliothèques de France, Arabesque)[1] ainsi que les rapports et actes de journées d’étude diffusés directement par des institutions en lien avec les bibliothèques et l’édition, notamment le ministère de la Culture et de la Communication, la Bibliothèque Nationale de France, l’Agence Bibliographique de l’Enseignement Supérieure et le Syndicat National de l’Édition. Cette littérature est diversifiée et permet de comprendre globalement les transformations qui affectent aujourd’hui la filière du livre. Plus précisément, concernant les enjeux relatifs aux métadonnées, nous avons choisi de souligner trois points d’analyse majeurs pour comprendre le renouvellement du contexte associé au numérique.

Les éditeurs et la production des métadonnées

Les métadonnées servaient originellement à décrire un contenu pour permettre son repérage dans un catalogue de vente ou une collection de bibliothèque. Cette fonction devient primordiale dans le cas du livre numérique, du fait que l’accès, la commercialisation et la pérennité du ficher numérique dépendent de la disponibilité de métadonnées.

La production de métadonnées descriptives et commerciales du livre en France est assurée en grande partie par les représentants de l’industrie du livre afin de promouvoir la vente et l’acquisition des livres par les professionnels qui sont principalement les libraires et les bibliothèques. Or, de nombreuses études ont détaillé à quel point la technologie numérique révolutionne les modes de production, de distribution et de consommation du livre. Pour Dacos et Mounier (2010), les évolutions rapides et assez éloignées des fondements de l’édition traditionnelle ont provoqué des tensions dans la profession, créant des déficits de compétences et des difficultés d’adaptation. Selon Benghozi (2011), les Technologies de l’information et de la communication (TIC) bouleversent la nature des oeuvres culturelles créées, leur mode de distribution, leur économie ainsi que les usages, les pratiques et attitudes des consommateurs. Benhamou (2012, 2014) montre aussi comment le numérique modifie les aspects de la chaîne de l’imprimé et remet en perspective le métier de tous ceux qui y travaillent. Longhi et Rochia (2014) analysent l’effet des TIC sur la structure de l’industrie du livre et sur le positionnement de ses acteurs. Dans la cible de cet article, on constate l’intégration progressive de la production de métadonnées en amont de la filière, un enjeu promu et accompagné désormais par les associations professionnelles françaises telles que la Commission de Liaison Interprofessionnelle du Livre (CLIL). Des guides[2] de formation sont rédigés pour accompagner en particulier les nouvelles pratiques concernant le format ONIX 3.0 (Figure 1), norme de référence pour la description des produits du secteur du livre que maintient groupe international qui coordonne le développement de standards pour le commerce électronique dans le domaine du livre et des publications en série (EDItEUR)[3].

Figure 1

Structuration des métadonnées ONIX 3.0

Structuration des métadonnées ONIX 3.0

Le corps de la notice est subdivisé en 6 blocs et précédé d’un entête et d’éléments d’identification.

Source : Guide CLIL, cf. note 1

-> Voir la liste des figures

Le repérage dans une « hyper-offre »

Un des changements majeurs des industries culturelles réside, d’après Benghozi dans « la multiplication considérable de l’offre culturelle disponible avec des conséquences sur l’équilibre des productions et des modalités de choix des consommateurs » (2011).

Les statistiques du Syndicat national de l’édition (SNE 2014) indiquent également que, pour l’année 2013, si les revenus des éditeurs ont connu une baisse de l’ordre de 3 %, leur production en titres a augmenté par contre de l’ordre de 10,6 %. Ce phénomène d’hyper offre change d’échelle avec Internet. Selon Longhi et Rochhia, « le volume des offres disponibles ne fera que croître par le haut avec les nouveautés et vers le bas avec la numérisation des ouvrages existants » (2014, 122). En effet, la croissance de la production de 10,6 % se traduit par une hausse des nouveautés (+4,3 %) et des réimpressions (+17,4 %). En revanche, selon le SNE, le nombre d’exemplaires produits a baissé de 9,3 % et le tirage moyen de 18,1 % en conséquence, un niveau historiquement bas.

L’offre abondante des titres rend difficile la rencontre entre un livre et ses lecteurs. Pour F. Benhamou, les métadonnées sont donc au coeur de la liaison entre le livre et le lecteur, parce qu’ « elles permettent de faire émerger un titre dans l’offre infinie que l’on connaît sur le net » (2014). Elle insiste cependant sur la pertinence et la complétude des métadonnées produites, deux facteurs qui constituent, selon elle, des « enjeux commerciaux et culturels de première importance ».

Les professionnels du livre mettent aussi en avant l’importance des métadonnées enrichies dans l’optimisation de la vente des livres. Le cabinet Nielsen, spécialiste du secteur culturel, a publié une étude sur le lien entre les métadonnées et les ventes des ouvrages. En se basant sur les 100 000 meilleures ventes britanniques, les auteurs de l’étude (Breedt & Walter 2012, 4) indiquent que la vente du livre augmente de 98 % si l’éditeur fournit les 11 éléments basiques des standards des métadonnées du BIC[4]. Dans certains secteurs de l’édition et pour une meilleure visibilité de l’offre, les acteurs peuvent avoir comme stratégie de proposer ces métadonnées en accès libre, afin de maximiser la circulation de ces informations clés. Des plateformes comme Cairn.info, par exemple, numérisent, enrichissent et fournissent gratuitement les métadonnées des publications qu’elles diffusent à tous les tiers (portails de bibliothèques, bases bibliographiques, services bibliométriques, etc.), notamment en facilitant leur moissonnage[5].

La proximité du lecteur : multidistribution et recommandations

Même si le Web a permis des relations directes entre les producteurs du contenu et les utilisateurs, ceci reste, selon Chartron et Moreau « marginal face au besoin d’un marché de masse » (2012, 4), la fonction de distribution et de diffusion persiste, mais elle exige des compétences technologiques nouvelles. Avec le numérique, les plateformes de distribution se multiplient en France et la stratégie est généralement de développer une présence sur le maximum d’entre elles, tout en veillant aux concurrences potentielles. Les éditeurs se sont regroupés pour créer des plateformes ; les plus importantes sont Numilog, Eden, Editis, Cairn.info, L’Harmathèque, Immatériel.fr.

La plateforme de distribution catalogue et organise son offre grâce aux métadonnées d’identification, de gestion des droits et de gestion commerciale. Pour promouvoir ses contenus et capter l’attention de l’usager, elle intègre aussi désormais des processus de recommandation basés sur la proximité des métadonnées et sur la proximité des comportements de navigation des usagers de leur plateforme (Kembellec & Chartron 2014).

Ces recommandations sont calculées de façon algorithmique et peu transparente. D’autres types de recommandations plus qualitatives, proches du club de lecture et de la médiation du bibliothécaire ou du libraire, sont aussi plébiscitées dans le secteur du livre. Il s’agit des avis des lecteurs sur différents réseaux sociaux dédiés au livre, notamment Babelio, Library Thing, Goodreaders (Stenatov, Teisseire, Frémaux 2014). Leurs membres sont incités à partager avec les autres lecteurs leurs annotations et leurs critiques. Le rachat de Goodreaders par Amazon[6] témoigne de l’attention accordée à ces recommandations sociales pour guider et susciter l’achat du livre aujourd’hui.

Les métadonnées du livre : entre économie marchande et non marchande

Dans le cadre du numérique, les métadonnées deviennent essentielles pour repérer, accéder, promouvoir et commercialiser les livres. Les enjeux de l’accès portés par les bibliothèques croisent des enjeux liés à l’optimisation du commerce du livre portés par les acteurs des industries culturelles. Services de métadonnées gratuits et services de métadonnées payants sont aujourd’hui proposés aux internautes et acteurs du Web. Le modèle économique des métadonnées des livres en France articule le non-marchand et le marchand, ce qui n’est pas nouveau mais une tension grandit quant à la valorisation possible dans un contexte où la gratuité est de plus en plus revendiquée. Qui sont aujourd’hui les principaux acteurs de chaque type d’offre ? Comment évolue leur positionnement ? Quelle valeur économique est accordée aux différents services ?

Pour répondre à ces questions, nous avons croisé plusieurs sources de données. Nous avons tout d’abord pris contact avec des professionnels et des consultants du domaine qui nous ont aidés à cerner l’offre des métadonnées du livre. Nous avons ensuite procédé à une analyse des services majeurs de métadonnées au travers leur site Web. L’analyse s’est appuyée sur une grille recueillant les éléments suivants : la taille de l’offre, le public cible, le modèle économique suivi, les standards adoptés, et les spécificités donnant à l’offre son avantage compétitif. Nous avons mené, par la suite, une enquête par entretiens semi-directifs en présentiel ou par téléphone auprès d’un échantillon d’acteurs ayant répondu favorablement à notre demande et représentatifs de différentes catégories : éditeurs de livres, intermédiaires de la filière, bibliothécaires afin de comprendre leur stratégie en matière de production, de diffusion et d’utilisation des métadonnées. Nous avons également recueilli leur vision de l’avenir d’une offre payante de métadonnées du livre. La grille d’entretien ouvert ainsi que la liste des personnes interrogées qui ont aimablement contribué à notre recueil de données sont mentionnées en annexes 1 et 2. Ces résultats sont à considérer comme un premier niveau d’analyse qui pourrait être approfondi par secteur ultérieurement.

L’offre marchande des métadonnées du livre en France

Les acteurs

L’analyse du secteur de la commercialisation du livre à l’international permet d’identifier quelques acteurs-intermédiaires majeurs proposant des services de métadonnées plébiscités à la fois par des bibliothèques, des éditeurs, des « places de marché » variées dans le contexte du e-commerce.

Electre[7] est une filiale du Cercle de la Librairie (Syndicat créé en 1847 qui regroupe les différentes professions du livre, principalement l’édition et la librairie) dont les activités commerciales concernent la production et la diffusion de la base de données bibliographiques (electre.com), l’édition de presse magazine professionnelle (Livres Hebdo) et l’édition d’ouvrages professionnels (Éditions du Cercle de la Librairie). La base de données Electre a été lancée en 1986 afin de permettre aux bibliothèques et aux libraires d’accéder à l’ensemble des données bibliographiques issues de la publication annuelle de la France.

Dilicom[8] est une ancienne filiale de la société Electre pour la gestion des activités de commandes des livres. Elle réunit aujourd’hui éditeurs, libraires et distributeurs. Son activité principale est la gestion de commandes en ligne des livres entre éditeurs, distributeurs et librairies. Afin de mener à bien cette activité, Dilicom a signé en 1998 un partenariat avec la Commission de Liaison Interprofessionnelle du Livre (CLIL) et Hachette Livre pour la création du Fichier Exhaustive du livre (FEL), la société Dilicom assure la gestion informatique de cette base.

Decitre[9] est une librairie créée en 1907. Elle commercialise depuis 1998 une base de données bibliographique vendue principalement aux fondateurs de plateformes de commerce culturel en ligne.

TiTE-Live[10] est une société créée en 1983, dans un objectif de mise sur le marché d’un progiciel de gestion unitaire en librairie. Il produit actuellement trois bases de métadonnées d’information bibliographique et commerciale : MediaLivre, MediaMusic et Media Vidéo.

Tableau 1

Principaux acteurs de l’offre marchande des métadonnées

Principaux acteurs de l’offre marchande des métadonnées

-> Voir la liste des tableaux

Valeur de l’offre et public cible

Nous mobilisons ici le concept «d’analyse de la valeur» introduit aux États-Unis par Lawrence Delos Miles et développé en Europe dans les années 1960[15]. Dans ce cadre, la notion de « valeur » apparaît très différente de l’acception courante de ce terme, laquelle assimile la valeur au prix : « Un produit aura d’autant plus de valeur qu’il satisfera aux fonctions attendues par rapport aux coûts les plus faibles possibles. » (Perrin 2014). Les fonctions d’un produit ou d’un sous ensemble de produits définissent, selon Perrin, ce à quoi sert ou doit servir le produit. L’analyse fonctionnelle est, dans ce cadre, essentielle à l’analyse de la valeur d’un produit. Ainsi, pour comprendre la valeur de l’offre marchande des métadonnées de livres, il est éclairant de rendre compte, à l’appui des données recueillies, des différentes fonctions auxquelles répondent les produits/services de métadonnées. Si la fonction principale des métadonnées de livres réside dans la description d’un livre pour faciliter sa découverte, elles répondent également à d’autres besoins selon les différents publics concernés.

Le marché des métadonnées payantes cible les bibliothèques, les libraires, les sites de commerce culturel en ligne ainsi que les éditeurs. Le tableau 2 résume la valeur de chaque type d’offre selon les besoins exprimés. Les bibliothèques achètent les métadonnées pour assurer trois fonctions principales : la gestion des acquisitions, le catalogage des nouveautés et la gestion des ressources numériques. La valeur des métadonnées proposées réside dans le signalement rapide des nouveautés, la description enrichie très utile pour aider l’acquisition et la décision d’achat « plusieurs bases de données pour la gestion des acquisitions existent mais nous avons choisi Electre pour son exhaustivité et la précision des notices proposées »[16] ainsi que la livraison dans des formats de qualité permettant l’intégration dans les outils locaux. Pour les ressources numériques la mise à jour régulière des champs (titre, paramètres bouquet, URL d’accès, termes de licences) constitue une valeur importante pour garantir la continuité d’accès. Les détaillants des livres sollicitent l’offre marchande des métadonnées pour l’identification de l’offre éditoriale, le suivi des nouveautés, la commande des livres, l’alimentation de leur propre base de données et la diffusion de leur catalogue sur leur site Web (classement de l’offre, recommandation). Les valeurs appréciées sont assez similaires que pour les bibliothèques mais en particulier la couverture exhaustive, la mise à jour journalière des informations utiles au commerce du livre (prix, promotion, retrait de vente et qualité des métadonnées d’accès, enrichissement de contenus). Les éditeurs ont aussi besoin d’assurer la visibilité de leur offre éditoriale en fournissant à tous les acteurs de la chaîne de livre des métadonnées de qualité, standardisés en aujourd’hui. Pour la plupart d’entre eux, faute de compétences internes suffisantes pour cette fonction, ils ont recours aux services de production des métadonnées proposés par des intermédiaires, anciens ou nouveaux.

Tableau 2

Valeur de l’offre marchande

Valeur de l’offre marchande

-> Voir la liste des tableaux

L’offre non marchande des métadonnées du livre en France et son évolution

Parallèlement à une production marchande, il existe en France une offre des métadonnées produite par des acteurs publics, principalement les bibliothèques qui créent des notices catalographiques à des fins de gestion de collections. Deux acteurs publics principaux produisent des métadonnées catalographiques, la Bibliothèque nationale de France (BnF) et l’Agence bibliographique de l’enseignement supérieur (ABES).

Avec l’arrivée du livre numérique, ces deux établissements ont fait évoluer leur stratégie de production et de distribution des métadonnées du livre, notamment avec les éditeurs qui plébiscitent également une diffusion ouverte de ces métadonnées pour maximiser leur visibilité.

Les éditeurs et l’évolution du mode de production

Afin de faire connaître leurs titres, les éditeurs se contentaient de produire leur catalogue sur format papier, affichant quelques éléments des métadonnées comme le titre, le nom de l’auteur, le format du livre et le prix. Depuis 1998, les éditeurs français envoient ces données descriptives à Dilicom qui gère le Fichier Exhaustive du livre (FEL). Un des objectifs de cette base est de faciliter la découverte et la commande des titres par les libraires du pays. Cependant, l’enjeu est désormais international dans le contexte d’une économie globalisée qui s’organise autour de plateformes mondiales de commerce en ligne. EDItEUR conseille aux éditeurs de distribuer leurs métadonnées en format ONIX (ONline Information eXchange, un format standard qui facilite l’échange en ligne des données complètes et enrichies sur les livres). La Commission de liaison interprofessionnelle du livre en France (CLIL) a retenu ONIX 3.0 comme norme de référence pour la description des livres numériques[18]. La directrice générale de Dilicom souligne pour ONIX l’avantage d’être un « langage » commun qui permet d’échanger des données structurées et enrichies, d’intégrer des données normalisées[19] et de couvrir les besoins de description d’un marché de plus en plus international (description des droits par territoire, disponibilité et prix par territoire, par exemple) (Backert 2014). Mais, selon une étude de KPMG (2014, 26), même si en 2014, 93 % des éditeurs en France jugeaient les métadonnées incontournables pour la visibilité de leur offre, seulement 3 % produisaient des données ONIX à la même période, essentiellement des grandes maisons d’édition développant une plateforme propre de distribution comme Hachette livre, Editis, Eden livre (la plateforme de distribution numérique des éditions Gallimard, Flammarion, la Martinière et Actes Sud).

Pourquoi ce standard est-il si peu adopté en France ? L’interview d’acteurs majeurs dans le domaine a convergé vers l’identification de difficultés de mise en oeuvre : compatibilité internationale et compétences locales essentiellement. Selon l’entretien mené avec Dilicom, le standard ONIX est à la fois un standard global et local qui essaye d’intégrer les spécificités de chaque pays risquant, selon elle, de construire une arborescence incohérente liée à une juxtaposition de pratiques et de demandes de différents pays. ONIX présente également de fortes contraintes liées à la fréquence des mises à jour semestrielles des listes de codes, à la difficulté d’établir des correspondances entre les différentes versions et au besoin de mettre en place des contrôles de qualité des données renseignées. Ceci a été confirmé par la directrice éditoriale d’EDP Sciences : « Chaque point de vente utilise une version différente d’ONIX, ce qui a des conséquences sur le temps et le coût du travail nécessaire pour produire le fichier ONIX[20] De surcroît, selon Sandrine Padilla, responsable du service diffusion à ENS Edition, « les éditeurs n’ont pas de personnels bien formés pour enrichir et assurer la qualité des métadonnées nécessaires à la création des fichiers ONIX »[21].

Cette complexité a vu l’émergence de prestataires assistant cette production de métadonnées au format ONIX. C’est le cas de GiantChair, une société américaine qui travaille actuellement avec une centaine d’éditeurs principalement des presses universitaires et « leur donne le choix et le contrôle sur leurs métadonnées »[22]. GiantChair propose aux éditeurs un logiciel, OnixSuite, avec une interface backoffice sur laquelle les éditeurs renseignent les éléments nécessaires à la création du fichier ONIX. Le logiciel permet, selon l’entretien conduit avec GiantChair, « le contrôle de la qualité des métadonnées via une feuille de score qui donne un indice de qualité des métadonnées fournies, ce qui permet à l’éditeur de repérer et de corriger les erreurs commises lors de l’enregistrement ». OnixSuite récupère les données renseignées et les complète pour générer un fichier ONIX qui est envoyé aux acteurs de la chaîne des livres[23].

Les bibliothèques et l’ouverture sur le Web des données

En France, deux acteurs sont représentatifs de l’offre bibliographique des bibliothèques: la BnF et l’ABES. Ces deux établissements, dans une logique de réseau, coordonnent la production des métadonnées livres dans le cadre de leur mission comme agences bibliographiques chargées de la diffusion de métadonnées bibliographiques. L’ABES coordonne le réseau de catalogage partagé des bibliothèques universitaires françaises ; son catalogue, le Sudoc, agrège les métadonnées des livres, des périodiques et des thèses universitaires. La BnF se charge de la production de la bibliographie nationale de France ainsi que des notices d’autorité matière, personne, collectivité, titre. Les deux institutions essayent de construire une réflexion stratégique commune face à des problématiques proches auxquelles elles sont confrontées à l’heure du Web de données. En 2012, les deux établissements ont fondé ensemble le Comité stratégique bibliographique (CSB), avec l’objectif d’élaborer une vision stratégique nationale commune qui prenne en compte, au-delà des catalogues, les problématiques de signalement en général. Cette nouvelle vision stratégique se porte sur deux éléments essentiels : l’ouverture de leurs données sur le Web ainsi que la mutualisation de la production des données bibliographiques, non seulement entre elles, mais aussi au niveau international avec d’autres acteurs bibliographiques (ABES, BnF 2102).

Animées par la volonté d’être plus visibles sur le Web et dans le cadre des directives nationales et européennes sur les données publiques, les bibliothèques proposent leurs métadonnées sous une licence ouverte de l’État. L’ABES a ouvert depuis 2010 des services et applications qui s’adressent à un cercle large : référentiel d’autorités IdRef, thèses.fr, exposition du Sudoc et Calames sur le Web des données. Le Conseil d’administration du 23 novembre 2012 a retenu la licence ouverte de la mission Etalab (France) pour les données produites par les réseaux ABES[24]. Cette licence permet la réutilisation libre et gratuite des données. Elle s’applique aux seules notices produites par les réseaux ABES et ne peut pas s’appliquer aux notices dérivées de bases externes auxquelles s’applique la licence du producteur de la base. Le projet data.BnF.fr a pour objectif la valorisation de la richesse des fonds et l’ouverture de la BnF au Web de données par l’adoption des standards du Web sémantique, le BnF a adopté aussi la licence d’État préconisée par Etalab pour toutes les données au format RDF exposées dans data.bnf.fr[25]. L’utilisation de cette licence assure aux agences bibliographiques françaises une interopérabilité juridique au niveau international, notamment avec des organismes comme OCLC (Online Computer Library Centre) qui recommande la licence OCD-BY pour 14 données de WorldCat.

Convergences et divergences significatives

Le contexte des chaînes de production numérique et la recherche de mutualisation pour des services non redondants, dans un contexte économique plutôt contraint, conduisent à certains mouvements de convergence significatifs entre les acteurs. Une convergence bibliographique se dessine à l’échelle nationale par le rapprochement entre la BnF et l’ABES et leur intention de tenir un rôle particulier vis-à-vis de l’ensemble des bibliothèques du territoire. Les agences s’affirment comme « les opérateurs de réservoirs de métadonnées de référence dans lesquels chaque établissement viendra puiser au lieu d’en dupliquer la production localement » (Agostini 2015, 56).

Une autre convergence se dessine à plus large échelle entre bibliothèques et éditeurs. La nécessité de réaliser une économie de catalogage, face à l’augmentation des volumes à traiter et à la baisse des revenus budgétaires, incite la communauté des bibliothèques à récupérer les données auprès de leurs sources de production, c’est-à-dire auprès des éditeurs. Le directeur du département de l’information bibliographique et numérique à la BnF le confirme:

Il semble difficile, dans un contexte budgétaire contraint, d’appliquer au numérique les mêmes modalités de traitement que pour l’imprimé. La question de la production et de la mutualisation des métadonnées devient dès lors cruciale impliquant des relations nouvelles entre agences bibliographiques et éditeurs. La récupération plus poussée des données éviterait de recréer à chaque fois les données.

Illien 2011, 3

Dans la lignée de cette réflexion, la BnF a mis en place l’extranet du dépôt légal qui permet aux éditeurs de saisir en ligne leurs déclarations au lieu d’envoyer des formulaires que la BnF devait ressaisir[26]. La BnF propose aux éditeurs déposant le plus de publications de transférer directement leurs données à la BnF en format ONIX. Selon l’entretien conduit :

Les grands éditeurs comme Hachette transmettent leurs fichiers ONIX pour éviter de ressaisir les notices sur l’intranet. La BnF travaille également avec les diffuseurs qui ont des métadonnées ONIX de plusieurs éditeurs. Faciliter le flux des métadonnées ONIX est dans l’intérêt de la BnF» [27].

En France, la BnF est aussi devenue la troisième agence d’enregistrement ISNI en janvier 2014. Elle est la seule bibliothèque parmi celles-ci. La convergence est donc en marche et vise à améliorer l’interopérabilité des données des différents acteurs de la chaîne du livre afin notamment de contribuer à la fiabilité des données sur le Web sémantique.

Parallèlement, dans le cadre des négociations des licences nationales pour des ressources électroniques[28], l’ABES construit un Hub qui doit recueillir les métadonnées des éditeurs fournissant des bouquets de revues électroniques et d’e-books [29]. L’ABES modélise, corrige et enrichit ensuite ces métadonnées pour pouvoir les convertir dans plusieurs formats (MARC, KBART, RDF) (Nicolas 2014).

Quelles sont les divergences ?

Les éditeurs et les bibliothèques produisent de nombreuses métadonnées qui sont de même type pour répondre à des fonctions très similaires mais ils utilisent des standards différents (tableau 3). Deux « silos » de métadonnées de livres coexistent : un silo des métadonnées ONIX produites par les éditeurs, les distributeurs et les intermédiaires de l’offre commerciale et un silo des métadonnées MARC produites par les bibliothèques. Une gestion efficace de cette production nécessiterait la création de passerelles entre ces deux chaînes de production. Selon Godby (2010), le mapping entre ONIX et MARC n’est pas simple du fait que les deux formats possèdent des syntaxes et des versions différentes. Le défi posé ainsi aux deux communautés est de pouvoir développer des outils qui soient capables de maintenir les relations entre les deux standards malgré les différentes versions, syntaxes ou règles de formatage. OCLC essaie de surmonter ces difficultés dans le cadre de son service proposé aux éditeurs Metadata Services for Publisher où des mappings sont assurés entre ONIX et MARC et vice-versa. Un tel service permettrait des économies de production et l’amélioration de la qualité de l’offre de chaque communauté.

Tableau 3

Standards de métadonnées utilisés par les éditeurs/diffuseurs et les bibliothèques

Standards de métadonnées utilisés par les éditeurs/diffuseurs et les bibliothèques

-> Voir la liste des tableaux

Par ailleurs, l’insertion dans le Web de données des métadonnées des bibliothèques n’est pas sans conséquence sur l’offre commerciale de métadonnées. Elle interroge certains acteurs commerciaux comme Electre qui peut craindre une concurrence directe du secteur public, surtout sur son marché des bibliothèques: « Il y a une tension entre Electre et BnF pour la mise en ligne des données en licence ouvert mais il y a une collaboration dans d’autres projets, les choses ne sont pas noires ou blanches. »[30] Des acteurs commerciaux comme Dilicom et TITE-LIVE sont au contraire des utilisateurs des métadonnées de la BnF surtout pour les autorités auteurs leur permettant d’assurer la qualité des métadonnées qu’ils produisent (Backert 2014, 7 novembre). L’ouverture sur le Web de données pourrait alors renforcer d’avantage la productivité de ces acteurs.

Positionnement des acteurs de l’offre

Le schéma 1 a pour objectif de synthétiser l’ensemble des acteurs opérant dans le champ de l’économie des métadonnées du livre ainsi que leurs interactions. La partie gauche du schéma rassemble les acteurs inscrits dans une économie marchande des métadonnées du livre alors que la partie droite rassemble les acteurs de l’économie non marchande adossée à des services publics. Le troisième cercle en bas de ce schéma rassemble de nouveaux entrants que sont les réseaux sociaux numériques et Google en particulier.

Schéma 1

Relations entre acteurs du marché

Relations entre acteurs du marché

-> Voir la liste des figures

En effet les éditeurs diffusent gratuitement les métadonnées soit directement via leur propre site Web, ou par l’intermédiaire d’autres acteurs de la chaîne du livre (librairies, sites de commerce en ligne et bibliothèques). Certains d’entre eux font appel à de nouveaux intermédiaires (tel que GiantChair) qui proposent des structurations en ONIX. On y trouve aussi les intermédiaires déjà établis qui se basent sur les métadonnées du Fichier Exhaustif de livre pour proposer aux libraires, aux plateformes de e-commerce des métadonnées en format ONIX et aux bibliothèques des métadonnées en format MARC. Cette offre de métadonnées agrégées, qualifiées et personnalisées est payante.

Les bibliothèques, acteurs publics de l’offre de métadonnées, reçoivent les métadonnées des éditeurs (via le dépôt légal à la BnF ou via le Hub de l’ABES); elles les enrichissent par l’indexation et par la réalisation des liens entre les différentes notices descriptives et autorités.

Google, le grand moteur de recherche sur le texte intégral reconnaît l’importance des métadonnées pour organiser l’accès au contenu numérisé. Les métadonnées sont utilisées pour l’identification des livres et la création de liens. Elles sont fournies à Google en format MARC par les bibliothèques partenaires du projet de numérisation ou en format ONIX par les éditeurs avec lesquels un contrat a été négocié. Google a une équipe d’indexeurs pour la gestion et la correction des métadonnées et débusquer les lacunes propres à chaque format (Luther 2009). Enfin, Babelio, réseau socionumérique du livre, est l’exemple d’un nouvel acteur producteur de métadonnées sociales (avis d’internautes, critiques de professionnels) émises par les lecteurs de son réseau et pouvant être intégrées dans les services de bibliothèques ou d’éditeurs. Le service Babelthèque permet ainsi aux bibliothèques d’enrichir leur OPAC (Online Public Access Catalog) et leur site Internet en important le contenu produit par les membres de la communauté de lecteurs Babelio.com[31].

L’avenir de l’économie des métadonnées du livre

La place de l’offre marchande

L’offre commerciale de métadonnées proposée par des intermédiaires devrait toujours se justifier, au travers l’avis recueilli des différents experts et au regard de la qualité qu’ils ajoutent aux métadonnées. Joël Faucihon fondateur de Lekti[32], fournisseur de services aux éditeurs indique : « La production des métadonnées est un lourd travail que beaucoup d’éditeurs, gros et petits n’ont pas le temps d’effectuer avec tout le sérieux que cela nécessite. » [33]. Selon le Baromètre 2014, 77 % des éditeurs français ne sont pas prêts de s’y investir. Philippe Beauvillard, directeur d’Electre, est convaincu de la valeur de l’offre des agrégateurs des métadonnées. Pour lui, « la production et le traitement des métadonnées constituent un métier en soi, les instances internationales encouragent les éditeurs dans tous les pays à se tourner vers les agences locales spécialisées dans la production et le traitement des métadonnées »[34]. Aussi pour les libraires, les métadonnées sont, selon Bernard Strainchamp, responsable de la librairie en ligne Bibliosurf, pénibles à récupérer, mal organisées et peu unifiées, cela nécessite un travail d’agrégation[35]. Cette agrégation est d’autant plus importante en raison de la diversité des formats de métadonnées. Des acteurs comme Electre et Decitre collectent des données hétérogènes venant de différents éditeurs dans différents formats (ONIX, Excel, papier). Ils les insèrent dans leur propre système, les normalisent, les enrichissent et les reconvertissent dans des standards, normes spécifiques. Ils délivrent des enregistrements en MARC, ONIX et XML. Le marché de métadonnées s’ouvre aussi à des nouveaux intermédiaires facilitant la production de certaines métadonnées à la source comme GiantChair ou Lekti.

Par ailleurs, les intermédiaires commerciaux pourraient également cibler leur valeur sur des services facilitant la visibilité internationale qui nécessite de catégoriser l’offre éditoriale en utilisant les nomenclatures spécifiques à chaque marché linguistique. Différents schémas de classification commerciale existent: BIC, BISAC, WGS ou Thèmes- CLIL dont les éditeurs ne maîtrisent pas l’utilisation. Les intermédiaires pourraient proposer des services de conversion d’un schéma de classification à une autre ou vers le schéma standard de classification Thema mis en place par EDiTEUR.

Vers une production complémentaire de métadonnées?

Le besoin d’une gestion efficiente des contenus publiés dans un marché global pousse les acteurs du livre à reconsidérer leurs pratiques en matière de métadonnées et à penser les synergies pour optimiser les échanges. Pour conclure, nous évoquons ci-après un scénario déjà perceptible dans lequel chaque acteur apportera sa valeur au sein de la chaîne de production des métadonnées.

Les métadonnées orientées oeuvre (éditeurs)

Pour le commerce du livre en ligne, les métadonnées constituent pour les éditeurs un enjeu de visibilité extrêmement fort et ils sont les mieux placés pour les produire dès la source. Les éditeurs français en sont conscients mais ils n’auront pas tous le savoir-faire nécessaire à la production de métadonnées de qualité (complètes, correctes, mise à jour, formatées à la demande), leur partenariat avec des sociétés telles que Dilicom, Electre ou de nouveaux intermédiaires tels que GiantChair, Lekti devrait s’affirmer. Un enjeu majeur concerne la transmission directe de ces métadonnées liées à l’oeuvre aux bibliothèques. Le service OCLC WorldShare travaille ainsi avec une cinquantaine d’éditeurs qui versent dans WorldCat les métadonnées des livres électroniques ainsi que les données holdings. Ensuite, un service de la plate-forme WorldShare assure que ces métadonnées sont automatiquement chargées dans le système de gestion de l’établissement acheteur. Selon une étude menée par l’ABES en 2014 :

L’acquisition des livres numériques par bouquet aura des conséquences sur le processus de catalogage : les métadonnées des fonds achetés sont livrées par les éditeurs aux bibliothèques. Cette procédure rend dans une large mesure superflue le catalogage manuel… La conséquence de ce déplacement de la production des métadonnées vers les éditeurs est que les systèmes de catalogage partagé s’orientent vers la possibilité de manipulation des flux des métadonnées.

Van der Graaf 2014, 26

Les métadonnées orientées autorité (bibliothèques)

Par ailleurs, les métadonnées produites par les éditeurs gagneront en qualité si elles se basent sur des référentiels et des vocabulaires d’autorité. Exposés en Linked Data et utilisés comme pivots dans des projets et applications, ils facilitent la recherche et la mise en relation des ressources. La BnF est ainsi une des quatre bibliothèques à l’origine du projet international VIAF, fichier d’autorité virtuel dont les données sont exposées librement en RDF[36]. De même, la BnF est l’un des six organismes fondateurs du consortium international ISNI (International Standard Name Identifier), un identifiant international des personnes et des sociétés qui participent aux domaines du livre, de la musique, du film, des publications scientifiques et académiques. Son adoption par les bibliothèques, les producteurs, les sociétés de gestion collective ou encore les éditeurs permettra l’échange d’information entre les différents secteurs d’activités. Les métadonnées publiques qui accompagnent l’ISNI seront de plus en plus exposées sur data.bnf.fr en RDF (Angjeli 2011). Les bibliothèques proposeront ainsi leur savoir-faire pour les fichiers d’autorités dans le cadre de leurs missions d’intérêt général.

Les métadonnées orientées recommandation (réseaux sociaux)

La recommandation s’avère une stratégie précieuse pour mieux capter l’attention des usagers dans une inflation d’offre de contenus. Les systèmes de recommandation bâtis sur des collectes de données variées se sont développés dans les secteurs du commerce en ligne, et tout particulièrement dans le secteur du livre, de la musique et des films… (Kembellec, Chartron 2014). Pour l’industrie du livre, la transformation de l’attention en intention de lecture ou d’achat est appuyée par des prescriptions personnelles opérées par des « pairs », des proches et par des professionnels de ces secteurs. Les recommandations automatisées calculées sur des données comportementales ou de contenu restent souvent insuffisantes, des avis plus qualitatifs de lecture sont plébiscités. Ainsi certains moteurs de recommandation culturel comme Babelio offre ce type de prescription sociale proposée par les membres de son réseau. De leur côté, les bibliothèques pourraient préférer produire leurs propres recommandations plutôt que de recourir à des services externes, si leurs usagers s’engagent activement à produire ces métadonnées sociales. Mais la question reste ouverte de savoir si ces recommandations élargies seront capables de valoriser la diversité des biens culturels ou si elles conduiront uniquement à renforcer la vente de produits déjà mis en avant.

Conclusion

La commercialisation du livre numérique nécessite la production de métadonnées de qualité. Même si certains éditeurs français commencent à s’y investir et créent des métadonnées offertes gracieusement à l’ensemble des acteurs de la chaîne du livre, leur pourcentage est encore modeste. L’offre marchande des intermédiaires reste plébiscitée. La valeur de leur offre réside dans l’agrégation, la qualité, l’enrichissement et la personnalisation de l’offre.

La chaîne de valeur des métadonnées du livre en France devrait se répartir en trois types d’activités principales : activités de production assurées majoritairement par les éditeurs (en interne ou en sous-traitance), activités d’enrichissement effectuées par les bibliothèques (liens et autorités) et les réseaux sociaux numériques du livre (recommandations sociales d’experts et de lecteurs) et activités d’agrégation et de personnalisation réalisées par des intermédiaires spécialisés. La réalité économique et les défis du numérique devraient encourager l’ensemble des acteurs à développer une vision globale pour une gestion efficace du workflow des métadonnées du livre, mutualisant les efforts apportés par l’ensemble des professionnels.