Quelques propos sur les outils et les méthodes audionumériques en musicologie. L’interdisciplinarité comme rupture épistémologique

Couprie, Pierre

doi:https://doi.org/10.7202/1068384ar

Introduction

Depuis la fin des années 1990, mes recherches portent sur le répertoire des musiques électroacoustiques. Ces musiques sont nées d’un ensemble de pratiques qui se sont cristallisées autour des années 1950 pour faire naître un genre musical très varié dont les oeuvres ou les performances ont en commun d’utiliser la technologie – électrique, électronique ou numérique – lors des étapes de la composition ou de l’interprétation/performance. Cela signifie que le compositeur ou le musicien manipule des données différentes de celles des autres traditions musicales partageant ou non des formes d’écritures. De plus, les compositeurs et les musiciens utilisant l’informatique ont des pratiques aussi très différentes entre eux ; cela concerne les logiciels, les instruments ou les interfaces, l’écriture d’une partition, le champ même de cette partition ou leur propre statut de musicien, de compositeur ou des deux. Ces différences impactent aussi très fortement le travail du musicologue. Celui-ci doit maîtriser l’usage des technologies et des logiciels utilisés par les artistes afin de pouvoir accéder aux ressources, fichiers et enregistrements qui constituent la base de son corpus. Cela ne signifie pas qu’il est plus facile pour un chercheur travaillant sur la musique électroacoustique de maîtriser les technologies nécessaires à la pratique de la musicologie numérique, c’est simplement indispensable.

L’objectif de cet article est de mener une réflexion épistémologique sur la pratique de la musicologie numérique ou computationnelle avec différents corpus audionumériques dont l’électroacoustique. Cette pratique tourne essentiellement autour de l’usage de méthodes d’analyses musicales permettant d’étudier des documents audiovisuels. De nombreux outils, méthodes et théories sont issus de ceux utilisés ou développés par les compositeurs. Ainsi les logiciels et les méthodes employés pour créer les oeuvres peuvent aussi servir pour les étudier dans une démarche inverse – une forme de rétro-ingénierie permettant de déconstruire l’oeuvre – ou pour réaliser des modélisations en utilisant ou non les mêmes matériaux que les compositeurs. De même, les théories développées par les artistes pour produire leurs oeuvres, travailler avec leurs étudiants ou simplement formaliser leur pensée peuvent aussi servir pour l’analyse musicale.

Une première étape portant sur l’apprentissage des pratiques individuelles des compositeurs et des musiciens est nécessaire au travail du musicologue, toutefois elle rend bien souvent plus difficile des approches musicologiques différentes comme le comparatisme, l’étude de répertoires dont les sources sont absentes ou l’étude des pratiques performatives basées sur l’improvisation. Dans ces domaines, le musicologue est bien souvent freiné par l’absence d’outils qui permettraient de faciliter son travail ou de méthodes qui lui ouvriraient une voie de recherche. Il peut bien évidemment déporter sa recherche en s’intéressant à l’artiste lui-même dans une visée sociologique ou sur les dispositifs utilisés dans une visée technologique. La solution qui m’a semblé la plus féconde – probablement aussi la plus complexe, car tout reste à inventer – m’a engagé dans une pratique de la musicologie numérique à travers l’analyse musicale. Or, je vais montrer comment cette pratique est profondément différente de celle portant sur les objets traditionnels de la musicologie, à savoir les partitions, les textes et les images. C’est la raison pour laquelle cet article commence par situer cette différence dans la musicologie à travers la question de l’hybridation des disciplines, c’est-à-dire de ce que l’on nomme plus communément l’interdisciplinarité[1]. Dans un deuxième temps, j’exposerai ce qui constitue le coeur de l’interdisciplinarité des musicologies numériques et computationnelles pour ensuite donner quelques exemples concrets situés dans l’étude des documents audionumériques.

Derrière ces questions musicologiques se pose bien évidemment celle d’une modification épistémologique profonde et je vais tenter de montrer qu’elle constitue pour moi une véritable rupture. Les catégories et méthodes utilisées traditionnellement dans la musicologie ne peuvent plus être appliquées à ces nouveaux objets.

Musicologie et interdisciplinarité

L’objectif ne sera pas ici de définir le champ épistémologique de l’interdisciplinarité et encore moins celui de l’interdisciplinarité appliquée à la musicologie – le sujet mériterait une longue discussion qui dépasse très largement le format de cet article –, mais plutôt d’introduire l’interdisciplinarité au regard de ma pratique de recherche.

Interdisciplinarité et hybridation

Si l’interdisciplinarité est au « fondement de la constitution de toute discipline » (Resweber 2011, p. 171), les recherches réellement interdisciplinaires peuvent sembler relever d’une forme d’idéalisation (Kasavin 2008, p. 44), voire d’une certaine utopie. En effet, cette pratique qui consiste à faire travailler ensemble des scientifiques provenant de domaines différents sur une même thématique pour ensuite permettre le réinvestissement des résultats dans chaque discipline est assez complexe à mettre en oeuvre. Ma pratique de l’interdisciplinarité est un peu différente de celle prônée par de nombreux écrits sur le sujet. Bien sûr, j’ai collaboré avec des collègues de différents domaines lors de projets de recherche, mais il est vrai que l’interdisciplinarité qui m’a le plus apporté est celle que j’ai construite dans mes propres recherches. En 2010, Jean-Claude Risset soulignait que l’interdisciplinarité consiste bien souvent à s’asseoir entre deux chaises, à « galérer » (Risset 2010, p. 1) et Barthes écrivait dans les années 1980 que « l’interdisciplinarité n’est pas de tout repos » (Barthes 1984, p. 69). Toutefois, comme le souligne Risset à propos de l’association entre la musique et l’informatique, la démarche interdisciplinaire « est fructueuse pour la recherche » (Risset 2010, p. 1). De même les philosophes Michel Serres, Edgar Morin ou Jean-Michel Besnier n’ont eu de cesse de défendre le mélange, l’échange (Serres 1992, p. 44) et l’hybridation des disciplines (Morin 1994), voire l’indiscipline et le désordre dans sa dimension créatrice d’innovations scientifiques (Besnier 2013).

Mais qu’en est-il pour la musicologie ? Elle a finalement toujours été une interdiscipline associant histoire, philosophie, esthétique, analyse, etc. L’ethnomusicologie lui a apporté le regard de l’anthropologie et plusieurs autres disciplines l’ont enrichie comme la didactique, la sociologie, l’archivistique ou la psychologie cognitive. L’apport des sciences exactes, à travers l’informatique, l’acoustique, les mathématiques, lui a donné des méthodes qui ont contribué à l’émergence de nouveaux champs de recherche dans les domaines de la lutherie, des performance studies, de la théorie musicale ou de l’intégration de nouveau corpus. Comme le souligne Jean-Jacques Nattiez, le phénomène musical ne peut désormais plus être étudié à travers une seule approche ; il prône ainsi une « musicologie générale » ouverte et sans limites dans ses investigations (Nattiez 2007, p. 1205-1206). Pierre Schaeffer fut probablement le premier à concevoir une recherche musicale interdisciplinaire au sein du service de la recherche de la rtf puis de l’ortf dès 1960. Il y dirigea une équipe de plus d’une centaine de personnes réparties en quatre groupes qui seront particulièrement productives aussi bien sur le plan de la création audiovisuelle que sur celui de la recherche théorique en considérant la musique comme une expérience humaine (Schaeffer 1971). Le modèle proposé par Schaeffer sera très fécond en inspirant la création de nombreux centres de recherches – comme les centres nationaux de création musicale (cncm) en France – ou la pratique de la recherche-création.

De la « critical musicology » intégrant d’autres disciplines des sciences humaines à la « musicologie générale » en passant par la « musicologie postmoderne » (Scott 1998, p. 114-115), il semble que le chercheur ne puisse plus faire l’économie de nouvelles questions qui nécessitent bien souvent une expertise dépassant très largement le champ de ses compétences. Toutefois, pour en faire une interdiscipline, voire une discipline hybride, qui trouve bien souvent son origine dans l’intégration de nouveaux corpus, la musicologie ne peut que difficilement se contenter de l’usage de méthodes externes pour envisager aussi une redéfinition de ses propres méthodes de travail, voire de sa nature même (Cook 2005, p. 2).

Les recherches musicologiques sur la création contemporaine nécessitent bien souvent un élargissement vers d’autres domaines scientifiques. Le compositeur et sa partition ne peuvent plus être seuls au centre des recherches ; l’acte créatif est plutôt à envisager comme un acte collectif. Prendre en compte l’aspect social d’une création musicale est une direction de recherche possible. Une autre direction, qui consiste à remonter l’acte de création dans le sens inverse, est couverte par plusieurs domaines comme la génétique musicale ou, plus largement, le processus créatif et la recherche-création. Si les deux premiers se contentent finalement de remonter l’histoire de la création ou de déconstruire le procédé complexe qui est à l’origine de l’acte créatif dans ses diverses directions (historique, philologique, analytique et sociologique), la recherche-création – que l’on associe souvent à tort à une vague volonté de rendre scientifique l’acte créatif (Stévance et Lacasse 2013, p. 17) – se situe plutôt dans un dialogue fécond entre la recherche et la création au sens large. Dans ce sens, la recherche-création prend aussi bien en compte le travail du compositeur que celui de l’interprète, du réalisateur en informatique musicale, et de tous les acteurs d’une création, d’une interprétation, d’une performance ou d’une improvisation, dans une visée de partage des connaissances. Cette vision de la recherche qui articule le savoir au savoir-faire artistique et à l’expérience esthétique peut être rapprochée de la notion de « science impliquée » dans laquelle l’activité de recherche est contextualisée et portée par des collectifs d’humains (Coutellec 2015, p. 18). Sur le plan des mélanges disciplinaires, ces recherches se situent plutôt dans une forme d’interdisciplinarité focalisée (Charaudeau 2010) et allient la part artistique de la création tournée vers l’expérience esthétique et le partage d’un savoir-faire, la part non scientifique de la recherche musicale concernant les savoirs empiriques non formalisés et la part scientifique de la musicologie obéissant à une possible réfutabilité (Popper 1973, p. 38) et à une reproductibilité des expériences.

Musicologie numérique

La pratique de l’interdisciplinarité en musicologie entre en parfaite résonance avec la musicologie numérique ou computationnelle. La création musicale a probablement été la première à investir ce nouveau champ de recherche dès les années 1970[2]. Il comprend deux types d’activités assez différentes :

La première concerne l’usage de ressources et d’outils numériques permettant de mener une recherche à l’aide de méthodes bien identifiées. Les musicologues cherchent avant tout à améliorer leurs méthodes de classification, d’étude historique ou d’analyse des oeuvres et de profiter d’une masse de ressources disponibles importantes pour les généraliser à de vastes corpus, voire transférer certaines méthodes vers de nouveaux corpus.
Le second ensemble d’activités scientifique, que l’on pourrait nommer « musicologie computationnelle » regroupe des recherches visant à créer de nouvelles méthodes et de nouveaux outils permettant d’explorer des champs de recherches encore peu ou pas développés. Ces recherches nécessitent bien souvent de modifier la nature même de la pratique musicologique : les corpus d’étude peuvent être différents, il peut être nécessaire de redéfinir les standards de notation, de remettre en question le formalisme de certaines théories musicales, d’intégrer des méthodes particulièrement éloignées de l’objet musical, etc.

Ces deux types d’activités ont bénéficié ces dernières années de la constitution d’importantes bases de données contenant des ressources textuelles, iconographiques ou audiovisuelles (Selfridge-Field 2017). Elles font appel à de nombreuses méthodes pouvant être regroupées dans trois directions différentes :

L’étude de ressources symboliques[3] constituées ou non en bases de données. L’analyse computationnelle de corpus de partitions est un champ très important de cette direction de recherche, mais nous trouvons aussi les travaux sur l’étude de textes[4] ou d’images[5]. Les chercheurs utilisent certaines techniques provenant de la recherche d’information musicale ou music information retrieval (mir) pour naviguer, catégoriser ou analyser ces corpus. Il s’agit aussi de créer de nouveaux corpus numériques en utilisant les techniques de reconnaissance optique de la notation musicale, optical music recognition (omr), ou de créer des jeux de données (ground truth dataset ou, plus simplement, dataset), qui seront utilisés par les développeurs et les scientifiques pour éprouver leurs algorithmes.
Avec le développement très important des travaux sur l’extraction d’informations à partir du signal audio, les techniques provenant des mir et utilisant les descripteurs audio est utilisée en musicologie depuis le début des années 2000. Les études sur l’interprétation et dans le domaine des performance studies exploitent fortement ces techniques pour mettre en évidence des corrélations entre les paramètres d’analyse audio[6] ou réaliser des études comparatives à grande échelle sur des corpus spécifiques[7].
Enfin, la dernière direction de recherche touche un ensemble de méthodes autour de la création au sens large[8] et relevant de pratiques assez variées allant de la pédagogie à l’archivistique[9] en passant par la diffusion, la préservation[10], la lutherie ou la modélisation des oeuvres[11]. Dans cette direction profondément interdisciplinaire, les chercheurs sont généralement amenés à développer de nouveaux outils permettant de réinvestir dans la création les avancées de la recherche musicologique.

Ces trois directions ne sont bien évidemment pas étanches. Les études sur la création musicale bénéficient d’ores et déjà des avancées des techniques de mir sur les fichiers audio. Mais un dialogue plus avancé sera peut-être aussi à la source d’innovations plus importantes dans les années à venir. Ainsi, l’extraction de paramètres musicaux permettant la synchronisation automatique de fichiers audio et de partition, l’utilisation de techniques d’apprentissage machine pour l’aide à la segmentation de fichiers, à l’analyse de la forme ou du style musical, l’apport des nouveaux développements informatiques pour l’étude de la création pourraient ouvrir de nouveaux champs de recherche musicologiques. C’est ce que soulignait déjà Cook en 2005 à propos de l’utilisation de données audio (Cook 2005, p. 5).

Toutefois, si les premières bases de données réalisées pour la musicologie datent des années 1970 (Urberg 2017, p. 137), force est de constater que la pratique des musicologies numériques et computationnelles est très jeune et très éparse. Les domaines des sciences exactes ont depuis longtemps intégré dans leurs programmes d’enseignement certaines disciplines des sciences humaines. C’est encore très loin d’être le cas des formations musicologiques en France qui ne proposent que très rarement des cours de programmation informatique ou d’acoustique. Le voeu pieux de Cook en 2005 n’a donc pas été réellement exaucé. Les recherches qui permettraient de produire une avancée majeure en musicologie restent cantonnées à une poignée de chercheurs éparpillés dans quelques laboratoires et universités. Les programmes de recherches actuels permettant de favoriser l’interdisciplinarité entre les sciences humaines et les sciences exactes sont une avancée importante, mais transformer ce qui apparaît plus comme un phénomène de mode en une réelle volonté de travailler en interaction – probablement le seul moyen d’innover dans la science musicologique – nécessitera beaucoup de transformations dans les formations universitaires et l’organisation des laboratoires de recherche.

Outre l’incompréhension de vocabulaire, de théorie et de méthode qui peut exister entre des chercheurs de domaines différents, la pratique de l’interdisciplinarité en musicologie se heurte bien souvent à plusieurs freins. Le premier d’entre eux concerne le temps de la recherche. Les projets musicologiques nécessitent généralement un temps plus important. Ce n’est pas un jugement de valeur, mais l’étude des sources musicales demande bien souvent un travail manuel et une interprétation longue et fastidieuse[12]. Le deuxième frein concerne le manque de formation des musicologues en sciences exactes. Par exemple, les outils développés en acoustique et en informatique sont généralement inutilisables par le chercheur en sciences humaines[13]. Il conviendrait donc de réaliser des logiciels – même simples – qui puissent réellement être manipulables par les musicologues[14]. Enfin, et ce dernier frein est lié au précédent, l’obsolescence et la fragmentation des technologies développées dans le cadre de projets interdisciplinaires ne favorise pas la reproductibilité ou le transfert de méthodes sur des corpus ou des domaines différents. Il faudrait donc créer des espaces d’interdisciplinarité avec des formations communes, des outils communs et des plateformes d’échange adaptées aux compétences de chacun.

Si ces questions sont au coeur de certaines recherches, elles restent bien souvent étrangères à la grande majorité des musicologues. Avant de présenter quelques exemples, il convient de revenir sur la définition de la musicologie numérique. Pour certains chercheurs, la simple utilisation d’un logiciel – par exemple un éditeur de partition – dans un contexte musicologique relève de la musicologie numérique. Il s’agit ici d’un lien d’usage. Or, la science ne se caractérise pas par ses usages, mais par ses objets, ses méthodes et ses questions (Bachelard [1938]2011, p. 16).

Enfin, il est une question qui apparaît en creux depuis le début de l’article : elle concerne les nouveaux outils, les nouvelles méthodes et les nouveaux corpus. La pratique de l’interdisciplinarité à travers la musicologie numérique me semble relever d’une réelle rupture épistémologique lorsqu’elle s’attaque à ces nouveaux objets. Le chercheur ne peut plus seulement adapter les méthodes de la musicologie traditionnelle à ces corpus numériques[15] qui apparaissent comme « a-musicologiques » (Bonardi et Rousseaux 2011), mais imaginer de nouvelles méthodes pour une musicologie étendue.

Quelques exemples d’analyse musicale à partir de fichiers audionumériques

Les technologies

La majeure partie des logiciels utilisés en musicologie provient d’autres champs disciplinaires. La figure 1 présente les principales technologies employées dans le domaine de l’analyse musicale. Elles sont réparties en deux catégories principales : à gauche, les logiciels permettant de travailler sur des données de type symbolique (partition, midi et autres codages de notes) et, à droite, les logiciels acceptant des données audio. Certains d’entre eux appartiennent aux deux catégories. Les logiciels développés spécifiquement pour la musicologie apparaissent entourés en gras, les autres technologies proviennent de l’acoustique, de l’analyse et du traitement de la parole ou de la création musicale. Les principales méthodes, en ovales grisés, peuvent être réparties en quatre catégories : l’analyse computationnelle de données symboliques, l’extraction d’informations du signal audio (mir), la visualisation de données et d’informations, l’annotation et la création de représentations musicales[16]. Si l’analyse computationnelle de données symboliques a été un des principaux domaines d’études depuis le milieu des années 1970, des domaines comme ceux basés sur les techniques de mir ou la réalisation de représentations musicales efficaces en musicologies restent encore très largement inexplorés.

L’usage de cette galaxie de logiciels révèle un certain nombre de difficultés lors de la pratique de la musicologie numérique. La principale semble être celle de l’échange de données entre ces différentes technologies. Quelques formats ont été mis en avant par la recherche comme Musicxml, mei (Music Encoding Initiative) issu du tei (Text Encoding Initiative), sdif (Sound Description Interchange Format) ou les formats basés sur une structuration sémantique de type owl/rdf[17] (Web Ontology Language/Resource Description Framework). Toutefois, ils restent pour la plupart très difficiles à utiliser par les musicologues[18] et leur focalisation sur la temporalité d’une oeuvre (excepté pour owl/rdf) ne favorise pas les études diachroniques, comparatives ou hors temps qui sont à la base de nombreuses méthodes d’analyse musicale. Une autre difficulté réside dans l’obsolescence et la très grande fragmentation entre les logiciels et les technologies. Passer d’un logiciel à l’autre est bien souvent compliqué[19].

Dans le développement du logiciel d’aide à l’analyse musicale iAnalyse, j’ai choisi de travailler à contre-courant des pratiques généralement utilisées dans le domaine de la recherche. Le fait d’être seul à gérer à la fois la partie musicologique et les parties informatiques et acoustiques m’a permis de résoudre une grande part de ces difficultés. iAnalyse représente 13 années de développement (de 2006 à 2019) et pouvoir prendre le temps d’expérimenter des méthodes d’analyse musicale et de les transposer dans un logiciel utilisable par tout musicologue a été un avantage très important qui a probablement été à la source du succès du logiciel.

Les méthodes

L’objectif n’est pas de décrire l’ensemble des possibilités apportées par ces technologies, mais plutôt d’exposer quelques exemples dans lesquels l’apport de l’informatique nécessite une modification en profondeur des compétences du musicologue. Pour ce faire, je vais me concentrer sur les méthodes utilisées en analyse musicale réalisée à partir de fichiers audionumériques, elles suivent toujours les mêmes étapes :

L’extraction d’informations du fichier audio : cette étape est prise en charge par le logiciel de lecture – à travers la visualisation d’une forme d’onde ou d’un sonagramme – ou réalisée par une extraction de descripteurs audio[20]. L’amplitude se visualise sur la forme d’onde qui représente le signal audio ou à partir de descripteurs comme l’amplitude rms[21] ou le loudness. Les descripteurs peuvent être regroupés en trois catégories (Magas et al. 2013, p. 12) :
1. Les descripteurs de bas niveau calculés sur des fragments très courts du signal et dont les algorithmes sont suffisamment robustes pour produire des résultats fiables (par exemple l’amplitude rms ou la brillance spectrale) ;
2. Les descripteurs de niveau moyen permettant d’extraire des informations dans l’espace de hauteurs (fréquence fondamentale, inharmonicité) ou sur le plan temporel (pulsation). Les algorithmes utilisés sont moins robustes[22] que les précédents, mais l’interprétation est plus facile pour le musicologue ;
3. Enfin, les descripteurs de haut niveau permettant de caractériser des données perceptives ou sémantiques (émotion, rythme, tonalité, harmonie, genre musical). Ici aussi, les algorithmes utilisés sont moins robustes et dépendent fortement des corpus.
Le calcul de coefficients à partir des informations extraites du fichier audionumérique : cette étape optionnelle permet d’obtenir des données issues de méthodes statistiques comme la corrélation[23], l’écart-type[24], la déviation, les différents types de moyennes[25], etc.
La visualisation des informations extraites précédemment : de la même manière, cette étape est réalisée automatiquement par le logiciel de lecture audio ou manuellement avec des technologies d’analyse acoustique ou d’analyse de données. Certaines visualisations sont particulièrement efficientes pour la musicologie, car elles permettent de relier facilement les valeurs extraites du signal à des paramètres d’analyse musicaux comme la morphologie, la structure, le timbre, la variation d’intensité, les variations de tempi ou d’écoulement temporel, etc. Cette étape est habituellement négligée et les représentations utilisées sont celles fournies par les logiciels avec des réglages par défaut. Or, il est essentiel d’élaborer des représentations personnalisées qui permettront d’éviter de fausses interprétations ou passer à côté d’informations pertinentes[26].
L’interprétation des résultats, l’analyse et la création de représentations musicales : cette étape, purement musicologique, peut être déployée sur les visualisations réalisées dans l’étape précédente à l’aide d’annotations ou nécessiter la création de représentations musicales ad hoc facilitant l’analyse. L’utilisation de compositions de représentations permet d’interpréter, de formuler des hypothèses ou de mettre en évidence des corrélations entre plusieurs données extraites du signal audionumérique et des paramètres de l’analyse musicale.

Ces étapes mettent non seulement en évidence l’interaction entre plusieurs domaines de compétences très éloignés les uns des autres, mais aussi et surtout une profonde rupture de méthode en musicologie, ce qui me semble être une rupture épistémologique. L’audio est très difficile à étudier sans un support visuel, c’est particulièrement le cas avec la création contemporaine ou avec des enregistrements de longue durée. Il faut donc passer par des représentations, toujours imparfaites, qui seront à la base du travail d’analyse. Or, la lecture même du fichier audionumérique et ses représentations ne sont que des interprétations, des médiations technologiques pour lesquelles il est impossible de vérifier la fidélité (Bachimont 2013, p. 26). De plus, les représentations ne sont généralement pas musicales : la forme d’onde n’est qu’une vague représentation de l’intensité sonore, le sonagramme n’est qu’une estimation approximative du contenu spectral ou le descripteur de barycentre spectral n’est qu’une représentation de la « brillance », particulièrement difficile à traduire musicalement. Avec l’étude de fichiers audionumériques, le musicologue navigue donc dans des données très approximatives pour lesquelles il va devoir construire les outils et les méthodes permettant de révéler leurs qualités musicales.

La visualisation de données

Certaines données issues de l’extraction de descripteurs audio (étape 1) ou de calculs qui sont réalisés ensuite (étape 2) sont donc difficiles à interpréter pour le musicologue. Comme je viens de l’exposer, d’une part, elles sont assez éloignées des informations musicales et, d’autre part, leur interprétation peut être délicate, car sujette à caution. Il faut donc bien veiller aux représentations qui vont servir de base à l’analyse. Outre les représentations habituellement utilisées en statistiques comme les graphes, les histogrammes, les nuages de points, etc., certaines visualisations sont particulièrement adaptées à la musicologie. J’en présenterai brièvement deux que le lecteur retrouvera dans la partie suivante.

La brightness standard deviation (BStD), proposée par Mikhail Malt et Emmanuel Jourdan (Malt et Jourdan 2015), est basée sur une représentation de type flux dans laquelle deux ou trois descripteurs autour de la brillance spectrale (barycentre ou rolloff) sont associés pour ne former qu’une seule courbe et mettre en évidence l’évolution de certaines qualités sonores qui entrent dans la qualification du timbre ou de la couleur spectrale (figure 2).

Les courbes de flux comme la BStD facilitent l’interprétation et la corrélation de données différentes.

Les matrices d’autosimilarité mettent en évidence les structures sous-jacentes aux données. Elles ne représentent pas les valeurs, mais leurs similarités, c’est-à-dire, la distance qui les sépare. Le calcul est réalisé en deux ou trois étapes (figure 3). La première consiste à calculer les distances entre chaque valeur d’une courbe (A) et à les inscrire dans une matrice (B). La diagonale (B en gris) représente la distance 0 qui existe entre les valeurs et elles-mêmes. La matrice obtenue contient un nombre très important de valeurs qu’il est impossible d’interpréter ; la deuxième étape consiste donc à convertir les valeurs en couleurs (C), généralement en niveau de gris. On obtient ainsi une matrice colorée (D) dans laquelle il est facile de repérer des regroupements autour de point, de zones ou sous la forme de lignes. Une troisième étape peut consister à colorer cette matrice en fausses couleurs, à la manière de ce que l’on pratique dans l’imagerie médicale, afin de pallier les problèmes de perception liés à l’usage de niveaux de gris (Ware 2000, p. 129).

La matrice d’autosimilarité sera très efficace pour aider à l’analyse de structures ou à la navigation dans des fichiers longs. Il est aussi possible d’utiliser des matrices de similarité pour comparer des données différentes, par exemple issues d’enregistrement audio de plusieurs versions d’une même oeuvre[27].

Trois exemples[28] de visualisation de données extraites du signal audio

Les étapes d’extractions de descripteurs et de calcul de coefficients découpent le fichier audionumérique en fragments qui peuvent ensuite être analysés à leur échelle. Un des objectifs de l’analyse musicale est de mettre en relation des objets/morphologies/saillances/structures locales aux macrostructures ou aux formes de plus haut niveau. Ce couple objet/structure décrit par Schaeffer (Schaeffer 1966, p. 277-278) représente une approche ascendante (bottom-up) essentielle pour retrouver l’objet musical présent dans les microstructures. Toutefois, cette démarche, basée sur une pensée réductionniste, ne permet pas d’envisager une étude de la complexité musicale dans son ensemble. C’est la raison pour laquelle, je place mes recherches dans une pensée systématique plus à même de fournir des concepts et méthodes sous-tendant la création de représentations musicales complexes. Je propose ainsi des « macroscopies musicales », en référence à Joël de Rosnay (Rosnay 1975), qui offrent une visualisation du sonore et du musical à plusieurs niveaux.

La figure 4, comme la suivante (figure 5), contient plusieurs représentations ou des représentations composites. Certaines sont directement extraites du signal, comme la double courbe d’amplitude présente en bas de la figure 4. Les deux autres visualisations au-dessus (la courbe noire et la matrice d’autosimilarité calculée à partir de cette courbe) représentent la déviation entre les deux courbes et la similarité de cette déviation. L’objectif est ici d’analyser les différences entre les deux canaux audio (gauche et droite) afin de les mettre en perspective avec la forme musicale globale. Une des particularités musicales de ce morceau des Pink Floyd est de jouer sur une alternance entre des moments présentant une image stéréophonique très stable (deuxième moitié de la figure 4 avec une courbe de déviation ne présentant que des oscillations très réduites) et d’autres moments beaucoup plus mobiles (première moitié de la courbe présentant de fortes oscillations).

Dans cet exemple, les trois représentations sont complémentaires, mais la matrice d’autosimilarité (en haut) offre une visualisation très fine des variations dans la déviation des canaux – indiquée par les couleurs des ligne verticales – donnant des indices sur sa rythmique propre. Les étapes de travail du musicologue sont en quelque sorte résumées dans cette représentation : la forme d’onde (ici absente) → la superposition des courbes d’intensité pour mieux visualiser leur corrélation (courbes du bas) → le calcul de la déviation (courbe du milieu) → le calcul de la matrice (en haut) pour faciliter l’interprétation. Ce mode de travail qui consiste à préciser progressivement les points de relation entre les données se retrouve aussi sur la figure 5. L’objectif est ici de comparer trois interprétations du Prélude à l’après-midi d’un faune (Debussy 1894a, 1894b, 1894c). La création de BStD a permis de mettre en évidence les différences sur les plans du déroulement temporel, de l’amplitude et du contraste de certaines qualités du timbre. Les lignes verticales présentant les positions des chiffres de la partition ont ensuite été ajoutées manuellement et les variations temporelles ont été accentuées par le dessin de rectangles colorés.

Les figures 4 et 5, au-delà de l’information et des indices directement utilisables en analyse musicale, sont caractéristiques d’une méthode scientifique dans laquelle chaque étape est construite en fonction du but à atteindre – analyse de l’espace ou comparaison d’interprétations. Du choix des descripteurs jusqu’au design graphique (types de représentation, couleurs, annotations) en passant par l’élaboration de chacun des graphiques, le musicologue se doit de maîtriser l’ensemble des étapes afin de travailler sur des outils méthodologiques fiables. De plus, ces représentations sont reproductibles[29] et donc réfutables par les autres chercheurs.

La dernière représentation (figure 6) permet de mesurer la force de certains graphiques alliant concision et précision dans les détails. Les matrices d’autosimilarité sont particulièrement efficaces pour l’analyse de structures ou de formes musicales. Le fil de la vie de Pierre Henry est une oeuvre de plus d’une heure créée en 2012 dans laquelle le compositeur se remémore ses sons et créations du passé : « Je marche lentement sur ce fil qui se déroule depuis trois quarts de siècle, mes yeux rampent chaque jour sur les milliers de morceaux analogiques à la recherche du “thème de la durée” » (Henry 2012, p. 5). L’oeuvre est particulièrement ardue à analyser pour plusieurs raisons. La première est simplement le fait qu’elle soit électroacoustique et donc composée à partir de sons complexes qui rendent la mémorisation très difficile. C’est une oeuvre dans laquelle il est très facile de se perdre lors de l’écoute. La deuxième raison est qu’elle contient un nombre important de références aux sons habituellement utilisés par le compositeur et aux oeuvres de sa carrière. Cette mosaïque de références ou de presque références, véritable jeu de palimpsestes, rend très difficile à suivre ce fil de la vie. La troisième apparaît dans la thématique de l’oeuvre : elle semble contenir l’ensemble d’une pensée créatrice sans qu’il soit possible d’en dénouer les éléments. La figure 6 offre une représentation complète de l’oeuvre calculée à partir d’une transformation de Fourier rapide (fft) ; le musicologue bénéficie ici d’un outil facilitant l’identification des parties et la navigation entre elles[30] en observant les motifs de chaque bande verticale pour en extraire les similarités. Les indices et les saillances apparaissent aussi bien au niveau de la forme que des structures plus fines à partir d’une étude audiovisuelle de cette macroscopie musicale. En comparant les différentes formes graphiques, il est possible de faire une première hypothèse quant à la forme globale (bande colorée en haut de la figure 6). Cette segmentation doit ensuite être confirmée ou non par l’écoute.

Cette démarche associant la visualisation à l’écoute offre un progrès par rapport à l’écoute instrumentée qui est habituellement pratiquée par le musicologue. Les visualisations apportent bien plus d’informations qu’une forme d’onde ou un sonagramme. Elles provoquent et inquiètent l’écoute[32] en poussant le musicologue à comprendre les similarités et dissimilarités qui ne semblent pas se confirmer à l’oreille. Cette part empirique du travail musicologique nécessite ensuite une formalisation plus précise afin de servir dans l’étude d’un large corpus.

Conclusion

Ce court article n’avait pas pour vocation de proposer une liste exhaustive de méthodes en musicologie numérique sur l’objet audiovisuel. Si la musicologie a toujours été interdisciplinaire, l’apport de l’informatique pousse le chercheur dans des retranchements jusqu’ici inexplorés. L’étude d’un fichier audio n’a que peu de rapport avec celle d’une partition, d’un texte théorique ou d’une image. De même, l’objet musical présent sur l’enregistrement est fort éloigné de cette symbolisation réduite que présente la partition. En cela, le fichier audio est très proche de la performance musicale, un objet temporel fuyant, parfois complexe et insaisissable sur certains corpus. J’ai tenté une démonstration des enjeux de l’étude de ces corpus dans lesquelles l’audio est la première source, que ce soit dans le domaine des musiques électroacoustiques de support, des interprétations enregistrées ou créées pour l’édition phonographique ou des enregistrements de terrain réalisés en ethnomusicologie. Le musicologue se trouve confronté à un dilemme : tenter d’appliquer à ce nouvel objet les méthodes éprouvées sur les partitions et les sources traditionnelles ou chercher une nouvelle approche méthodologique au risque de perdre la lisibilité de sa recherche en déportant son activité du noeud central de la musicologie – si tenté qu’il existe – vers ses frontières, voire vers d’autres noeuds extérieurs. Dans ma démarche, après avoir tenté, comme d’autres chercheurs, un transfert de méthodes peu satisfaisant, j’ai réalisé que l’étude des textes documentant la création ne faisait qu’effleurer le phénomène musical et j’ai plutôt choisi la seconde option en déportant ma recherche vers une démarche interdisciplinaire forte, c’est-à-dire en intégrant des méthodes profondément éloignées des sciences humaines, mais très proches de mon objet d’étude. Outre l’avantage d’être passionnante, comme le souligne à juste raison la conclusion de l’article de Jean-Michel Besnier (Besnier 2013, p. 30), cette indiscipline, particulièrement créative, résonne pour moi comme une rupture épistémologique. Comme le signalait Cook en 2005, intégrer ces nouveaux outils en musicologie nécessite non plus seulement de changer de méthode de travail, mais surtout de modifier en profondeur la nature même de son propre travail de chercheur (Cook 2005, p. 2). Cette modification de nature nous conduit à défricher des pistes qui nous réservent beaucoup de surprises et nous rapproche un peu plus d’une musicologie créative.

Quelques propos sur les outils et les méthodes audionumériques en musicologie. L’interdisciplinarité comme rupture épistémologique

Résumé

Abstract

Introduction