Article body

Le problème du son est-il en train de devenir « l’endroit où les choses se passent » dans le cadre de la réflexion sur le cinéma ? Non seulement les travaux concernant cette question se multiplient, renouvelant considérablement le sujet, mais ils ont d’ores et déjà conduit à plusieurs propositions de redéfinition de l’histoire du cinéma. Ainsi, dans Une archéologie du cinéma sonore, Giusy Pisano (2004, p. 4) revendique-t-elle une histoire « problématique, non point événementielle, mais discontinue et hétérogène, qui se propose sans cesse d’élargir les champs […] ». Édouard Arnoldy (2004) plaide, lui, « Pour une histoire culturelle du cinéma ». Dans Silent Film Sound, Rick Altman (2004, p. 7) est encore plus catégorique : « Today we are beginning to understand the need for nothing less than an entire redefinition of film history, based on new objects and new projects. » Le son est bien évidemment l’un de ces nouveaux objets.

L’ouvrage d’Alain Boillat s’inscrit dans ce mouvement avec une double originalité ; d’une part, Boillat centre ses réflexions sur les « manifestations vocales » du son, ce qui n’est pas si fréquent, même si les choses sont en train de changer [1], d’autre part, il vise non pas à renouveler l’histoire du cinéma, mais la théorie. Encore ne faut-il pas se méprendre : vouloir renouveler la théorie ne veut pas dire se désintéresser de l’histoire et réciproquement ; la différence n’est qu’une question d’angle d’approche : dans les ouvrages précédemment cités, il s’agissait de renouveler la théorie de l’histoire ; pour Boillat, il s’agit de mettre en évidence « les conséquences théoriques de l’analyse historique » (p. 484) pour mieux comprendre le fonctionnement communicationnel du cinéma.

*

Le champ couvert englobe toutes les manifestations vocales au cinéma sauf la voix spectatorielle (François Albera le note dans sa préface). Personnellement, je pourrais certes regretter qu’il ne dise rien du fonctionnement de la parole dans le film de famille, mais il me semble qu’après tout, ce serait sans doute plutôt à moi de traiter ce sujet. On aurait d’ailleurs bien mauvaise grâce à reprocher ces omissions à l’auteur vu la taille déjà très impressionnante de l’ouvrage et toutes les questions qui y sont brassées. La documentation historique sur laquelle s’appuie Boillat est sans faille ; la liste des références théoriques ne l’est pas moins. Le texte se caractérise par un souci rare de la nuance et de la précision dans la discussion avec les chercheurs qui ont abordé les questions qui y sont étudiées, au risque, parfois, d’entraîner certaines longueurs et de perdre un peu le lecteur. Il témoigne également d’un goût marqué de son auteur pour les typologies (Metz aurait sans doute adoré) et pour les grilles d’analyse fonctionnant sur le modèle de la liste de questions à se poser. Le résultat est la production d’une quantité incroyable d’outils qui constitue assurément l’un des apports majeurs de l’ouvrage. Quant aux réflexions théoriques elles-mêmes, elles manifestent une volonté obstinée de faire jouer les notions les unes par rapport aux autres, de les déplier, de les décliner et de les pousser dans leurs retranchements, les interrogations sur une notion conduisant à d’autres interrogations sur d’autres notions, et ainsi de suite… au point que l’on finit parfois par avoir un peu de mal à les raccrocher à l’axe de pertinence d’ensemble de l’ouvrage, un axe qui lui, en revanche, est très clair : la dialectique de l’humain et du machinique au cinéma, visitée à travers la question de la voix. La voix n’est-elle pas, en effet, de façon emblématique, ce qui introduit « de l’humain dans un moyen d’expression caractérisé par sa nature mécanique » (p. 17-18) ? Cette dialectique fonde le plan de l’ouvrage : du bonimenteur à la voix-over, de la voix vive à la voix fixée, et va sous-tendre la réflexion de Boillat tout au long de ses 500 pages.

Enfin, on ne peut qu’être frappé par l’importance donnée à l’analyse des discours et aux analyses de films. Les discours sont, en effet, bien souvent, tout ce qui reste pour tenter de reconstituer les usages et les réactions des spectateurs (Boillat propose de parler d’audiospectateurs). Ils constituent, également, une source capitale pour articuler approche historique (ils sont situés dans le temps) et approche théorique (ils posent des questions). Tout L’occhio del Novecento, le bel ouvrage que Francesco Casetti a consacré au statut du cinéma dans la société, n’est-il pas fondé sur une analyse du réseau de discours que le cinéma a suscité (« a partire dalla rete dei discorsi sociali » [Casetti 2005, p. 270]) ? Dans l’ouvrage de Boillat, c’est le chapitre V, consacré à « La voix-attraction dans l’histoire du cinéma » (p. 263-313) qui me paraît être l’exemple le plus remarquable de ce type d’analyse. Quant aux films, l’index en recense plus de 230, des films de tout genre et de toute époque, des films que l’auteur convoque non pas comme de simples illustrations, mais au contraire en se servant de leurs analyses pour faire apparaître les problèmes théoriques. Il reste que ces analyses ont aussi leur valeur propre et conduisent à la mise en évidence de la spécificité de l’oeuvre étudiée. Parfois, elles débouchent sur de véritables études. Le chapitre consacré au Roman d’un tricheur (p. 165-196) qui comporte, également, l’analyse de Ceux de chez nous et de De 1429 à 1942 ou de Jeanne d’Arc à Philippe Pétain, déploie de fait toute la relation de Sacha Guitry à la parole de cinéma, montrant en particulier son inventivité en termes de dispositif et de structuration textuelle, inventivité qui en fait un précurseur de la modernité. D’autres études, portant sur des couples de films, permettent des comparaisons éminemment productives : Lola Montes et ses deux versions, avec ou sans flashback (p. 254-262) ; Frankenstein et sa suite, La fiancée de Frankenstein (p. 307-313) ; Hiroshima mon amour et son remake, H Story, par Nobuhiro Suwa (p. 449-482).

Face à une telle richesse, à un tel foisonnement, on comprendra qu’il ne saurait être question ici, pour moi, de proposer un compte rendu détaillé de l’ensemble de l’ouvrage. En théoricien, je me contenterai de pointer les caractéristiques majeures de l’approche mise en oeuvre et parfois de discuter quelques points, non pas tant pour en faire la critique que pour ouvrir le débat.

*

De façon un peu paradoxale (on pourrait dire aussi, de façon quelque peu provocante), Boillat propose d’opérer le renouvellement de la théorie en recourant à ces approches oh combien inactuelles ! — pas plus que tout autre domaine, la théorie n’est exempte de phénomènes de mode : aujourd’hui il faut être philosophe, esthéticien ou historien… — que sont la sémiologie (Metz), la narratologie (Genette, Gardies) et la théorie de la communication de Jakobson (l’auteur étudie les différentes fonctions du boniment en se fondant sur ce modèle, p. 117 sq.). Boillat fait la démonstration que pour peu qu’on les articule avec l’histoire, ces approches fournissent des outils opératoires pour faire surgir des questions jusque-là peu posées. Pour peu qu’on les articule avec l’histoire : la précision est capitale. Dans cette perspective, on ne s’étonnera pas de me voir noter avec satisfaction que Boillat se revendique de la sémio-pragmatique, qui place les déterminations contextuelles au point de départ de toute analyse : « La prise en compte de la réception filmique, écrit-il par exemple, s’appuiera sur la construction théorique d’un spectateur tel que le déterminent une institution, un dispositif et une représentation donnée. » De même, conformément au programme sémio-pragmatique — c’est le sens même de la dénomination : manifester qu’il n’y a pas d’incompatibilité entre approche textuelle sémiologique (immanentiste) et pragmatique, mais seulement une mise en perspective —, Boillat propose de « réintroduire la composante textuelle », mais en la présentant comme « fortement déterminée par l’extérieur » (p. 20).

*

Selon Boillat lui-même, les deux chapitres qui ouvrent l’ouvrage et qui sont consacrés à la « voix vive » sont essentiellement là pour fournir la base théorique et factuelle (notons la prolifération de dispositifs présentés) qui permettra de mieux comprendre la voix-over : « La voix-over constitue en fait le point de mire de mon étude […] » (p. 30) ; et plus loin il précise : « je pense en effet qu’en réfléchissant dans un premier temps à la question de l’oralité, on est ensuite plus armé sur le plan théorique pour aborder le statut de la parole enregistrée du cinéma parlant » (p. 37). Il n’empêche que ces chapitres constituent en eux-mêmes une contribution non négligeable à l’étude de la projection bonimentée : distinctions entre « relations verticales » (relations entre les composants visuel et sonore) et « relations horizontales » (relations entre la représentation et la machinerie qui la produit), réflexions sur boniment et « discours intérieur », proposition d’une grille d’analyse des sources vocales (types, emplacement, visibilité) et des modes de projection, typologie des formes de synchronisation de la parole du bonimenteur avec les images du film (synchronisation vocogestuelle, vococinétique, dans ou sur l’image, de mise en cadre ou de mise en chaîne) [2], etc.

Un autre des apports de l’ouvrage est le suivant : la discussion de la conception de Germain Lacasse du cinéma bonimenté comme « pratique de résistance ». Boillat note que ce n’est qu’une possibilité parmi d’autres et qu’il « convient de ne pas réduire les interactions entre le film, la voix et le public à une fonction sociopolitique définie, sous peine de ne pouvoir rendre compte des différentes modalités très diversifiées qui ont régi l’usage de la voix lors des projections bonimentées », mais il ajoute aussitôt qu’il faut reconnaître qu’en tant que pratique se situant au niveau de l’exploitation, la parole bonimentée « constitue une source potentielle de déviation du sens et des valeurs véhiculées par les films » (p. 35). Mais l’apport le plus nouveau de ces chapitres est, me semble-t-il, la démonstration que, contrairement à ce qui a été souvent avancé, la présence d’un bonimenteur ne conduit pas obligatoirement à la production d’un effet de distanciation ; je souligne obligatoirement car Boillat ne nie pas que cet effet puisse être produit, mais veut poser la possibilité d’un autre pôle : la parole bonimentorielle peut, en effet, favoriser l’immersion du spectateur dans le film. Et Boillat de préciser avec finesse que cela ne signifie pas la production de l’effet fiction : il y a moins « suspension de l’incrédulité qu’attitude participative à laquelle engage toute pratique vivante associée à la performance » (p. 107). De telles remarques témoignent de la qualité de pensée de l’auteur. Plus généralement, avec ces deux exemples, on a une belle démonstration de la façon de faire de Boillat lorsqu’il entreprend de discuter les propositions d’autres chercheurs : respect, nuance, volonté d’éviter toute affirmation trop abrupte, souci d’examiner tous les aspects de la question.

Dernière remarque sur ces chapitres : on soulignera le culot de l’auteur lorsqu’il se sert de l’analyse d’un DVD montrant la reconstitution, en 1997, d’une séance Méliès au Musée Grévin — c’est-à-dire de l’analyse d’une « trace d’une séance elle-même trace d’une pratique passée » (p. 163) — pour donner corps à sa réflexion. Il fallait oser… Toutefois, si l’analyse est en elle-même brillante, ses résultats sont, de l’aveu même de son auteur (elle ne « permet bien sûr d’illustrer qu’un nombre restreint d’options », reconnaît-il), un peu minces : de fait, outre que cette séance bonimentée témoigne « de l’intérêt rencontré par le “cinéma” parlé à la fin du xxe siècle », tout ce que peut noter Boillat sur la stratégie du bonimenteur dans cette séance est que l’accent est mis sur le représenté, alors que la mécanicité (le dispositif) et la technicité (les trucages) sont occultés (p. 163).

*

Mais revenons à la dialectique de l’humain et de la machine. Boillat met en évidence comment, dans le cas du film bonimenté (ce qu’il appelle le cinéma parlé vs le cinéma parlant), est à l’oeuvre non seulement une médiation humaine (dans le film parlé, quelqu’un « (me) parle du film », p. 60), mais une médiation machinique que le spectateur ne peut ignorer : celle du projecteur qui se trouve dans la salle, figure radicale de l’altérité face à l’humain. Boillat fait le tour des discours auxquels a donné lieu la question du bruit du projecteur (Prévost, Arnoux, Auric, Altman, Barnier, etc.) et corollairement celle de l’intervention de la musique et celle de la création de cabines de projection insonorisées, moins pour contribuer à une histoire des techniques que pour montrer que les spectateurs ont tout à fait conscience de la présence du machinique au cinéma et qu’il convient donc d’en prendre acte au niveau de la théorie.

Boillat choisit ensuite de centrer sa réflexion sur les années 1927-1931, une période de transition, « l’interrègne du parlant » (p. 197). Il entreprend de comparer cette période avec celle des années 1895-1908, non pour nier « l’extranéité » du cinéma des premiers temps (Gaudreault), mais pour dégager « quelques grands paradigmes théoriques utiles à une réflexion sur les régimes vocaux du cinéma » (p. 198). De fait, la réflexion avait déjà entrepris dans le chapitre précédent cette analyse du Roman d’un tricheur, qui lui avait permis non seulement de s’interroger sur « les liens entre boniment et voix-over » (p. 167) mais aussi d’amorcer une théorisation des relations entre « exhibition vocale » (p. 180), posture de « conteur » (telle que décrite par Benjamin) et narration. Au chapitre IV : « Les fondements théoriques de la voix-attraction » (p. 165-196), Boillat aborde le problème dans toute sa généralité, isolant — construisant devrait-on plutôt dire, car comme il le souligne, les objets auxquels il s’attarde sont des « objets purement théoriques qu’il s’agit d’appréhender comme des instruments analytiques » (p. 202) — quatre régimes vocaux : la voix-action (les occurrences vocales internes à la diégèse, les dialogues diégétiques), la voix-explication (discursive), la voix-narration et la voix-attraction (« elle fait primer la relation directe au spectateur sous forme d’adresse », p. 212).

*

C’est cette voix-attraction que Boillat propose « d’ériger en dénominateur commun » aux deux périodes (p. 197) car, et c’est là que l’on se rend compte combien est astucieux le choix de la deuxième période analysée, les années 1927-1931 se caractérisent « par le transfert de pratiques orales vivantes vers l’enregistrement magnétique » (p. 177). Mais que l’on y prenne garde, « ériger en dénominateur commun » ne signifie pas transférer purement et simplement la notion d’attraction d’une période historique à une autre ; au contraire, il s’agit de fixer un axe commun pour mieux faire apparaître les différences. Boillat souligne ainsi « l’importance épistémologique de la rupture qui s’opère avec la découverte et la généralisation du principe d’inscription de la voix » (p. 222). C’est que la voix enregistrée fait d’emblée partie du film : techniquement, matériellement, elle est donnée dans le même mouvement de défilement que l’image ; ainsi, même lorsque cette voix fonctionne sur le mode de l’attraction, l’intégration au film est plus forte que dans le cas avec le bonimenteur : elle n’est plus une composante de l’exploitation des films (de la performance), elle n’est plus liée à un corps présent dans la salle, mais devient un élément constitutif du texte filmique. Encore convient-il de préciser que si la voix-over fait partie du texte filmique, elle constitue un « premier niveau d’intégration » dont les paramètres ne sont pas textuels, mais techniques (p. 223). Là encore, la preuve est faite que la théorisation ne saurait ignorer le machinique.

Boillat n’en néglige pas pour autant l’aspect textuel, dont il montre la complexité tant au niveau structural qu’au niveau pragmatique, les deux n’étant d’ailleurs pas dissociables. Dans le très beau passage qu’il lui consacre, il note, par exemple, que le chant est d’emblée plutôt du côté de l’attraction (p. 231 sq.). De plus, les différents régimes vocaux peuvent se retrouver tant du côté de la voix vive que de la voix fixée, mais avec des modalités et des degrés de manifestation divers. Ainsi « la voix-action peut tendre vers la voix-narration » (p. 209), et bien que voix-attraction et voix-narration soient opposées, « il se peut que des manifestations vocales empruntent simultanément certains traits à l’un et à l’autre » (p. 211) ; plus généralement la narration peut coexister avec tous les autres types (p. 218).

Toutes ces analyses s’inscrivent dans le programme général énoncé par Boillat visant à « élaborer une conception graduelle et polyvalente de l’ancrage du son dans la représentation visuelle » (p. 23). C’est là l’un des leitmotivs de l’ouvrage. Boillat ne cesse de plaider pour que l’on ne considère pas les catégories de façon rigide mais « comme autant de bornes jalonnant un spectre continu » (p. 230). Pour Boillat, cette approche est susceptible de régler bien des problèmes. Ainsi, on a souvent dit qu’il n’était pas possible de rendre compte de ce qui passe dans la relation images/sons avec les trois critères que sont voix in, off et over, « or, note Boillat, une conception graduelle de ces notions abroge cet obstacle méthodologique » (p. 25). J’avoue ne pas en être certain, car, comme je l’avais montré dans un texte très ancien (Odin 1978), ces notions sont entachées d’une tare originelle : elles proviennent de l’espace de la réalisation et ce n’est pas en les transformant en « notions graduelles » que l’on changera leur statut, mais en reprenant à la base le problème de la construction des sources sonores par le spectateur (l’ouvrage va d’ailleurs dans ce sens dans certaines de ses analyses). Quoi qu’il en soit, s’il est vrai que l’idée d’une approche graduelle est extrêmement séduisante, elle pose aussi bien des problèmes. Et d’abord, est-ce que tout est traitable en termes de degrés ? Peut-on, par exemple, réellement parler de degrés de narrativité ? Certes, il y a des récits plus complexes que d’autres, mais on est dans le mode narratif ou non, la complexité des récits est un autre problème. Certes, il y a des textes qui font une part plus grande que d’autres au récit, mais dans ce cas, c’est une autre conception du graduel qui est convoquée : le graduel par combinatoire. Mais comment, alors, évaluer la part de tel ou tel régime dans un film ? Par une étude quantitative ? Par une étude structurelle (repérer quel est le régime dominant dans la structure) ? Mais est-ce que cela correspondra à l’effet produit sur le spectateur ? De même, Boillat propose « une conception graduelle du marquage énonciatif » (p. 408). Mais « graduel » me semble avoir ici encore un nouveau sens : l’existence de différents « niveaux » de marquage. L’idée est juste, mais pourquoi parler de graduel ? Plus généralement, que faut-il donc entendre par « graduel » ? Bien d’autres questions pourraient sans doute être encore posées. Que l’on me comprenne bien, il est indiscutable que la « conception graduelle » proposée par Boillat conduit à des analyses théoriques d’une grande finesse et qu’elle donne même certains résultats non négligeables (comme l’analyse du couple intégration vs non-intégration, qui est l’un des couples structurants de l’ouvrage), mais dès que l’on commence à vouloir théoriser la notion elle-même, les ennuis commencent…

Le dernier chapitre théorique de l’ouvrage est consacré à la question de l’énonciation : « Voix-narration et énonciation filmique » (chapitre VI, p. 315-448). On peut s’étonner de voir la question de l’énonciation liée à celle de la voix-narration. Pourquoi ce régime vocal plutôt qu’un autre ? A priori la question de l’énonciation concerne tous les régimes vocaux. La réponse tient au fait qu’un des objectifs essentiels de Boillat dans ce chapitre est de « renouveler la question de l’énonciation » en dénonçant ce qu’il considère comme la position dominante sur ce point (mais je ne suis pas certain que ce soit réellement le cas) : le primat donné à la dimension humaine dans l’approche de l’énonciation (c’est François Jost qui a initié le mouvement pour le cinéma). Or c’est à propos de la « voix narrative » que le lien énonciation-humain a été au préalable établi dans le cadre de la théorie littéraire (Gérard Genette, William C. Booth) qui pose « la voix de l’auteur » comme source énonciative première. Mais, remarque Boillat, « ce qui est (à la rigueur) valable pour la littérature ne l’est par contre aucunement pour le cinéma » (p. 319), où l’énonciateur est toujours collectif (on notera la réserve « à la rigueur », réserve que je partage pleinement, mais il n’y a pas lieu de développer ce point ici). Pour Boillat, « même lorsqu’il se manifeste verbalement en déléguant fictivement sa fonction à une instance diégétique, le “narrateur filmique” doit son existence à la technologie phonographique, c’est-à-dire au pôle machinique » (p. 326). Boillat propose donc la construction d’un modèle de l’énonciation « bifide » (p. 487), avec une branche humaine et une branche machinique. De fait, il complique un peu les choses en introduisant l’idée qu’il est du « ressort d’une théorisation de l’énonciation filmique que de décrire les niveaux auxquels certains types de marquage de la matérialité sonore peuvent se manifester » (p. 407). Or la matérialité ne se limite pas au machinique : par exemple, le « grain de la voix » (cher à Barthes) relève de la matérialité sonore.

La définition de l’énonciation proposée par Boillat vise à recouvrir ces différents aspects. L’énonciation est l’« ensemble des opérations humaines et techniques nécessaires à la production de la représentation » (p. 383). On voit le danger de cette façon de concevoir l’énonciation. Tout peut être considéré comme nécessaire à la production de la représentation : la structure économique qui produit les films, les conditions historiques dans lesquelles le film se fait, l’état de la société tout entière, etc. Où s’arrêter ? Dans la suite du texte, toutefois, Boillat établit une limite : il pose que le marquage énonciatif n’a d’existence que si le spectateur en prend conscience ; ce que le théoricien doit analyser, c’est le marquage énonciatif « inféré » par l’audiospectateur : ce ne sont donc pas « toutes les opérations […] nécessaires à la production de la représentation » qui seront finalement retenues comme constituant la structure énonciative. Boillat n’en insiste pas moins sur la nécessité de prendre en compte la « multiplicité des lieux potentiels de marquage » énonciatif (p. 421) : de l’émission vocale à la prise de son, de la captation au montage en passant par le travail de postproduction sur le son lui-même (qui peut conduire à des transformations), de la projection (avec ses modalités techniques) à la réception par le spectateur. L’idée qu’il défend est que chacun de ces lieux a sa spécificité et que la construction de la structure énonciative opérée par le spectateur n’est donc pas unitaire mais multiple et complexe (cf. le schéma de la p. 447). Je partage tout à fait l’idée selon laquelle le spectateur construit une structure énonciative complexe et peut conférer le rôle d’énonciateur à toute une série d’instances de statuts très divers. Dans ma tentative pour caractériser la lecture documentarisante (Odin 2000), j’amorçais d’ailleurs une telle analyse en suggérant que le spectateur d’un documentaire pouvait être amené à construire comme énonciateur le cameraman, le spécialiste responsable du contenu, l’institution dans laquelle le film a été fait… et même la caméra (donc du machinique). Boillat va plus loin dans son intégration du machinique et il a raison. On soulignera d’ailleurs qu’il ne nie nullement la présence d’une instance humaine énonciative ; son objectif est seulement de « nuancer le postulat anthropomorphique » (p. 32 ; toujours ce souci de faire des propositions mesurées). Il consacre même de très longs développements à cette dimension, reconnaissant par exemple que la voix-over « dispose d’un potentiel énorme d’humanisation » en raison de « l’absence intrinsèque d’ancrage dans la diégèse visualisée » et « de l’impression donnée que les images “naissent” des mots » (p. 424). On notera avec amusement ce petit paradoxe : l’objet majeur de l’ouvrage, la voix-over, est précisément ce qui va le moins dans le sens de la reconnaissance par le spectateur de la dimension machinique de l’énonciation. Ce n’est pas le moindre mérite de Boillat que d’avoir compris la force de stimulation que serait pour sa recherche le choix d’un objet, si l’on peut dire, « à rebrousse-poil » de ce qu’il voulait montrer (un objet résistant).

*

On le voit, on est là en face d’un ouvrage doublement important : d’une part, pour la théorie du son au cinéma — Boillat en a bien conscience, qui note : « Une conception générale des manifestations vocales comme celle que j’entends proposer ici est inédite dans le champ des théories du cinéma » (p. 27) —, d’autre part, pour la théorie du cinéma en général : outre la masse d’outils d’analyse proposée et la multitude de pistes et de questions ouvertes, le plaidoyer de Boillat pour la prise en compte forte du machinique dans la théorie ne devrait pas rester sans effets. Certes, le machinique n’était pas jusque-là absent de la réflexion sur le cinéma, loin de là, mais il est vrai qu’on avait un peu tendance à l’oublier lorsqu’il s’agissait de poser des questions théoriques de l’ordre de celles abordées ici par Alain Boillat. Remettre cette dimension à l’honneur est d’autant mieux venu que le développement de nouveaux dispositifs (Imax, jeux vidéo, films tournés sur téléphone, Internet) la rend plus que jamais nécessaire… et il est probable qu’elle ne devrait pas se limiter au son.