Corps de l’article

Les premières minutes d’un film, même lorsque ce dernier appartient au cinéma dominant et obéit au régime de la « transparence » énonciative, présentent le plus souvent une réflexivité manifeste, ne serait-ce qu’en raison des mentions du générique qui renvoient à la genèse même du film. Le générique « exhibe ce que l’autre [le film] déguise avec soin », disait André Gardies (1976, p. 86). En outre, il instaure, au seuil de ce que Roger Odin (1980) a appelé « l’entrée du spectateur dans la fiction », un rapport au destinataire qui tend à relever de l’adresse, c’est-à-dire à postuler, pour reprendre la terminologie de Tom Gunning (1986, p. 66), une confrontation exhibitionniste plutôt qu’une absorption diégétique [1]. Au cours de son analyse du générique d’Une partie de campagne (Jean Renoir, 1936) — segment filmique dont la composante sonore se réduit à une musique extradiégétique —, Roger Odin met l’accent sur l’interaction entre deux modalités perceptives distinctes qui s’inscrivent dans une opposition radicale et parfois conflictuelle, dont le théoricien rend compte grâce à la formule suivante : « Lire vs voir : deux positionnements du spectateur face au film » (Odin 1980, p. 201). Alors que la lecture est traditionnellement associée par les sémiologues à l’exhibition de l’arbitraire du signe linguistique, la perception visuelle du message iconique implique, du moins comparativement [2], un rapport d’immédiateté. Dans un texte où il évoque les débats des années 1920 portant sur le recours aux intertitres, François Albera (1975, p. 23) souligne la récurrence du paradigme dichotomique voir/lire. Selon lui, la condamnation des intertitres a constamment procédé d’une « valorisation implicite des codes analogiques : analogie visuelle ou analogie sonore ; valorisation, en dernière instance, du sensible sur l’intelligible ». Albera renvoie (p. 24, note 4) notamment à Bergson, « où l’artificialité de l’écriture, de la syntaxe, l’abstraction des lettres s’oppose à la naturalité de la voix ». Or, nous nous proposons d’envisager ici ce qu’il advient du générique, et plus généralement de la partie liminaire d’un film, lorsque l’oralité se substitue à l’écrit, et que l’intelligible s’accompagne de la dimension sensible induite par le « grain » de la voix. Nous sommes en effet d’avis que, dans le cinéma parlant, l’héritage de pratiques orales antérieures — ce que j’ai proposé d’appeler le « cinéma » parlé (Boillat 2007, p. 60-61) — tend à se nicher dans cette parole inaugurale, et souvent à s’y cantonner. Certes, les sons enregistrés du parlant relèvent également de la catégorie de l’écrit, dans la mesure où, régis par le principe de la fixation, ils sont restitués par le truchement d’une machine et, par conséquent, produits au sein d’un dispositif exempt des conditions labiles qui caractérisent la « performance » chère à Paul Zumthor. Cette oralité effective, exercée live, peut néanmoins être imitée dans le cinéma parlant, comme en témoignent certains prologues. La dimension présentationnelle y enraie alors l’immersion diégétique, de sorte que nous nous trouvons en présence d’un régime parent de celui des « attractions », tel qu’André Gaudreault et Tom Gunning l’ont conceptualisé dans la foulée du colloque de Brighton. Contrairement à la voix over traditionnelle, qui vise prioritairement à l’instauration de l’univers diégétique, les voix que nous étudierons s’interposent en médiatrices entre la représentation visuelle et le spectateur.

La période de la généralisation du parlant : un « bon objet »

Les premières années du parlant s’avèrent particulièrement propices à l’étude de telles manifestations vocales, dans la mesure où le développement, l’apprivoisement et l’exploitation, sur le plan esthétique, de la technologie sonore ont offert un contexte favorable à des expérimentations qui tendront à disparaître avec la standardisation des usages du son. Dans « L’évolution du langage cinématographique », André Bazin (1994, p. 71) note qu’« en 1939, le cinéma parlant en était arrivé à ce que les géographes appellent le profil d’équilibre d’un fleuve ». Il associe certes ce constat d’une normalisation aux pratiques de découpage, mais ces dernières sont majoritairement informées par la représentation des sujets parlants (notamment dans le cas du champ/contre-champ), c’est-à-dire par les modalités de l’inscription de voix in et off dans le film. En ce qui concerne la voix over, la filmographie établie par Sarah Kozloff (1988, p. 142) pour les productions anglophones révèle que ce procédé a pris son essor à Hollywood à la toute fin des années 1930. Il n’est pas étonnant que Noël Burch, toujours à l’affût d’usages anti-institutionnels — notamment liés à l’oralité (qu’il s’agisse du benshi nippon ou du bonimenteur du cinéma des premiers temps) —, se soit penché sur une période du parlant antérieure à cette standardisation de l’usage des sons — période qui s’achève selon lui vers 1934, mais qu’il nous semble possible de prolonger jusque vers 1937-1938 — en proposant de la considérer comme un « interrègne » dont il souligne le caractère hétérogène et novateur (Burch 1988). Or, la singularité de certaines utilisations de la parole synchronisée réside, à l’époque, dans leur caractère fortement attractionnel, qui se manifeste notamment par une autonomisation des passages parlés ou chantés. Ce statut d’extériorité des moments sonorisés, que l’on peut opposer à l’intégration narrative de l’ensemble des composantes filmiques qui définit le cinéma « classique », fut notamment souligné par le critique Jean Tedesco, qui, en 1928, envisageait l’avenir des talkies avec scepticisme :

Ces expériences de film parlé se résumeront à des morceaux, le plus souvent chantés, insérés dans les films, ou bien des espèces d’attractions, soi-disant plus vivantes, où l’on retrouvera le mauvais goût des présentations américaines des grandes salles de Broadway ou de Paris.

Tedesco, cité in Arnoldy 2001, p. 378

Il n’est pas anodin que Tedesco, dont le point de vue s’inscrit tout à fait dans le discours dominant de la critique des années 1927-1928 [3], rapproche l’utilisation du son des « présentations américaines », c’est-à-dire de pratiques relevant d’un spectacle vivant qui, ainsi que le suggère la dénomination utilisée, est de nature plus présentationnelle que représentationnelle. Le jugement de valeur porté par Tedesco sur ces pratiques participe plus généralement d’une dépréciation des formes populaires de spectacle et signale l’importance conférée par l’auteur à l’intégration « narrative ». À la même époque, Valentin Mandelstamm souligne (1929, p. 194) une filiation similaire, mais sans dénigrer le cinéma parlant, qui constitue, selon lui, un moyen efficace pour contrer la baisse de fréquentation des salles et éviter certaines pratiques dispendieuses qui se seraient généralisées à partir du milieu des années 1920 au détriment des « superproductions » :

Il fallait maintenant les « encadrer », et, par cela, dépenser des sommes énormes en publicité, et en présentations coûteuses, comprenant des prologues, des revues, des ballets, des numéros choisis de music-hall ; et le film, de la sorte, finissait par passer au second plan. […] Et l’on se demandait où l’on allait s’échouer, lorsque le film synchronisé et le film parlant sont venus sauver la situation.

Pour Mandelstamm également, les talkies représentent avant tout un succédané de spectacles live. Les premières années du parlant — principalement lors de la période 1927-1930, mais avec une incidence de ce modèle jusque vers 1937-1938 — furent marquées par une tendance à la fragmentation du film en une juxtaposition d’attractions sonores, de sorte que les débuts de film n’endossaient plus nécessairement le rôle de mise en place des données narratives [4]. Lorsqu’en 1927 la Warner suscite un certain engouement pour le parlant, c’est significativement en proposant les Vitaphone shorts, bandes conçues comme un substitut avantageux des prologues live (Wolfe 1990 et 1993) dont Donald Crafton note (1997) qu’elles offraient sous une forme « virtuelle » la performance de grands orchestres, de spectacles de Broadway et de « presentation acts ». Ainsi que l’explique Rudmer Canjels (2004, p. 314), le principal avantage de ces films de courte durée était de permettre à de petites salles de proposer « une présentation ou un prologue de haut niveau artistique et divertissant ». D’abord utilisées en début de programme (à l’instar des actualités sonores qui furent une spécialité de la Fox), de telles ouvertures sonores seront ensuite intégrées aux films eux-mêmes, les fonctions de la parole liminaire étant redevables des pratiques scéniques populaires qui, dans les établissements prestigieux des années 1920, précédaient la projection des longs métrages (Hediger 2004). Ainsi les ouvertures sur un spectacle scénique (souvent chanté) sont-elles fréquentes au cours des années 1930 (voir par exemple Happiness Ahead, Mervyn LeRoy, 1934 ; Gold Diggers of 1933, Roy Del Ruth, 1933 ou Gold Diggers of 1937, Lloyd Bacon, 1936). Quant à la parole strictement parlée, on peut évoquer Le masque de fer (The Iron Mask, Allan Dwan, 1929), film emblématique de cette démarche d’autonomisation d’une partie introductive puisque, tourné en muet, il fut non pas sonorisé a posteriori dans sa quasi-intégralité, comme d’autres productions contemporaines dont on voulut que la facture répondît aux nouvelles attentes du public, mais simplement affublé d’un prologue et d’un intermède parlants passablement désolidarisés du récit (Boillat 2007, p. 298-301). Il n’est pas surprenant qu’à l’occasion de la ressortie du Masque de fer en 1952, la Lippert Pictures, qui en distribue une version écourtée et sonorisée, opte pour un commentaire over, procédé qui assure la continuité requise par les pratiques sonores qui se sont standardisées à l’issue de cet « interrègne » au cours duquel le cinéma parlant « cherchait sa voix » dans un contexte intermédial.

Alors que, dans les années 1927-1937, le modèle dominant d’incipit filmique est celui du générique présentant une image animée muette d’acteurs incarnant leur personnage et la mention de leur nom en surimpression (procédé récurrent dans les productions Warner et MGM), l’hétérogénéité des pratiques qui est propre à la première décennie du parlant s’observe notamment dans la diversité du traitement des ouvertures de films. Si le travail effectué sur les mentions écrites durant la période « muette » se poursuit au cours des années 1930, par exemple à travers un jeu sur différents degrés de diégétisation du texte — voir par exemple le début de L’affaire du courrier de Lyon (Claude Autant-Lara et Maurice Lehmann, 1937) —, l’entame des films permet souvent à la parole de s’afficher. On le sait, un début de film doit être « parlant » pour accrocher le spectateur et fixer les termes du contrat de lecture passé avec ce dernier (Gardies 1993, p. 44-45 et Boillat 2001, p. 60-72). Lorsqu’un film feint d’intégrer le spectateur en présentant d’entrée de jeu une situation d’oralité, il remplit avec efficacité ce rôle d’accroche tout en accomplissant simultanément l’acte performatif de s’autodésigner comme parlant [5]. Ce sont quelques-unes de ces entrées en fiction singulières que nous proposons d’examiner ici dans des incipit filmiques de la période 1927-1937. Si les trois fonctions traditionnellement envisagées pour aborder l’incipit ont respectivement trait, ainsi que le rappelle Jean-Jacques Lecercle (1997, p. 8-9), à un processus d’énonciation, à une rhétorique de l’exposition (« il faut, le plus vite possible, et au moindre frais, transmettre […] l’information pertinente ») et à la production d’un effet d’identification au personnage, nous verrons que les ouvertures de type attractionnel ne ressortissent prioritairement qu’à la première de ces fonctions, et proposent à cet égard des conditions particulières caractérisées par l’absence de repérage spatio-temporel au sein de la diégèse et, souvent, par une référence au modèle scénique.

L’exacerbation d’une certaine théâtralité

Dans Du bonimenteur à la voix-over, nous avons montré qu’alors que Frankenstein (James Whale, 1931) s’ouvre sur un prologue dans lequel un showman d’abord dissimulé derrière un rideau s’avance sur une scène filmée frontalement pour s’adresser à un public qui demeure hors champ, son sequel réalisé quatre ans plus tard par le même cinéaste, La fiancée de Frankenstein (The Bride of Frankenstein, 1935), comporte deux voix over mises au service de la transmission des informations narratives et de l’immersion du spectateur. Alors que l’incipit du premier film s’inscrit fortement dans une logique attractionnelle — le présentateur qui s’exprime au nom de la maison de production feint d’avertir le public du caractère horrifique du film et légitime le traitement du sujet —, jouant à cet égard un rôle de « préambule » similaire au carton initial de Freaks (Tod Browning, 1932) [6], La fiancée de Frankenstein privilégie la narration en proposant un récit-cadre qui, utilisé pour lancer l’intrigue, ne réapparaît plus à la fin du film. En se réclamant ouvertement de pratiques scéniques — rappelons que l’adaptation du roman de Mary Shelley avait préalablement rencontré un grand succès sur les planches — et en affichant de manière stéréotypée des indices de « théâtralité », dont l’inévitable rideau, le prologue de Frankenstein n’est propre ni à ce film ni au cinéma d’horreur [7]. Ainsi la première séquence d’un film d’un tout autre genre, La chienne de Jean Renoir (1931), est-elle réalisée sous la forme d’un théâtre de marionnettes où, après avoir mentionné les trois personnages du film qui apparaissent en surimpression sur l’image de la scène, la poupée du « présentateur » s’écrie : « Et maintenant, Mesdames et Messieurs, le spectacle va commencer ! ». Le finale du film nous fera d’ailleurs retourner à cette situation-cadre pourtant totalement opposée, en raison de l’artificialité manifeste de ce type de spectacle populaire et anti-illusionniste, à l’esthétique réaliste des plans de rue filmés en son synchrone.

C’est cependant dans la comparaison avec un autre film français moins connu que la similitude avec le prologue de Frankenstein est la plus frappante. Il s’agit de Chacun sa chance (René Pujol et Hans Steinhoff, 1931), un film qualifié d’« opérette filmée » dans le sous-titre figurant sur le premier carton et qui exploite, comme nombre de films de l’époque, les ressources de la vocalité sous la forme de l’intégration de passages chantés. Le générique sur lequel débute Chacun sa chance, soit des mentions écrites traditionnelles apparaissant sur un fond dessiné représentant un rideau de scène fermé, est dépourvu de tout son, comme s’il importait qu’il ne concurrence pas le prologue en voix synchrone qui lui fait suite. Les informations convoyées par écrit sont lapidaires, et ne font pas office de credits. Cette fonction incombe en effet exclusivement à la parole liminaire d’un conférencier. Filmé en plan rapproché, ce présentateur en smoking — son apparence est identique à celle de son « avatar » dans Frankenstein — entre dans le champ puis déclare : « Et maintenant, assez de titres ! Puisqu’il s’agit d’un film parlant, il vaut mieux commencer à parler. » Le souci d’opérer une démarcation nette avec le régime de l’écrit du générique et de répondre aux attentes d’un public séduit par le parlant ne peut être plus clairement formulé, le prologue étant en général le lieu de l’explicitation des intentions de l’instance de production. Tandis que les différents acteurs du film, sur l’invitation du présentateur, sortent par deux de derrière le rideau, saluent par une révérence sans prononcer un mot puis regagnent les coulisses, le présentateur énonce successivement le nom de chacun des acteurs et celui des personnages qu’ils interpréteront. Les comédiens n’apparaissent toutefois pas dans le même plan que le locuteur, le montage fragmentant ces deux sous-espaces, de sorte que la présentation verbale débute in et se poursuit off. Ce découpage a une implication spécifique lors de l’apparition du premier couple, lorsque le présentateur énonce : « Mesdames et Messieurs, j’ai l’honneur de vous présenter mademoiselle Renée Héribel et mon meilleur ami, monsieur André Urban, dans les rôles de la baronne et du baron de Monteuil. » En effet, le « meilleur ami » du présentateur n’est autre que… lui-même ! Par la magie du montage cinématographique, Urban occupe par conséquent simultanément, dans un espace postulé comme homogène — du moins serait-ce le cas si nous étions déjà à proprement parler dans la diégèse filmique (ou si nous avions actualisé la référence à l’espace scénique) —, deux postes différents, celui de présentateur et celui d’acteur protagoniste. Le statut de personnage constitue un facteur de continuité qui amoindrit le degré d’extériorité du prologue par rapport au monde du film. Rappelons qu’il en allait de même des prologues vivants réalisés durant les années 1920 dans les grandes salles américaines, où il n’était pas rare d’annoncer l’ambiance et l’environnement du film à venir (Hediger 2004) [8]. Par ailleurs, dans la plupart des films, la dimension iconique des génériques écrits constitue elle aussi une annonce de certains éléments de la diégèse filmique, quand il ne s’agit pas d’un « générique diégétisé », où les mentions écrites côtoient déjà le début effectif du film.

Le texte proféré dans le prologue de Chacun sa chance s’achève ainsi : « Le film a été mis en scène par monsieur Hans Steinhoff. Et maintenant, place au théâtre ! Maestro, s’il vous plaît ! ». Le film feint de s’assimiler à une pièce de théâtre, comparant évident lorsqu’il est question d’un spectacle parlé. L’adresse au chef d’orchestre amorce un segment musical où les plans sont consacrés aux musiciens situés dans la fosse, seconde « attraction » préliminaire avant que le rideau ne s’ouvre pour découvrir un écran sur lequel le film est projeté. Cette mise en abyme inaugurale d’un dispositif scénique crée un pont entre le parlé et le parlant, une transition progressive s’effectuant sous le signe de l’oralité et par le truchement du référent théâtral qui, comme l’a montré Zumthor lorsqu’il aborde la question de la « performance », est au centre des questions sur l’oralité, voire les englobe toutes [9]. C’est pourquoi il nous paraît intéressant d’aborder l’oeuvre cinématographique de ce passionné de théâtre que fut Sacha Guitry : s’il est probable qu’aucun autre cinéaste n’a accordé avec autant de constance un intérêt au prologue filmique, c’est sans nul doute parce qu’il trouvait dans les génériques et incipit de ses films la possibilité d’exacerber une composante « théâtrale » qui, déplacée au cinéma, confère à son travail une dimension novatrice [10].

De Pasteur aux Perles de la couronne, l’adresse liminaire chez Sacha Guitry

Ayant déjà abordé ailleurs Le roman d’un tricheur (Sacha Guitry, 1937) sous l’angle de sa filiation avec les pratiques orales live (Boillat 2007, p. 165-196), nous ne nous attarderons pas ici sur ce film, mais élargirons la problématique de l’oralité qu’il soulève à d’autres réalisations cinématographiques de son auteur, et plus spécifiquement à leurs parties liminaires (génériques et prologues), dont l’analyse nous permettra d’étayer la thèse soutenue ici quant à la préséance de l’oralité dans leur incipit. Sous des formes qu’il se plaît à décliner de film en film, Guitry fait en effet fréquemment intervenir une figure de « présentateur » (interprété par lui-même) qui prend soin de nous exposer le spectacle qui va suivre. Le fait que le régime de l’interpellation du spectateur se concentre dans les premières minutes des films de Guitry — qui, une fois le récit commencé, présentent à cet égard un intérêt souvent moindre — est révélateur du statut particulier des débuts de films en général.

L’intérêt manifesté par Guitry pour des parties introductives dans lesquelles il s’adresse plus ou moins directement au public trouve probablement sa source dans un souci d’offrir un simulacre visant à restituer sur l’écran les conditions de la transmission d’une représentation théâtrale, c’est-à-dire une coprésence du public et de l’acteur dans le même espace-temps. « L’acteur que vous voyez sur l’écran ne joue pas, il a joué » (Guitry 1933, p. 72). Ce célèbre aphorisme de Guitry n’est pas qu’un bon mot, il exprime le profond sentiment d’impuissance de l’acteur de théâtre confronté aux contraintes indépassables de la nature enregistrée des images et des sons au cinéma. Alain Keit (1999, p. 32) parle, à ce propos, d’une « carence rédhibitoire » résultant d’un clivage que Christian Metz (1977, p. 117) avait formulé ainsi : « Durant la projection du film, le public est présent à l’acteur, mais l’acteur est absent au public ; et durant le tournage, où l’acteur était présent, c’est le public qui était absent. » C’est pourquoi Guitry, réfractaire au cinéma jusqu’à ce que ce dernier soit capable d’assurer la présence vocale de l’acteur grâce au son synchrone, utilisa le parlant pour prendre acte de cette imparable scission entre la performance et la projection. À cette fin, il recourut à la présence-absence de la voix over ou, dans la majorité de ses films, produisit des effets de direct destinés à occulter les implications du différé.

Si l’on fait exception du documentaire intitulé Ceux de chez nous (1915), le premier film de Guitry a été réalisé en 1935 : il s’agit de Pasteur, dont le générique écrit ne présente pas seulement une liste des noms des collaborateurs, mais mentionne ces derniers dans des phrases complètes (« Ce film a été conçu et réalisé par Sacha Guitry ; Louis Beydets en composa la musique […] René Thibault fixa les images ; J. de Bretagne imprima les sons ; Pierre Schwab les assembla et Robert Gys reconstitua les décors »). L’emploi assez inhabituel de verbes conjugués — au passé, ce qui permet à l’auteur de souligner le caractère différé de la projection — pour indiquer la fonction des collaborateurs sera une constante des génériques de Guitry, qui s’y démarque par une volonté de mettre en évidence la dimension verbale. Pasteur comprend ensuite un prologue précédé d’une mention unique, « L’AUTEUR ». Cet incipit se présente comme l’exhibition d’une situation d’énonciation et l’affirmation de la présence d’un Je — Guitry — qui s’adresse à des auditeurs muets que l’on devine en amorce, en ce seuil spatial de la diégèse que le spectateur du film peut aisément investir imaginairement. D’ailleurs, lorsque Guitry leur remet des documents illustrant la vie de Pasteur, ces sources apparaissent en gros plan, ouvertement adressées au spectateur du film. Il en va de même d’une lettre que Pasteur avait reçue du ministre de l’Instruction, à propos de laquelle Guitry nous dit : « Tenez, lisez-la vous-mêmes ». L’écrit est certes présent, mais sous des formes déjà en partie diégétisées, et toujours enchâssé dans une performance orale.

Ce travail spécifique sur la phase liminaire du film me semble lié, chez Guitry, à sa passion pour l’origine des histoires qu’il nous conte. Une origine double : celle de son référent (il s’agit le plus souvent d’anecdotes relatives à la vie de grands hommes), mais aussi celle de son énonciation « présente ». Guitry présente ainsi le personnage éponyme de son film : « Si l’on me demandait à moi de raconter la plus belle existence qui soit, je répondrais ceci : le 27 décembre 1822 naquit à Dôle dans le Jura un enfant dont on devait dire un jour qu’il avait été le plus grand bienfaiteur de l’humanité. » Cette attention portée au rituel de la mise en place d’une histoire — l’expression d’un « il était une fois » (car le romanesque l’emporte toujours chez lui sur l’historique) —, nous la retrouvons dans Les perles de la couronne (1937), qui présente un prologue similaire à celui de Pasteur, mais où le destinataire du discours est visualisé en champ/contrechamp (il s’agit de Jacqueline Delubac). En effet, dans ce film, la phrase inaugurale (« Un soir de février 1518… ») est prononcée pas moins de cinq fois consécutives par le conteur ou par son auditrice, l’auteur prenant un plaisir presque fétichiste à réitérer l’entrée en matière et à différer la transition vers le retour en arrière. Ce souci d’une origine associée au Moi auctorial explique le penchant de Guitry pour l’autonomisation des débuts de films et pour les structures enchâssées. S’adressant à son interlocutrice, le conteur des Perles de la couronne explicite les conditions de réception au moment de l’entrée en récit : « Installe-toi bien, ferme les yeux, écoute-moi, et imagine… imagine les images qui peuvent illustrer mon récit véridique. » Cette invitation est également destinée au spectateur du film confortablement installé dans le fauteuil d’une salle obscure, qui cependant n’a pas à imaginer les images. L’injonction de Guitry explicite le processus même de l’entrée en fiction (le présupposé d’un récit « véridique » n’interdit pas, chez Guitry, le rôle primordial de l’imagination) sur un mode particulier, puisque l’image est reléguée à ce que son auditrice imagine à partir des mots qu’il prononce : l’oralité est ostensiblement présentée comme première.

Dans le prologue de Désiré (1937), Guitry ne prend plus la peine d’introduire un interlocuteur qui assure la médiation avec le spectateur du film, mais s’adresse directement à ce dernier, dont il se présente comme le serviteur à l’issue d’un « truc par substitution » où il se transforme subrepticement en domestique, le costume amorçant un processus de diégétisation en annonçant l’existence du personnage que Guitry incarnera dans la fiction. Le texte proféré se situe ouvertement du côté du « discours » (au sens de Benveniste), ainsi qu’en témoignent les expressions déictiques que nous avons soulignées ici :

Mesdames, Messieurs. Le film que nous allons avoir l’honneur d’interpréter devant vous est de votre serviteur. Mais veuillez s’il vous plaît… veuillez venir feuilleter avec moi cet album. Voici madame […]. Et me voici moi-même. Il y a aussi un monsieur que l’on ne voit pas dans le film mais il faut tout de même que je vous en dise deux mots. Le voici. C’est un compositeur, c’est monsieur Adolphe Borchard, et la musique que vous entendez en ce moment est de lui […].

L’égocentrisme de Guitry n’implique pas seulement l’omniprésence d’un Je, mais il a également pour corollaire l’exhibition fréquente de sa relation au spectateur dans un temps qu’il associe au présent de l’énonciation. Lorsqu’il évoque « la musique que vous entendez en ce moment », Guitry pointe une occurrence sonore qui accompagne sa voix dans l’instant même de sa prise de parole, supposé être aussi celui du visionnement du film. Cet ancrage dans le hic et nunc d’un locuteur visualisé se situe aux antipodes de la désincarnation induite par les voix over sur lesquelles s’ouvriront tant de films hollywoodiens dans les années 1940 et 1950. On rétorquera que Le roman d’un tricheur de Guitry fait pourtant usage de la voix over. Elle y est toutefois arrachée à la transparence de « l’histoire », déplacée, en ce lieu hautement réflexif qu’est le début de film, du côté du « discours ». En effet, Guitry opte pour un générique parlé dans lequel les traditionnelles mentions écrites relatives à la distribution sont remplacées par une évocation vocale [11]. D’ailleurs, en cette période d’interrègne, le film de Guitry n’est pas le seul à proposer ce type peu conventionnel de générique : il a été notamment précédé par Le mystère de la chambre jaune de Marcel L’Herbier (1930) et par Golgotha de Julien Duvivier (1935), ce dernier semblant, au vu de son sujet, actualiser l’incipit de l’évangile selon saint Jean en privilégiant le Verbe. Le film de L’Herbier — dont Catherine Berthé Gaffiero (2007, p. 248) dit que le « générique […] est pensé comme un clin d’oeil au film, si ce n’est “d’horreur”, du moins au film fantastique hollywoodien », ce qui souligne la parenté avec Frankenstein — et celui de Guitry mettent explicitement en évidence en leur entame la dimension machinique du cinéma, notamment en ce qui concerne la technologie sonore [12]. Cette réflexivité fait écho à la représentation plus indirecte, au sein de la diégèse filmique, de cette technologie, telle qu’on la trouve dans plusieurs films contemporains qui résultent d’un travail intéressant sur le son (voir le rôle du phonographe dans À nous la liberté, du cinéma parlant dans Prix de beauté ou du téléphone dans M le maudit). Nous conclurons par conséquent notre examen des débuts de films en prenant un exemple emblématique de la référence à ces instruments prothétiques offerts à la voix d’un locuteur, en l’occurrence celui de la radiophonie.

Entrer dans L’Atlantide par les ondes : la voix radiophonique inaugurale

Au début de l’année 1932, Georg Wilhelm Pabst réalise en versions allemande (Die Herrin von Atlantis), anglaise (Atlantis[13] et française (L’Atlantide) une adaptation du roman homonyme de Pierre Benoît (1919) déjà porté à l’écran en 1921 par Jacques Feyder. Le récit de ce film dont Pabst écrivit le scénario avec Alexandre Arnoux, critique français célèbre pour ses prises de position sur les premiers parlants, est structuré dans sa quasi-intégralité autour d’un retour en arrière qui a été pensé par ses auteurs pour être interprété comme une hallucination du personnage-narrateur Saint-Avit (interprété dans la version française par Pierre Blanchar) en proie à la fièvre (Metzner 1932, p. 154). Grâce au procédé, rare durant les premières années du parlant [14], de l’analepse audiovisualisée, cet énonciateur diégétique introduit over la mise en place du retour en arrière, puis se fait à nouveau entendre après plus d’une heure pour marquer d’une seule phrase le retour à la situation-cadre.

Cette subjectivisation de la représentation est toutefois précédée d’un prologue dans lequel la parole est donnée à une autre instance qui s’impose préalablement à la voix over de Saint-Avit : il s’agit de l’une de ces voix que Michel Chion (2003, p. 427) a proposé de nommer on the air, celle d’un speaker radio. Cet incipit, dont la première phrase (« Je résume… ») suggère que le texte est saisi par l’auditeur (du film) in medias res, contribue à créer un pacte de crédibilisation de l’univers mythologique qui nous sera présenté. Libérée d’un ancrage dans un lieu donné, puisqu’elle est transmise par les ondes, la voix mène le spectateur (européen) du studio émetteur situé en France jusqu’au poste récepteur d’un auditeur vivant au Sahara. D’abord montré de dos, le speaker est ensuite vu en voix synchrone puis, après deux gros plans sur le microphone qui placent le spectateur à l’origine supposée de l’émission vocale, un plan rapproché isole le haut-parleur de la station émettrice, avant qu’un travelling arrière ne permette de découvrir la présence de deux auditeurs. Un problème de transmission incite Saint-Avit à éteindre le poste, son témoignage prenant en quelque sorte le relais du commentaire radio en opposant l’expérience vécue à la connaissance livresque. Grâce au montage et au mouvement d’appareil — un travelling semi-circulaire reliant speaker et micro —, la dimension technologique est exhibée : l’appareillage nécessaire à la prise de son et les grésillements renvoient aux conditions électriques de la retransmission. On passe d’une voix acousmatique à une autre : la voix momentanément on the air (après avoir été in, puis off) du speaker est supplantée par la voix in, puis over du narrateur. En ce sens, la transition qui nous mène du prologue à la visualisation du cadre désertique qui sera celui de l’histoire, d’une parole ostensiblement transmise par un intermédiaire mécanique à la confession intime est symptomatique de l’abandon progressif d’une dimension réflexive induit par une volonté d’immersion du spectateur dans la fiction. Du point de vue de la technologie sonore, le prologue de L’Atlantide fonctionne à certains égards comme les génériques, dont Odin rappelait (1980, p. 204), en se référant à Metz, que s’ils « viennent inscrire le “désaveu” de l’effet fiction dans le film », ils fonctionnent en fin de compte au bénéfice de cet effet, le spectateur étant d’autant plus enclin à jouer le jeu qu’il peut se réconforter de n’avoir pas été dupe de l’illusion. En présentant un prologue qui expose la situation-cadre du récit en deux phases (la voix étant d’abord radiophonique puis over), Pabst met en évidence les conditions historiques, techniques et perceptives de l’émergence de la voix over au cinéma. On peut dire du speaker de L’Atlantide qui s’impose momentanément au spectateur avant la visualisation du monde du film qu’il est l’un des héritiers, à l’ère de la télétransmission de masse — la salle de cinéma est devenue le vaste monde —, de l’une des fonctions du bonimenteur du cinéma des premiers temps, qui s’ingéniait notamment à proposer à son public une contextualisation initiale de l’histoire racontée.

En examinant quelques-uns de ces avatars du bonimenteur présents à une époque où la voix vive est désormais intégrée au produit audiovisuel, nous avons tenté d’élargir aux réalisations cinématographiques du parlant la réflexion sur l’oralité initiée notamment par Germain Lacasse à propos du cinéma des premiers temps. Durant sa première décennie environ, le « parlant » s’inscrit en effet dans un contexte d’intermédialité où différentes pratiques contribuèrent à modéliser la façon d’envisager la dimension vocale. Tandis que Pabst recourt à la radiophonie, une technologie sonore qui était devenue extrêmement familière du public des années 1930, on observera au cours des années 1950 un retour de l’oralité grâce à la popularisation des formes télévisuelles. Ainsi un film comme The Phenix City Story (Phil Karlson, 1955), qui use de formes d’interpellation bannies du cinéma classique, est-il ouvertement marqué par le modèle du « direct » associé à la télévision. D’ailleurs, si un homme de théâtre comme Sacha Guitry a tôt su s’emparer de la radio et de la télévision (Fargier 2007), c’est parce que ces médias qui privilégient le direct — ou recourent, comme lui, au simulacre d’un rapport de simultanéité avec le public — offrirent de nouveaux prolongements à l’art théâtral, notamment, pour citer une proximité évidente, sous la forme des pièces radiophoniques et des « dramatiques [15] ». Les variantes du film Ceux de chez nous de Guitry constituent des jalons d’une histoire de la dimension orale au cinéma qui reste encore à faire : projeté durant la seconde moitié des années 1910 avec un accompagnement verbal live effectué par Guitry lui-même, ce film connaît, en 1939 (soit précisément à la fin de l’interrègne), une version avec voix over puis, en 1952, une version télévisuelle résultant d’un nouveau montage effectué par Frédéric Rossif et encadrée par les présentations de l’auteur assis à son bureau et commentant ces images d’autrefois présentifiées par la parole. Du bonimenteur dans la salle au speaker du petit écran, comme l’illustrent les états successifs de Ceux de chez nous et les manifestations de la voix dans les incipit que nous avons examinés, l’oralité se perpétue en exploitant les ressources des nouveaux médias, en informant la façon dont on envisage leurs usages et en se voyant en retour redéfinie par ces pratiques et ces dispositifs audiovisuels.