Article body

Cet article découle d’un long projet de recherche que je mène sur la matérialité de la voix féminine dans le temps et l’espace de la performance. Je propose ici une manière, parmi beaucoup d’autres, de « manipuler » et de théoriser la voix en tant que matériau théâtral polymorphe voyageant dans le temps[1]. Mon travail porte sur la façon d’utiliser la force et la volatilité du son comme un matériau de résistance féministe capable de déjouer les tentatives de contrôle et de limitation. Ces préoccupations apparaissent en filigrane dans la présente étude, qui porte sur un exemple particulier de performance du son sans limites fixes. J’examinerai ici la façon dont le son franchit les distances en me référant à des mises en scène de la voix dans des chorégraphies consciemment et délibérément fondées sur des distances spatiales et temporelles : à savoir la performance que j’ai mise en scène en 2010 en me servant du discours enregistré d’Eleanor Roosevelt, de ma propre voix en parallèle et du personnage de la Voix dans la pièce Dis Joe de Samuel Beckett.

Mon but étant de chercher à matérialiser les échos et les réverbérations transmis par une voix à travers le temps lors de la diffusion de documents audio, j’ai mis en scène l’enregistrement du discours historique prononcé par Eleanor Roosevelt pour l’adoption de la Déclaration universelle des droits de l’homme et, en parallèle, la lecture de ce discours par moi-même. L’enregistrement du discours tenu par madame Roosevelt à Paris le 9 septembre 1948 était diffusé par deux haut-parleurs placés face aux spectateurs assis, tandis que le même texte dit par moi-même résonnait simultanément dans leur dos. Plutôt que de se superposer exactement, les voix, projetées à partir des deux extrémités de la salle, se rencontraient et se mélangeaient dans l’espace de la performance. L’expérience proposée aux spectateurs consistait à prêter l’oreille à ce qui venait de l’avant et de l’arrière simultanément, sur le plan temporel (les voix de 1948 et de 2010) aussi bien que spatial (les locutrices se trouvant devant et derrière eux). En faisant ressortir explicitement les distances temporelles et spatiales de deux voix distinctes, je mettais en évidence la capacité propre au son de remplir les vides et de charger l’espace de sensations de présence matérielle. Dans la performance, la distance devenait un segment ou une unité de temps et d’espace à traverser : les voix projetées entre (au moins) deux points.

Permettez-moi de commencer par une réflexion plus approfondie sur cet espace qu’un son provenant de multiples temporalités peut « traverser », et ce, par des voies essentiellement matérielles. Je vais quitter l’espace de la performance théâtrale pour me tourner vers celui des expériences scientifiques, notamment celles d’un physicien du XIXe siècle, John Tyndall, qui a décrit les portions d’air traversées par le son en des termes sculpturaux évocateurs, en utilisant tout d’abord l’expression « couche d’air », et ensuite le mot « lame[2] » (Tyndall, 1869 : 3-6). Il a fait exploser un ballon et montré comment le son de l’explosion se répercutait dans l’air, en expliquant que « le mouvement de l’air très rapproché se communique rapidement à l’air situé un peu plus loin, en même temps que l’air mis d’abord en mouvement revient au repos » :

C’est ainsi que chacune des couches d’air qui entourent le ballon reçoit le mouvement de la couche d’air qui la précédait et le transmet à la couche qui la suit, sous forme de vague ou d’onde, et que l’impulsion sonore se propage de proche en proche à travers l’air

Tyndall, 1869 : 3

Dans cette façon de visualiser le mouvement des ondes sonores, le son produit par le ballon se propage, à partir de son point d’origine, de couche d’air en couche d’air, comme des cercles concentriques à la surface de l’eau[3], pour reprendre l’image couramment utilisée par analogie. Tyndall emploie, toutefois, l’image et la forme des couches d’air pour compartimenter le flux de sons à travers l’espace; elles évoquent une délimitation momentanée, alors même que le son continue à se propager de l’une à l’autre. Plus la couche d’air est loin de la source du son, plus ce dernier est faible, et il vient un moment où le son transmis cesse d’être audible. Pour l’enseignement de l’acoustique, Tyndall conçoit l’espace avec des métaphores sculpturales qui concrétisent l’intangible. Dans ses conférences, il explique que le son est toujours en action et constamment en mouvement et qu’en l’absence de mots, la production d’un son réel (comme celui de l’explosion d’un ballon) permet de faire comprendre expérimentalement et efficacement comment se propage le son.

Si nous pouvons, bizarrement, imaginer la voix transportée à distance dans le monde réel sous la forme d’un son propagé par des couches d’air jusqu’à nous et au-delà, construisant ainsi un cadre dimensionnel d’espace aérien proche et lointain, c’est que nous sommes, comme le rappelle Mladen Dolar, « constantly exposed » (Dolar, 2006 : 78). Le son est plus difficile à éloigner du champ corporel que la vue, car nous ne pouvons pas nous soustraire à ce sens; il nous est impossible de fermer nos oreilles comme nous le faisons avec nos yeux. Dans la performance de ma voix et de celle de madame Roosevelt, la distance a été (d’une certaine façon) moins compliquée à établir, du fait que les « locutrices » étaient visibles. Cependant, même si mon corps se trouvait réellement dans l’espace de la performance, ma voix a été, tout comme l’autre, diffusée par des haut-parleurs. Elle n’a jamais été entendue en direct sans amplification puisqu’un microphone avalait mes mots et que le système de sonorisation délocalisait ma voix vers l’arrière de la salle, derrière les spectateurs, de manière à la rediriger vers mon corps. Elle devenait ainsi une re-présentation d’elle-même, dont la source a été surimposée dans une autre partie de la salle.

La voix reproduite par un amplificateur technologique est devenue quelque chose d’« autre », comme provenant, au même instant, du corps vu et pas du corps vu. D’après Dolar, si nous voulons localiser une voix, « we need to use the visible as reference[4] » (Dolar, 2006 : 79). Mais qu’advient-il alors du corps visible quand notre voix est amplifiée et que des haut-parleurs électriques s’emparent de notre parole? Et que se passe-t-il si le corps parlant disparaît entièrement de la vue?

La résonance entre les deux voix (la mienne et celle de madame Roosevelt) dans l’espace de la performance est devenue un duo enjambant le temps et l’espace, mais également un jeu avec la dynamique du ventriloquisme à distance, où l’on imagine que le locuteur se trouve en deux endroits à la fois, comme une voix projetée vers un autre objet dans la même salle. Contrairement à ce qui se passe dans le ventriloquisme rapproché, où la marionnette assise sur les genoux est à proximité immédiate, le ventriloque à distance peut imiter la « modulation that sounds undergo traveling between points of distance or through obstacles[5] » (Davis, 2003 : 46). Dans ma performance, du fait que les haut-parleurs se trouvaient à deux endroits opposés, la voix était projetée à distance, mais par des moyens techniques. La métaphore du ventriloquisme à distance est, néanmoins, utile ici pour parler du rapport de la voix avec l’espace dans lequel elle se situe, surtout quand le corps du locuteur est mis en cause. Parlant du ventriloquisme à distance, Charles B. Davis souligne que l’écoute humaine est nettement vococentrique, car « human voice structures the hierarchy of sounds in space[6] » (Davis, 2003 : 46). Cette écoute attentive cherche à « localiser la voix en tant qu’agent parlant » (« localize the voice as speaking agent », Davis, 2003 : 46), à donner un corps aux paroles prononcées. C’est difficile à cause de l’espace et, en particulier, de la distance entre la source de la voix et l’endroit où se trouve le corps. Ainsi, « ventriloquism underscores the fact that the link between voice and identity is a fundamentally spatial concept[7] » (Davis, 2003 : 46). Nous localisons la voix avec nos yeux autant qu’avec nos oreilles en cherchant la source visible, et nous situons notre propre corps (en tant qu’auditeur) dans l’espace en appréhendant notre relation avec cette source.

Grâce au développement des technologies du son, nous sommes nombreux à entendre quotidiennement d’étranges voix acousmatiques, et ce phénomène, devenu familier, nous étonne moins (dans certaines circonstances). Lorsque nous circulons en ville, nous recevons des avertissements et des informations à la radio, au téléphone ou par haut-parleur, si bien que nous sommes culturellement habitués à entendre des voix sans nous demander avec surprise d’où elles viennent. Les méthodes et médias de transmission du son étant maintenant connus de tous, la voix sans corps est devenue un aspect de la vie de tous les jours. L’espace théâtral permet, toutefois, de faire naître l’illusion d’une voix décorporifiée, réveillant ainsi la curiosité dans l’esprit et l’oreille des spectateurs. Comme le théâtre met en scène des corps en mouvement qui parlent, un plateau vide rempli d’une voix seule offre un spectacle audible de présence et d’absence, où les spectateurs cherchent à trouver le corps, soit consciemment, soit inconsciemment.

J’ai recouru à une technologie d’amplification et de diffusion de ma voix (dans la performance Roosevelt) parce qu’elle me permettait de procéder à une expérience sonore : entendre le timbre de deux voix d’époques différentes qui se rencontraient dans l’espace. En outre, à cause de l’amplification, ma voix était dans un état matériel analogue à celui de la voix de madame Roosevelt enregistrée il y a longtemps, le volume de lecture étant le même. En ramenant le son au même niveau, je cherchais à uniformiser le plus possible l’écoute des deux voix parvenant, l’une de l’arrière et l’autre de l’avant, aux oreilles des spectateurs. Mais cette technologie bien connue posait également la question du rapport entre la voix et les corps parlants : le mien, présent, celui de madame Roosevelt, absent, et, finalement, le mien, absent aussi parce que devenu invisible pendant les derniers instants du discours enregistré.

La voix acousmatique, la voix dont on ne peut percevoir l’origine ou la source, demande un effort visuel aux spectateurs du fait que le corps n’est plus présent comme objet. Quand le corps disparaît tout en continuant à parler dans le cadre d’une mise en scène théâtrale, les voix deviennent la vie sur scène, la présence matérielle de l’absence. Mais l’expérience de la voix acousmatique change du tout au tout quand le corps de la voix qui parle n’apparaît jamais à la vue, comme ce fut le cas avec Pythagore, qui a transmis son enseignement à ses disciples à travers un rideau pendant cinq ans. Quand le corps a d’abord été visible et qu’il se met ensuite à parler hors scène, il reste un peu plus tangible pour le public : celui-ci peut, en effet, refaire un tout avec la voix et le corps, même si ce dernier est à moitié à l’extérieur de la scène. Au contraire, le corps parlant invisible, jamais ou pas encore dévoilé, exige un type d’attention différent, étant donné que nous sommes « presque toujours » passés derrière l’écran et avons fantasmé autour de l’objet énigmatique (Dolar, 2006 : 66). Comme je l’ai évoqué ci-dessus, Pythagore se dissimulait derrière un rideau pour dispenser son enseignement à des étudiants qui gardaient le silence et que l’on appelait les acousmatiques. Auditeurs de la voix d’un maître, ils cherchaient avant tout à saisir le sens de ce qu’ils entendaient. Mais en plus, comme le dit Dolar, la voix de Pythagore avait acquis « authority and surplus-meaning by virtue of the fact that its source was concealed[8] » (Dolar, 2006 : 61). La voix devient ainsi nimbée d’une aura et cela dure jusqu’au moment de la révélation, quand « [t]he aura crumbles, the voice, once located, loses its fascination and power, it has something like castrating effects on its bearer, who could wield or brandish his or her phonic phallus as long as its attachment to a body remained hidden[9] » (Dolar, 2006 : 67). Perdre le « phallus phonique », c’est perdre l’autorité venant de l’attention particulière attachée à la voix. Quand on ne présente que la voix, celle-ci a le potentiel d’agir presque comme un corps étrange en soi (comme la seule présence matérielle d’un corps), qui peut échapper au regard interrogateur et jouir de sa propre autonomie indéterminée. Pour désigner le processus de rétablissement du lien entre la voix et sa source, Michel Chion a créé le mot désacousmatisation, qui évoque un acte de strip-tease par lequel la voix dévoilerait le corps d’où elle provient[10]. Toutefois, comme Dolar le rappelle finalement, nous ne pouvons jamais entièrement dévoiler la source de la voix parce que celle-ci vient des profondeurs du corps, qui ne sont pas à portée de vue.

À propos de Dis Joe de Samuel Beckett

Dans la pièce Dis Joe qu’il a écrite pour la télévision, Samuel Beckett double la voix intérieure : il y a le monde intérieur hors scène et l’espace mental de Joe. Dans la représentation montée en 2006 au Duke of York’s Theatre, Penelope Wilton, en tant que Voix féminine décorporifiée, parlait sur l’image de Michael Gambon dans le rôle de Joe. La pièce étant initialement destinée à la télévision, Beckett avait demandé que la caméra reste statique pendant que l’on entendait la voix, mais dans la production théâtrale, on apercevait à la fois Joe en chair et en os, dans sa petite chambre, et une projection de son visage sur un écran. Quand la voix de Penelope Wilton se faisait entendre sur la scène, la caméra restait figée sur le visage de Michael Gambon, saisissant en détail l’acte d’écoute, traduit en actions par les expressions faciales. Joe réagissait à la voix dans une séquence en gros plan, ce qui donnait un portrait virtuel en mouvement, où la puissance de la voix entendue se matérialisait dans les mouvements amplifiés du visage à l’écoute. En voyant Joe réagir physiquement à la voix, j’entendais effectivement à travers deux canaux. Comme spectatrice, j’écoutais avec mes propres oreilles et, devant le corps attentif et réactif de Joe, j’entendais, en effet, avec ses oreilles à lui[11]. Nous, les spectateurs, étions invités à devenir les auditeurs de la voix intérieure de Joe, du fantôme qui le hantait personnellement. Billie Whitelaw, qui a joué le rôle de la Voix en 1989, a expliqué qu’elle parlait avec la bouche collée au microphone, comme si « her voice is dripping into his head[12] » (Whitelaw, citée dans Ben Zvi, 1992 : 7). La voix qui parle ainsi semble bizarrement se déplacer dans deux directions opposées, venant de la tête (voix intérieure devenue extérieure) et tendant simultanément vers la tête (s’y déversant; voix extérieure devenue intérieure). La voix de « l’autre » est fluide par rapport au corps de Joe, tour à tour internalisée et externalisée. En plus, elle a un effet sur le corps des spectateurs, sur tous les écoutants :

Voice forces Joe to see – to envision the scene as though he had been there, as though he had been inside the young woman’s suffering mind and body. She forces the listener to perform that leap of the imagination which takes us out of ourselves, allows us to coincide entirely with another being[13]

Lamont, 1992 : 232

L’écoutant performe à cause de la puissance de la Voix. Comme Beckett l’a écrit à Alan Schneider, la Voix doit être « [a]ttacking. Each sentence a knife going in, pause for withdrawal, then in again[14] » (Schneider, cité dans Ackerley, 2009 : 158). Cette indication viscérale concernant la voix féminine décorporifiée pousse littéralement à pénétrer dans le corps à travers la peau, à perforer celle-ci. La voix devient un matériau grâce à sa capacité imaginaire de percer la matière corporelle. Les indications scéniques misent encore plus sur ce point en exigeant que la caméra se rapproche progressivement de Joe tout au long de la pièce. Ce lent rapprochement en neuf étapes semble commandé par la voix devenue « un dispositif technique, au même titre que le chariot de la caméra » (« a technical device, on a par with the dolly », Lamont, 1992 : 229). Rosette Lamont met en lumière l’importance des « neuf mouvements légers vers le visage » (« nine slight moves towards the face », Lamont, 1992 : 233) demandés par Beckett dans les indications scéniques du début, en attirant l’attention sur le fait que ce nombre est associé à la mort. À mesure que la caméra se rapproche du visage de Joe, le corps sort progressivement du cadre : il s’éloigne du monde des corps physiques et s’engage dans « le processus de sortir de sa vie » (« the process of leaving his life », Lamont, 1992 : 233). La distance parcourue par la caméra équivaut ici à l’agonie. La voix, en dirigeant la progression de la caméra, dirige, par extension, la dissociation graduelle (implicite) de Joe et du monde matériel. La voix, qui décide de ce que le public aperçoit, dévoile Joe dans une proximité mesurée et cadre son corps pour que les spectateurs se hissent vers lui. Ici, la Voix féminine fixe le corps masculin dans l’espace et tient les commandes de la distance entre le spectateur et le performeur. En outre, c’est le son de la Voix qui influe sur cette distance, poussant le public encore plus loin dans l’image. Et pourtant, inévitablement, c’est Joe en train de penser la voix qui la fait retentir haut et fort, signalant ainsi les relations et les glissements entre le sujet et l’objet des commandes. La voix met Joe au défi de parler afin d’écouter sa propre voix : « personne ne t’écoute » / « écoute-toi » (Beckett, 1972 : 84). Joe reste, néanmoins, un auditeur silencieux du début à la fin, conscient, sans doute, que, paradoxalement, s’il parlait, il ne ferait que s’entendre parler, acte qu’il est déjà, en un certain sens, en train d’accomplir.

Dans Dis Joe de Beckett, la Voix n’apparaît jamais, n’est jamais dévoilée et, métaphoriquement parlant, garde les vêtements qu’elle aurait pu perdre dans le strip-tease de la désacousmatisation. Mais le pouvoir énigmatique de la voix décorporifiée se complique, du moins au théâtre, quand un autre corps est visible sur scène. Dans ce cas, nous sommes obligés d’assigner la voix décorporifiée au royaume de l’imagination du corps visible, à ses voix intérieures. Dans le cadre sémiotique du théâtre, la voix hors scène a quelques effets connus, dont la propension à vouloir attribuer une voix à un corps plutôt que de la laisser flotter seule en tant que son-objet. Selon Dolar, la voix est « the link which ties the signifier to the body[15] » (Dolar, 2006 : 59) :

There must be a body to support it and assume it, its disembodied network must be pinned to a material source, the bodily emission must provide the material to embody the signifier, the disembodied signifying mechanics must be attached to bodily mechanics, if only in its most intangible and « sublimated » form, the mere oscillation of air which keeps vanishing the moment it is produced, materiality at its most intangible and hence its most tenacious form[16]

Dolar, 2006 : 59; souligné dans le texte

Une voix à distance du corps porte également en elle la localisation temporelle des paroles prononcées ainsi que les périodes traversées pendant sa transmission du locuteur à l’écoutant, car ce ne sont pas seulement les matériaux d’autres corps qui voyagent dans les voix émises par l’enregistreur ou les voix hors scène, mais aussi les matériaux d’autres temps historiques et d’autres lieux. La voix « détachée » est donc riche d’informations presque toujours floues et, par conséquent, potentiellement productives dans leur forme tenace parce qu’intangible : forme qui va et vient constamment entre le tangible et l’intangible, le matériel et l’immatériel.