Corps de l’article

Les circuits électriques ne sont pas les seuls à occasionner des distorsions auditives : la voix humaine peut elle aussi produire une variété de sons saturés. La voix saturée du genre métal est aussi nommée « chant guttural » (Visca 2018, 18). Cet adjectif renvoie à « un son rauque émis du fond de la gorge » (Larousse 2021), au coeur de la musique métal. En dépit du fait que certains chanteurs et chanteuses métal présentent des voix claires ou même lyriques, plusieurs évitent le chant clair au profit des techniques du chant guttural (Walser 1993, 42). N’utilisant que très peu de ressources mélodiques pour s’exprimer musicalement, ces artistes accordent plutôt une importance particulière au timbre (Smialek 2012, 2).

Cette saturation résulterait d’une voix en apparence poussée au-delà de ses propres limites, à la manière des amplificateurs. L’énergie canalisée, dans ce cas-ci, à travers les organes phonatoires, générerait un signal acoustique d’intensité sonore supérieure ; tout cela, sans ajouter de transistors, pour créer les effets de distorsion (Borch et collab. 2004, 147-153). Les chanteurs et chanteuses métal émettent diverses distorsions vocales et ce, sans aucun circuit électronique. Je tenterai dans ce texte de répondre à la question suivante : de quelle manière la biomécanique humaine produit-elle ces techniques vocales ?

Les travaux publiés sur les voix saturées du métal n’en sont qu’à leurs balbutiements et, corollairement, ne sont pas toujours exacts. La dernière décennie a vu émerger une série de conférences universitaires internationales, d’articles et de monographies sur la musique métal. Parmi ces études récentes figurent entre autres l’étude Heavy Metal Vocal Technique Terminology publiée en 2019 par l’université de Helsinki et rédigée par Paolo Ribaldini, l’exposé Musical Aspects of Vowel Formants in the Extreme MetalVoice présenté en 2012 par Eric Smialek, Philippe Depalle et David Brackett lors du 15th Conference on Digital Audio Effects de l’Université McGill. À ces ressources s’ajoute la monographie Death Metal Music : The Passion and Politics of a Subculture produit en 2003 par Nathalie Purcell, les films documentaires Metal : A Headbanger’s Journey et Global Metal réalisé par Sam Dunn, ainsi que la création de l’International Society for Metal Music Studies (IMMS[1]). Cependant, ces études s’intéressent davantage aux phénomènes sociaux entourant le métal qu’au métal en tant que système musical cohérent (Wallmark 2018, 66). De plus, lorsque les ouvrages ou articles abordent le sujet des techniques vocales utilisées dans la musique métal, leurs lacunes terminologiques entraînent la confusion sur le plan des dénominations des techniques vocales, ainsi que du fonctionnement de l’appareil vocal, ce qui entraîne par conséquent de la discordance entre les recherches. En effet, les chercheurs et chercheuses utilisent par exemple des termes différents pour décrire les mêmes types de voix saturées, présentent des techniques distinctes sous une même nomenclature, ou proposent encore plusieurs fois la même technique sous des appellations différentes. Au final, les chanteurs et chanteuses, livré·e·s à eux-mêmes, se voient contraints de s’appuyer sur des tutoriels en ligne, lesquels s’appuient rarement sur des recherches scientifiques. Sans une bonne maîtrise de ces techniques vocales, les apprenti·e·s chanteur·se·s s’exposent à des risques de blessures à l’appareil vocal. Discerner de façon adéquate les dissemblances entre les techniques vocales favorise une meilleure compréhension de l’instrument vocal, confirme la nécessité d’une classification rigoureuse et fait valoir le potentiel de ce champ de recherche encore insuffisamment développé. Nous verrons donc comment les distinguer et, dans un même souffle, les identifier avec précision.

La première section de cet article sera dédiée à l’altération sonore appelée « distorsion ». Ensuite, afin de saisir les mécanismes abstrus de la voix, un survol du fonctionnement de l’appareil vocal humain sera proposé. Puis, les fondements des trois principales techniques de voix saturée caractéristique du chant métal, soit le growl, le fryscream et le harsh vocal, seront explicités dans l’intention d’élucider leurs distinctions. Pour chaque technique, je fournirai des exemples de chanteur·se·s qui les pratiquent. Finalement, une dernière section sera réservée aux risques auxquels s’exposent les chanteur·se·s non expérimenté e·s, ainsi qu’à l’importance de l’éducation dans la saine utilisation de la voix.

La distorsion

Une intensité sonore élevée et une distorsion omniprésente constituent les attributs les plus déterminants du genre métal (Wallmark 2018, 67) (Walser 1993, 41). Le titulaire de la Chaire de recherche du Canada en ethnomusicologie Harris Berger[2] et l’ethnomusicologue canadienne Cornelia Fales mentionnent, dans une même étude que l’expression « lourdeur », souvent utilisée pour définir la musique métal, serait associée notamment à la distorsion des sons de guitare (Berger et Fales 2005, 183). Le concept de « lourdeur » (heavy) est également adopté par les membres de la sous-culture métal, qui l’associent à une gamme de timbres instrumentaux (Berger et Fales 2005, 181). La distorsion apparait couramment dans la création de sons « saturés », un adjectif définie comme « être rempli, imprégné à l’excès de quelque chose » dans le dictionnaire Larousse (2021). Tout d’abord, il faut savoir qu’une onde sonore de hauteur constante est composée d’une superposition de sons élémentaires, nommés harmoniques, dont les fréquences sont des multiples entiers de l’onde fondamentale. Les fréquences inharmoniques, également nommées partiels, sont des fréquences qui, contrairement aux harmoniques, ne constituent aucun multiple entier de la fréquence fondamentale (Gouttenoire et collab. 2021, 128). La distorsion découle d’une saturation de fréquences harmoniques et inharmoniques, habituellement créée en compressant les pics du signal audio d’un instrument de musique électronique en y ajoutant des partiels acoustiques. Cette saturation rend la texture du timbre rugueuse ou même granuleuse (Arnoux 2018, 24). Avant que les technologies n’aient été mises au point, la manifestation de ce timbre complexe et déformé résultait d’une défaillance électromécanique provoquée en poussant les premiers amplificateurs au-delà de leur fonctionnement habituel, entraînant l’apparition de fréquences inharmoniques dans le son (Wallack 2018, 68). La distorsion est devenue un synonyme de puissance, « une transgression intentionnelle plutôt qu’une surcharge électronique accidentelle » (Walser 1993, 42). Bien que des timbres similaires existent dans d’autres genres musicaux ; tels que le rock, le hard rock et le punk, la distorsion demeure intrinsèque à la musique métal (Wallach 2011, 11). Pierre Arnoux, dans son article intitulé « Overdrive : Théorie d’une sonorité électrique », examine et compare plusieurs types de saturations utilisées par différents groupes musicaux. Il observe à travers eux « l’expression d’une constellation de choix musicaux et techniques, de péripéties technologiques, d’accidents matériels et d’événements imprévisibles » (Arnoux 2018, 15).

L’appareil vocal

L’appareil vocalique rassemble l’ensemble des organes de la parole et les muscles qui les actionnent. Un survol de son fonctionnement est nécessaire afin de comprendre les mécanismes de la voix saturée.

Figure 1

Appareil vocal, larynx, vue antérieure et vue endoscopique.

-> Voir la liste des figures

Le larynx peut ouvrir et fermer les voies respiratoires à trois niveaux : le niveau supérieur est celui du sphincter aryépiglottique et de l’épiglotte, le deuxième niveau est celui des plis vestibulaires et le dernier niveau est celui des plis vocaux (Estill 2017, 60).

L’épiglotte, les muscles aryténoïdes et les plis aryépiglottiques forment un tube étroit autour des plis vocaux nommés sphincter aryépiglottique. Les muscles qui constituent le larynx peuvent modifier leur forme et ainsi le son produit (Estill 2017, 117). Ce sont les niveaux médian et inférieur qui contiennent les mécanismes vibrateurs à la base de l’exécution du chant guttural. À la suite des vibrations créées par les plis vocaux et les plis vestibulaires, d’autres structures peuvent également se mettre en vibration, telles que l’épiglotte elle-même et les aryténoïdes (Chevailler et collab. 2011, 350). Les aryténoïdes sont les seuls cartilages mobiles du larynx, situés dans le cartilage thyroïde, au-dessus du cartilage cricoïde. Ils écartent et rapprochent les plis vocaux (Larousse 2021).

Lors de la respiration, les plis vocaux s’ouvrent afin de permettre au flux d’air de circuler librement. Pendant la phonation, il y a adduction[3] des plis vocaux jusqu’à ne laisser qu’un espace minimal entre eux (correspondant à la glotte). La pression de l’air sort des poumons et écarte les plis vocaux. Puis, celle-ci diminue drastiquement entre la trachée et la glotte. Enfin, cette pression devenue négative au niveau des plis provoque une force d’aspiration qui les accole à nouveau. Ce phénomène physique, expliquant l’auto-oscillation des cordes vocales, est nommé le principe Bernoulli (Pelorson et collab. 2001).

Situé juste au-dessus des plis vocaux, le second vibrateur laryngé est constitué des plis vestibulaires. Ces plis sont souvent nommés « bandes ventriculaires », « faux plis vocaux » ou « fausses cordes vocales ». Ayant l’apparence de deux bourrelets membraneux, il possède des caractéristiques biomécaniques qui lui sont propres. La fonction première des plis vestibulaires est de fermer le larynx lors de la déglutition afin d’assurer l’étanchéité des voies aériennes. Pourtant, ils sont aussi utilisés dans le but de créer une certaine « rugosité » dans la voix : comme pour les plis vocaux, les plis vestibulaires se rapprochent et entrent en interaction aérodynamique (Henrich 2012, 26-27).

Trois techniques de chant guttural

La prochaine section de cet article présente les trois principales techniques de voix saturées utilisées dans la musique métal, soit le growl, le fry scream et le harsh vocal. Ces trois techniques se différencient les unes des autres par un paramètre biomécanique, à savoir l’usage ou non des plis vestibulaires lors de la phonation, ainsi que par un paramètre acoustique, soit la présence ou l’absence de note fondamentale.

Ces paramètres apportent une définition aux trois principales techniques de voix saturées, mais n’englobent pas la totalité des variations sonores possibles. Pour les évoquer de façon non exhaustive, ces variations peuvent être obtenues en changeant par exemple, la position des lèvres ; la hauteur du larynx et la position de la langue peuvent par exemple être modifiées afin d’adapter la voix au style musical souhaité. De plus, des changements de paramètres vocaux peuvent intervenir afin de donner l’impression qu’il s’agit d’une tout autre technique vocale. Néanmoins, les trois catégories de base proposées constituent une fondation sur laquelle il est possible de s’appuyer pour adapter sa voix selon les nuances et variations souhaitées. Il importe donc de bien les assimiler.

Tableau 1

Paramètres distinctifs des trois techniques de voix saturées du métal

Paramètres distinctifs des trois techniques de voix saturées du métal

-> Voir la liste des tableaux

Le growl

Jouissant d’une présence accrue dans le death metal, le growl arbore le surnom usuel de « voix death » (Visca 2015, 14). Malgré cette dénomination, il est utilisé dans plusieurs autres catégories de musique métal. De fait, ce type de chant guttural est le plus employé de la musique métal.

L’intensité sonore du growl étant élevée, sa fréquence fondamentale est difficilement perceptible à travers sa distorsion ; de plus, ses variations spectrales sont substantielles (Nieto 2013, 1). Composée de sous-harmoniques qui changent d’amplitude sans alignement de phases (Nieto 2008, 39), cette distorsion vocale est le résultat d’une voix qui semble poussée au-delà de ses propres limites. Les plis vocaux et les plis vestibulaires oscillent afin de créer une diplophonie inharmonique (Eckers et collab. 2009,1748-1750), c’est-à-dire une affection qui touche l’appareil phonatoire et qui se traduit par l’émission simultanée de deux sons de hauteurs différentes (Shigeru et collab. 1993, 13). Les chanteur·se·s doivent rapprocher leurs plis vestibulaires tout en les gardant assez détendus pour y laisser passer l’air, les faisant ainsi osciller conjointement avec les plis vocaux. Tout dépendant du registre vocal, d’autres structures peuvent vibrer : ces vibrations sont le résultat d’une transmission vibratoire et ne sont pas des mécanismes vibrateurs en soi (Chevailler 2011, 349).

Tableau 2

Exemples de chanteurs et chanteuses utilisant la technique du growl

Exemples de chanteurs et chanteuses utilisant la technique du growl

-> Voir la liste des tableaux

Le fry scream

Le fry scream s’obtient en produisant ce que l’on nomme le rattle ou la voix fry, qui consiste en un frottement glottique rappelant un son de grincement de porte (Estill 2005). Cette technique s’emploie entre autres dans la musique country ou populaire (Nyx 2016), avec l’ajout de distorsion.

La chanteuse, chercheuse et éducatrice de renommée mondiale Jo Estill dédie un chapitre complet de son manuel The Estill Voice Model aux différents modèles d’oscillation des plis vocaux. Le degré de fermeture des cordes vocales au cours de chaque cycle de vibration représente un paramètre important de la phonation : cette phase est influencée par la longueur, la masse et la tension des plis vocaux. (Estill 2017, 73). Pour produire le fry scream, il faut tout d’abord obtenir un son grinçant (le rattle ou la voix fry). Lors de la production de cette qualité vocale, les plis vocaux se trouvent relâchés et leurs pulsations plutôt désordonnées (Estill 2017, 79). Une détente absolue de l’appareil vocal est nécessaire afin d’y produire une série d’impulsions glottiques espacées, induites par l’inspiration ou l’expiration et ce, de manière à obtenir la distorsion. Contrairement au growl, les plis vestibulaires ne sont pas employés, ce qui produit un son lumineux d’intensité sonore moindre (Nieto 2013). La fréquence fondamentale du son est également difficile à percevoir.

Tableau 3

Exemples de chanteurs et chanteuses utilisant la technique du fry scream

Exemples de chanteurs et chanteuses utilisant la technique du fry scream

-> Voir la liste des tableaux

Le harsh vocal

Ce type de voix est utilisé tant dans le métal que dans le rock. Les chanteur·se·s produisent un son beaucoup plus grave que la note fondamentale émise, exposant un spectre harmonique riche, tout en gardant la fréquence fondamentale perceptible (Nieto 2013, 2).

Tout comme pour le growl, la technique repose sur les vibrations des bandes ventriculaires et des plis vocaux, ainsi que de l’épiglotte et des cartilages aryténoïdes, dans certains cas où l’aigu de la voix est sollicité. La superposition du vibrateur principal au son du vibrateur secondaire confère au timbre un aspect rauque et granuleux. Les fréquences sous-harmoniques sont produites par le deuxième vibrateur, celui-ci ayant sa propre fréquence fondamentale, soit celle émise par les bandes ventriculaires (Chevailler 2011). Le co-vibrateur est perçu à l’octave inférieure lorsque les bandes oscillent deux fois moins vite, et à la quinte inférieure lorsque les bandes vibrent trois fois moins vite que les vrais plis vocaux (Heinrich et collab. 2006).

Tableau 4

Exemples de chanteurs et chanteuses utilisant la technique du harsh vocal

Exemples de chanteurs et chanteuses utilisant la technique du harsh vocal

-> Voir la liste des tableaux

Les risques

Le nombre croissant de chanteurs et chanteuses métal soulève l’importance de se questionner sur les risques de blessures, particulièrement en ce qui concerne le danger de développer des troubles vocaux à la suite de la production fréquente du chant guttural (Eckers et collab. 2009, 1747). Le métal est caractérisé par une combinaison de réglages vocaux. L’utilisation de ces diverses qualités vocales peut entraîner des tensions et exercer des effets indésirables sur la qualité globale de la voix (Narasimhan 2020, 244). En plus de vouloir chanter fort, les chanteurs et chanteuses métal souhaitent également chanter longtemps. Bien que les muscles de l’appareil vocal soient puissants, ils peuvent se fatiguer rapidement, ce qui résultera en une douleur laryngée, un déréglage du souffle, ainsi qu’en l’apparition éventuelle de lésions sur la muqueuse laryngée. Un mauvais comportement vocal répété peut être la cause de problèmes sérieux, tels que des nodules, un sulcus, des vergetures, des kystes, un oedème en fuseau, des polypes, un oedème de Reinke, des granulomes, ou une ectasie vasculaire (Visca 2015, 39-44).

Il a été démontré que les mécanismes vocaux employés par les chanteurs et chanteuses métal sont généralement efficaces : « le mécanisme supraglottique utilisé par les chanteurs de métal est performant : il leur permet de crier fort et assez longtemps, tout en préservant leurs cordes vocales » (Eckers 2011, 44). Néanmoins, une étude effectuée en 2009 mentionne l’apparition de facteurs de stress, tels que l’enrouement de la voix parlée ou de sensations de grattement dans la gorge, lorsque des chanteurs produisaient le growl pendant plus de deux heures (Eckers et collab. 2009, 1747-1750). Celle-ci ne mentionne pas si les sujets de l’étude avaient préalablement suivi une ou plusieurs formations en chant. Afin d’éviter les blessures, il est recommandé d’avoir une formation adaptée ou, du moins, de suivre des cours de chant traditionnel puisque « la saturation de la voix chantée devrait reposer sur le geste sain et physiologique du vibrateur principal » (Visca 2015, 97). Certains chanteurs et chanteuses métal expérimenté·e·s, comme Angela Gossow[4], offrent des classes de maîtres ou des cours en ligne. Pourtant plusieurs d’entre eux n’ont pas eu de formation et n’intègrent que très rarement des notions basées sur des recherches scientifiques. À l’exception de la coach vocale Melissa Cross[5], un nombre infime de professeur·e·s qualifié·e·s se sont aventuré·e·s à enseigner le chant guttural. De plus, les écoles de musique n’offrent que très rarement des cours axés sur la performance du genre métal ; de nombreux chanteurs et chanteuses métal en formation se replient sur des forums ou des tutoriels en ligne (Visca 2015, 39). Le coach vocal David Féron[6] met d’ailleurs en garde ces artistes « métalleux » : « si on ne maîtrise pas la technique de chant, le larynx risque de ne pas supporter la pression trop forte. [...] Sans technique, pas un seul métalleux ne se fait pas mal aux cordes vocales » (L’OBS 2017). Les enseignants ont eux-mêmes observé que l’apprentissage du chant traditionnel est fondamental afin de maîtriser de façon adéquate le chant saturé (Visca 2015, 73).

Tableau 5

Description de blessures pouvant apparaître à la suite d’un mauvais traitement de l’appareil vocal

Description de blessures pouvant apparaître à la suite d’un mauvais traitement de l’appareil vocal

-> Voir la liste des tableaux

Les personnes aux prises avec des problèmes vocaux liés à la voix saturée, tout comme ceux liés à la voix claire, peuvent être traitées par un orthophoniste : « l’amélioration du geste phonatoire permet d’atteindre les objectifs rééducatifs mis en place alors que la lésion est toujours présente. Ainsi, le patient peut récupérer sa voix sans intervention chirurgicale » (Visca 2015, 48). Une amélioration du geste du vibrateur principal sur l’utilisation de la voix saturée permet un rétablissement.

Conclusion

Le métal découle d’influences finement distillées de plusieurs autres musiques. Cette panoplie de sous-genres permet aux auditeur·rice·s de voyager d’une musique « agressive » vers des ambiances célestes, en passant par des accents blues ou mêmes celtiques. La distorsion est l’élément qui lie en globalité tous ces sous-genres. Les guitares électriques ne sont d’ailleurs pas les seules à se prévaloir des timbres saturés : plusieurs chanteurs et chanteuses métal, on l’a vu, y recourentégalement.

Une voix saturée serait une voix qui est imprégnée à l’excès de fréquences harmoniques ou inharmoniques : plusieurs techniques vocales peuvent y être associées. Les renseignements transmis par les chercheur·se·s sont légitimes, mais beaucoup d’entre eux traitent les techniques vocales de manière similaire et négligent fréquemment certaines techniques vocales. Par analogie, c’est un peu comme si un botaniste supposait que l’immense variété de feuilles à travers le monde provient d’une souche d’arbre unique. Pourtant, différentes techniques vocales bien distinctes sont à l’origine des voix saturées. De plus, le chanteur ou la chanteuse adapte sa technique vocale afin d’obtenir un style homogène au genre musical ; certains paramètres, tels que la position des lèvres ou de la langue, sont modifiés afin d’obtenir une couleur différente. Pensons, par exemple, à la voix nasillarde utilisée dans le country. Les ramifications du chant saturé sont variées. Il serait donc intéressant de connaître comment les définir et les différencier maintenant que nous connaissons ses trois principales souches.

Tel que mentionné dans l’ouvrage Genres and Expression in Extreme MetalMusic (2015) d’Erik Smialek, bien que les chercheur·se·s ne soient pas encore familiers avec les diverses nuances derrière les voix saturées du métal, prendre conscience de leur existence représente déjà un bon départ en soi. Les informations sur le growl, le fry scream et le harsh vocal présentées dans cet article pourront sans doute contribuer à une meilleure compréhension de leurs dissemblances et permettre d’effectuer des recherches approfondies sur le sujet. Une fois que les mécanismes physiques et acoustiques liés aux paramètres vocaux seront mieux établis, c’est-à-dire selon des critères scientifiques, la production d’un traité de pédagogie colligeant les méthodes d’enseignement de ces techniques pourrait permettre de rassembler les connaissances utiles aux enseignants potentiels afin de leur permettre de transmettre leur savoir sans information erronée ni contradictoire.