Les voix, les sons, les mots

Conversation avec Nicolas Cantin, ingénieur du son

/ Entretien paru dans le numéro de mai 2015 de BANDE A PART, magazine de cinéma /

Il a travaillé avec Olivier Assayas, Benoît Jacquot, David Cronenberg, Brian De Palma, Anne Le Ny, Anne Fontaine ou Bertrand Bonello, et fait partie des proches collaborateurs d’Arnaud Desplechin. Nicolas Cantin est ingénieur du son et, à ce titre, figure au générique de Trois souvenirs de ma jeunesse. Comme beaucoup de ses confrères actifs dans l’industrie du cinéma français, Nicolas Cantin a été formé à l’École nationale supérieure Louis-Lumière et joue de la musique à ses heures perdues (du saxophone et de la guitare). Rencontre avec un technicien à l’oreille affûtée.


 

En quoi consiste exactement votre fonction ?

D’une part, j’enregistre sur le plateau les voix des comédiens et les sons inhérents aux scènes et, d’autre part, avec Arnaud Desplechin, je fais le montage des paroles. J’interviens donc en post-production, ce qui n’est pas si habituel pour un ingénieur du son, sauf avec quelques réalisateurs, comme Arnaud. Ce qui permet d’être là du premier jour de tournage au dernier jour du mixage, de suivre et d’accompagner la création de la bande-son du début à la fin. L’ingénieur du son a la responsabilité de récolter le son direct sur le plateau et les « sons seuls » en parallèle pour nourrir la bande-son, et en général, le travail de l’ingénieur du son s’arrête avec le tournage. Puis intervient le couple monteur / réalisateur qui construit le film et, ce faisant, pose les directs, les musiques, et quelques sons signifiants. Puis, quand ce travail de montage est fait, on confie les sons, tels qu’ils ont été assemblés, à l’équipe son, constituée d’un monteur son et d’un monteur paroles. C’est le monteur son qui va composer la bande-son : les ambiances, les effets, à partir des « sons seuls » du tournage et à partir de sons qui peuvent aussi provenir de sonothèques ou d’ailleurs. En ce qui concerne le monteur paroles, il va lui falloir travailler à la fluidité de sons directs, à l’intelligibilité des dialogues. Il faudra peut-être aller chercher une syllabe dans ce qu’on appelle des « doubles », c’est-à-dire dans une prise qui n’a pas été choisie, mais dans laquelle le mot avait été prononcé correctement, le tout sans trahir les intentions de jeu. Avec Arnaud Desplechin, il arrive qu’il me demande de chercher des doubles pour changer le jeu des acteurs, pour créer une rupture, par exemple, car il n’aime pas la linéarité d’une prise. Sa façon de prendre en compte tout le matériel sonore est assez fascinante. Arnaud compose énormément son film comme ça. D’une certaine manière, il continue à diriger ses comédiens au montage tout comme il le fera au mixage, en faisant varier le volume des voix, par exemple, toujours en lien avec les intentions des personnages.

Sur le plan labial, l’image et le son ne risquent-ils pas de ne pas correspondre, lorsque vous utilisez un mot d’une autre prise ?

On se débrouille pour que ça corresponde, mais il y a deux ou trois plans où je ne regarde pas trop précisément les lèvres, mais pris dans la globalité, ça marche très bien. Cette intervention d’Arnaud sur le jeu au moment du montage est très intéressante.

Ce qui va avec son goût anti-naturaliste du jeu…

Oui, il a cette façon de surinvestir les intentions. De la même manière que, lorsqu’il dirige ses comédiens, il cherche toujours à aller vers le romanesque, l’expressivité, l’héroïsme, enfin globalement la surprise, l’inattendu. Il est merveilleux à entendre lorsqu’il explique les choses à ses acteurs et qu’il leur joue les scènes. Il surélève toujours le texte, il éclaire les scènes par sa direction. J’ai un souvenir extraordinaire d’une scène dans Un conte de Noël, dans la cuisine avec tous les personnages autour de la table. Arnaud a joué les rôles à tour de rôle, de façon outrancière. C’était une explication de texte, il donnait les intentions, on était tous assis comme au théâtre à le regarder jouer tous les personnages en faisant des parenthèses pour expliquer les non-dits, les lapsus, les subtilités. C’est sa façon à lui de nourrir les acteurs. Emmanuelle Devos me disait qu’il ne fallait surtout pas chercher à l’imiter, sinon c’était la catastrophe, tellement il en fait trop ! Et là, dans Trois souvenirs, avec ces jeunes comédiens, il allait les chercher, les surprenait, leur donnait des idées, leur expliquait ce qui se cache derrière les mots. Arnaud a cette manière de surinvestir les intentions et lorsque les acteurs s’approprient la scène, c’est magnifique, car la scène décolle. Il intervient de cette manière à tous les stades, jusqu’au mixage où il dirige son mixeur comme il dirige ses comédiens. Même chose pour la caméra. Il lui arrive de prendre la caméra pour montrer ses intentions à sa cadreuse.

Comment vous « dirige »-t-il, vous ?

Ce n’est pas qu’il me dirige, c’est qu’il m’emporte, comme il emporte toute l’équipe avec son énergie. Il y a chez lui une générosité mêlée d’impatience. Tout doit aller très vite et on est toujours à la limite de manquer de temps. Et en même temps, on y arrive toujours. Il emmène donc son équipe dans une espèce de tourbillon pour rentabiliser au mieux ses journées et arriver à avoir ce qu’il veut. Il est très rapide dans l’analyse et la capacité à savoir s’il a ce qui lui convient. Quant au choix entre perche et HF [micro-cravate, ndlr], j’ai lu votre entretien avec lui [voir page précédente, ndlr] : c’est tout Arnaud ! C’est un discours un peu théorique qui ne correspond pas toujours à la réalité. Dans Trois souvenirs, on a très peu utilisé les micros HF. Il y a une scène à la fin où on l’utilise pour éviter la trop forte présence des bruits de pas qu’on avait à la perche, et un plan large où l’on voyait la perche. Sinon, le film est mixé à 95% sur la perche. C’est donc du Arnaud dans ses contradictions et sa complexité. Ce que j’entends dans son discours, c’est d’une part son admiration pour le cinéma américain, d’autre part son goût pour le son incarné, présent. Le son intérieur que lui évoque celui du HF c’est celui du récit, au plus près du jeu, des intentions, du souffle de l’acteur, enfin c’est ce que je me raconte. Quant à l’expérience avec Catherine Deneuve sur Un conte de Noël, c’est exact : le discours d’Arnaud anti-Rivette [voir entretien avec Arnaud Depleschin page précédente, ndlr] a permis de mettre un micro HF à Catherine Deneuve qui a horreur de ça ! Il y a quelque chose d’intime avec ces micros, on peut entendre ce qu’elle dit entre les prises à son insu, c’est compliqué. Les acteurs français n’aiment pas beaucoup ça dans l’ensemble, contrairement aux américains qui ne se posent pas la question, car c’est dans leur contrat. Ce qui est clair, c’est qu’Arnaud n’aime pas entendre l’acoustique d’une pièce, il n’aime pas le son du théâtre au cinéma, et j’ai les mêmes goûts que lui par rapport à ça, donc on joue beaucoup sur les acoustiques.

De quelle manière ?

En mettant, par exemple, des moquettes pour casser les réflections qui viennent du sol, en tendant des tissus au plafond. J’essaie d’intervenir sur l’acoustique du lieu pour la minimiser, si elle est défavorable à la scène. Bien sûr, si on tourne dans une église, on ne peut pas lutter contre son acoustique trop forte.

Ce genre d’acoustique ne peut-elle pas être intéressante, précisément, et dire quelque chose de la place du personnage dans le décor ?

Oui, bien sûr, mais il faut contenir l’acoustique. Dans la scène du bunker avec André Dussollier et Mathieu Amalric, dans Trois souvenirs, l’acoustique est là et on ne peut pas la changer, et c’est très bien, car elle tend la scène. En revanche, c’est bien de ne pas se perdre dedans. C’est très désagréable d’entendre plus la pièce que l’acteur, car on perd le récit. C’est un peu comme si les mots commençaient à s’effacer dans un livre. On a du mal à suivre. Et si une voix n’est pas timbrée, on ne l’écoute pas de la même manière. C’est là où je rejoins le point de vue d’Arnaud.

D’où provient cette différence entre le son français et le son américain ?

Ce sont deux écoles. Les Américains s’appuient pas mal sur le HF, mais aussi sur la post-synchronisation. C’est surtout une histoire d’efficacité. En France, l’influence du cinéma direct a dû jouer. En documentaire, le cadreur est forcément conscient du fait qu’il choisit le point d’écoute lorsqu’il cadre, et comme il sait qu’il n’y aura pas de deuxième prise, le cadre se fait aussi en fonction du son. Et à cette époque, il n’y avait pas de HF, tout se faisait à la perche. Je pense que les films de la Nouvelle Vague tournés en son direct ont dû se faire avec les mêmes habitudes. Aux États-Unis, la culture du studio y est aussi pour quelque chose. Cela dit, il y a beaucoup de son direct aux États-Unis, les films de Clint Eastwood par exemple, sont tournés ainsi, et son perchman – que j’ai rencontré – est très habile.

Quand vous travaillez avec des micros HF, comment gérez-vous le fait d’entendre ce qui se dit entre les prises ? C’est une position qui peut être embarrassante…

J’ai la chance de travailler avec une société qui s’appelle Aaton et qui a fabriqué un enregistreur, le Cantar, qu’on utilise à 90% en France. Moi, j’ai demandé au fabricant du Cantar d’ajouter une fonction qui permette, quand on règle nos micros, que les casques des gens autour ne soient plus alimentés. Il fallait éviter qu’un réalisateur puisse entendre un acteur parler de lui à son insu, par exemple ! Quant à l’équipe son, quand elle vérifie les micros, elle fait attention.

Le placement des micros HF sur les comédiens doit être délicat… 

Oui, là, si je devais vous équiper, je demanderais à la costumière de placer le micro sous votre pull et si vous étiez en jupe et sans poche, il faudrait attacher le boîtier à votre cuisse avec une jarretière. Ce n’est donc pas facile, car on doit toucher les comédiens pour installer le micro ou le réinstaller entre les prises. Mais ce qui est formidable, ce sont tous les imprévus que ces micros offrent. Je me rappelle Mathieu Amalric sur Un conte de Noël, on avait récupéré sur son HF quantité de petites interjections, de soupirs, de petits sons qu’on avait replacés dans le film, par ailleurs. Ce sont des sons qu’on avait enregistrés en tout début de plan, quand le plan est en train de se lancer, et qui ont intéressé Arnaud au montage. On avait fait des chutiers par personnage, où l’on avait répertorié les respirations, les râles…

De la matière vivante !

Oui, et qu’on pouvait replacer à différents endroits par la suite. Pour ça, le HF est un outil formidable. En outre, une des fonctions de l’ingénieur du son, c’est d’être garant de l’intelligibilité d’un texte. On se doit de le détecter quand ça n’est pas le cas et de le dire à l’acteur, de manière à ce qu’il corrige. Il faut tout de même faire attention à ce que l’acteur ne se focalise pas non plus sur un mot, au risque de mal jouer ensuite. La plupart du temps, je ne dis rien et j’attends les prochaines prises ; je ne dis quelque chose que si ça ne s’améliore pas.

Avez-vous déjà été bouleversé par une voix ?

Oui. Parfois, on tremble de tout notre être et on vérifie sans cesse qu’on enregistre bien, tant ce qu’on entend est beau. Dans Trois souvenirs, dans la scène où Mathieu Amalric écrit à son ami Kovalki, c’est un moment où je tremblais ! Je sentais à quel point ce moment était précieux et ne se reproduirait pas. Dans ce film, plus d’une fois, Lou, la jeune actrice qui joue Esther, m’a subjugué par son naturel. Il arrive qu’on soit cueillis sur le plateau, nous, premiers spectateurs du film. C’est le son de la voix, l’émotion, l’intimité du personnage qui passe par la voix. Quand vous perdez quelqu’un, vous pouvez vous confronter à son image, au début c’est un peu dur, mais vous pouvez y arriver, tandis que la voix, c’est chavirant, l’incarnation de la personne resurgit instantanément. Donc, quand on a le casque sur les oreilles, on voit le personnage qui est là et qui nous touche. On sent quelle prise est la bonne, la plupart du temps.

Comment percevez-vous la voix de Mathieu Amalric ?

Il a une voix d’une grande richesse. Il est très facile à enregistrer. Il a un timbre qui passe les murs. Ce qui me fascine, c’est de faire le parallèle entre Trois souvenirs et Comment je me suis disputé… et de réentendre la voix de Mathieu à l’époque. C’est magnifique de voir comment ces deux films se répondent à vingt ans d’intervalle et notamment à travers les voix, y compris celle d’Arnaud qui fait la voix off. On sent les années passer dans les timbres. C’est d’une grande beauté, ces strates, ces couches perceptibles dans la voix. Il y a plus de grain, plus de basses, plus d’épaisseur, mais tout autant de fragilité, probablement plus. Parfois, la voix de Mathieu se brise, se vide, avant de laisser le timbre revenir.

Et la voix de Catherine Deneuve ?

J’adore la musique de sa voix. Elle a su rester jeune dans sa voix. Le cinéma, c’est du rythme avant tout et Deneuve, comme Emmanuelle Devos, a ce don de nous surprendre dans sa façon de prendre un temps, de faire des césures pertinentes et inattendues dans le débit.

Quel est votre rapport au silence ?

Le silence total, façon chambre anéchoïque, je crois que ça me fait flipper. Je n’aime pas beaucoup ça, car ça s’apparente à la mort. J’aime le silence habité, écouter la nature, une forêt de pins qui gouttent sur la neige, ça j’adore, car là on est déjà dans la musique, dans les matières. Le cinéma, c’est du rythme, et si c’est tout le temps plein, on est saturé. Il faut des creux. Daniel Deshays, l’auteur d’un bouquin passionnant Entendre le cinéma, dit que le mixage, c’est l’art de la soustraction, et je crois qu’il a raison. Donc, pour synthétiser ma réponse : le silence me fait peur, c’est la mort, mais il est utile à la narration !

En dehors des plateaux de cinéma où vous travaillez, prêtez-vous l’oreille aux sons de votre environnement ?

Contrairement aux yeux, il est impossible de fermer les oreilles. L’environnement sonore change la lecture que l’on a de chaque lieu et intervient dans chaque situation. J’adorerais un Paris piéton ou quasi (sans moteur à explosion en tous cas), ce serait probablement une ville inconnue, ou l’on découvrirait peut-être le plaisir de l’immobilité. Le rapport au silence, c’est surtout le rapport à l’écoute, c’est le moment où l’on s’arrête. On ne s’arrête jamais dans nos vies, on écoute les gens qui nous parlent, les infos, de la musique. Une chose que j’aime beaucoup dans mon métier, c’est la récolte des « sons seuls », des ambiances, quand on part dans la nature ou ailleurs et que l’on s’arrête pendant un quart d’heure, sans faire de bruit, pour enregistrer et écouter. Ce truc de s’arrêter, de regarder le temps, de laisser la nature reprendre son cours, c’est une observation qu’on fait très peu. On a peur du silence humain, globalement. On a toujours besoin de meubler quand un blanc s’installe dans une conversation. L’interruption de la parole nous fait peur, donc on ne prend jamais le temps d’écouter en silence. Pour ça, je remercie ce métier de m’obliger à prendre ces temps suspendus.