<img src="https://ws.zoominfo.com/pixel/ODemgiDEhQshzjvCQ1qL" width="1" height="1" style="display: none;">

Découvrez Interprefy Agent. Un outil multilingue puissant que vous invitez comme n'importe quel autre invité. Accédez à une accessibilité multilingue fluide.

qualité sonore en interprétation à distance

Nous avons mis en ligne cet article sur notre podcast Interprefied et il est désormais disponible sur votre plateforme de podcasts préférée.

Écoutez et téléchargez le podcast ci-dessous :

 

 

Disponible en téléchargement sur :

Podcast Interprefy Podcast Interprefy Podcast Interprefy

 

La qualité sonore nous accompagne tout au long de la journée. De la radio le matin au visionnage intensif de notre série préférée tard le soir, nous tenons souvent pour acquis un bon son. S'il est généralement assez facile de repérer un mauvais son, la qualité audio est en réalité bien plus complexe. Un bon exemple en est le débat, vieux d'une dizaine d'années, entre les amateurs de vinyle et les autres audiophiles : quel format offre la meilleure qualité sonore : le CD ou le vinyle ?

En interprétation à distance, la capacité à recevoir et à transmettre un son de qualité est essentielle. Elle garantit un traitement précis des informations et une expérience audio agréable, tout en protégeant l'audition des personnes.

Plateforme audio avant tout, nous travaillons sans cesse à de nouvelles méthodes pour optimiser le comportement des haut-parleurs et à la mise en œuvre de solutions audio innovantes garantissant une qualité sonore supérieure. Sujet souvent abordé, la compression sonore peut véritablement améliorer l'expérience d'écoute, à condition d'être correctement appliquée.

Nous avons rencontré Richard Schiller, ingénieur du son et chef de produit senior chez Interprefy, pour comprendre ce qu'est la compression sonore, comment elle est utilisée dans le domaine des troubles musculo-squelettiques et ce qui influence la qualité sonore.

Bonjour Richard, parlez-nous un peu de votre parcours et de votre activité.

Bonjour Dora, ravie de vous reparler. Je suis chef de produit senior chez Interprefy. Je supervise la direction et le développement du produit. Je suis également ingénieure du son de formation. J'ai travaillé pour la BBC World Service, la plus grande organisation de radiodiffusion parlée au monde. Ce type d'expérience m'a appris à être particulièrement attentive à la clarté et à la cohérence du son.

La constance était la clé du succès de la radio à grande échelle, et la clarté était l'essence même de notre travail. J'ai également travaillé dans l'enregistrement musical et la télévision. J'ai occupé la plupart des postes dans ce secteur, notamment ceux de producteur, réalisateur, présentateur et scénariste.

Alors vous êtes la personne idéale pour répondre à la question à un million de dollars : qu’est-ce que la compression ?

Il existe deux phénomènes distincts et sans lien entre eux lorsqu'on parle de compression audio : la compression dynamique, qui consiste en un circuit (ou aujourd'hui un algorithme) contrôlant automatiquement le niveau sonore. Elle est principalement utilisée pour réduire la plage dynamique, c'est-à-dire l'écart entre les sons les plus faibles et les plus forts. Puis est apparue la réduction du débit binaire, un système permettant de réduire la quantité de données audio à stocker ou à transmettre.


La compression dynamique et la réduction du débit binaire peuvent être utilisées à bon ou à mauvais escient.


Alors, sont-ils bons ou mauvais ?

Ni l'un ni l'autre. Comme presque tout, ces deux techniques peuvent être bien ou mal utilisées. Mal utilisées, elles ne sont pas bonnes, mais rien dans ces deux formes de compression n'indique qu'elles soient intrinsèquement mauvaises.

La compression dynamique fonctionne comme un appareil qui surveille le niveau sonore et baisse le volume lorsque le son devient trop fort. Elle le remonte ensuite lorsque le son diminue. Cela permet d'entendre aussi bien les passages forts que les passages faibles. C'est comparable à une personne qui utilise un bouton de volume pour baisser le son – et je tiens à souligner que la compression dynamique vise à réduire le volume, d'où son nom.

D'où vient donc cette inquiétude concernant la compression ?

La compression dynamique diminue le volume sonore, ce qui est souvent indésirable. C'est pourquoi un réglage de volume prédéfini permet de l'augmenter à nouveau. La compression égalisant le niveau du signal, deux options s'offrent à vous : un volume plus faible mais plus facile à entendre, ou plus fort et plus percutant. Permettez-moi une petite digression : si vous trouvez le son trop fort, baissez-le. Maîtrisez toujours votre propre niveau d'écoute.

Ce n'est pas seulement le niveau qui peut être mal réglé ; les constantes de temps du compresseur ont également leur importance. Enfin, il y a le ratio. Ce dernier est souvent trop élevé, ce qui est la cause la plus fréquente d'une compression rendant la parole inintelligible.

L'une des applications les plus agaçantes est la conception défectueuse des circuits de contrôle automatique de gain (CAG), présents aussi bien dans les anciens appareils grand public que dans les algorithmes utilisés par certains ordinateurs. Les CAG et les filtres anti-bruit sont souvent activés par défaut sur les ordinateurs portables et autres appareils. La dynamique est donc omniprésente dans notre vie. Une compression mal réglée peut écrêter les occlusives et les sifflantes, rendant la parole difficile à comprendre. Cela se traduit par un son terne sur les consonnes dures en début de mot, en particulier pour le premier mot d'une phrase. Un autre signe d'un CAG mal réglé est la suivante : lorsqu'une personne prononce un mot fort suivi d'un mot faible, on entend la fin du mot faible mais on a du mal à en entendre le début.

Passons maintenant à la question des troubles musculo-squelettiques liés au stress (TMS). En quoi la qualité sonore de la musique diffère-t-elle de celle de la parole ?

Il y a beaucoup de points communs, mais dans chaque cas, il faut veiller à bien définir ce qu'est la qualité. On utilise des données issues d'enregistrements de musique classique réalisés dans des studios à l'acoustique optimisée pour les appliquer à la parole. À certains égards, la parole est plus facile à retranscrire qu'un orchestre, et à d'autres, elle l'est davantage.

Les fréquences élevées de la bande passante, par exemple, sont moins importantes pour la parole que pour certains instruments. On peut affirmer sans hésiter que pour certaines percussions, la bande passante est primordiale, tandis que pour la parole, c'est la fluidité qui compte. C'est pourquoi un ingénieur du son utilisera un microphone différent pour une personne que pour une caisse claire ou une cymbale.

Je sais que certains me rétorqueront que les fréquences entre 18 kHz et 20 kHz sont essentielles à la parole, mais c'est tout simplement faux. En général, même les microphones les plus performants et les plus chers utilisés par les ingénieurs du son pour l'enregistrement de la parole ne sont pas adaptés à ces fréquences, car ils n'en ont pas besoin.

Et ce n'est pas un hasard. Imaginez-vous en forêt, écoutant une personne à quelques mètres de vous, la bouche face à votre oreille (et si vous étiez assez jeune pour entendre jusqu'à 20 kHz). Si vous tourniez la tête pour voir votre interlocuteur et qu'il se tournait de côté, vous n'entendriez plus la composante à 20 kHz, ou du moins, elle serait fortement atténuée. Ces très hautes fréquences sont mal préservées dans la nature et, par conséquent, sans importance pour nous, car la vie serait impossible si elles l'étaient.


Parvenir à la clarté est plus nuancé que ce que l'on aime à laisser entendre.


Dès lors, pour les besoins de l'interprétation simultanée, n'est-il pas essentiel d'avoir accès à des fréquences allant jusqu'à 15 000 Hz ?

Le problème, c'est que je peux donner l'impression de dire que la deuxième meilleure solution suffit, alors qu'en réalité, la clarté est bien plus complexe qu'on ne le laisse entendre. À qualité égale, une bande passante de 15 kHz est préférable à 10 kHz pour la parole, qui est elle-même préférable à 6 kHz, et ainsi de suite.

Cependant, une réponse plus linéaire jusqu'à 10 kHz peut faciliter la compréhension qu'une réponse irrégulière jusqu'à 15 kHz. De même, un signal vocal non compressé dynamiquement avec une bande passante de 6 kHz peut être plus facile à comprendre qu'un signal avec une bande passante de 15 kHz et une compression importante.

En résumé, préserver la réponse en fréquence est certes important, mais d'autres facteurs le sont tout autant, et aucun ne peut à lui seul garantir une réponse parfaite. Le problème spécifique de la réponse en fréquence réside dans le fait que les gains diminuent considérablement dans les aigus. Ainsi, notre tendance à nous focaliser sur les registres supérieurs témoigne de notre compréhension et de notre facilité à les décrire, plutôt que de leur véritable importance dans la chaîne de valeur.

Une bande passante de 15 kHz ou plus doit s'inscrire dans un programme global performant, mais au sens strict, elle n'est ni essentielle à une bonne compréhension, ni ne la garantit.

Certains affirment que les plateformes RSI appliquent une compression de la plage dynamique, ce qui dégrade le son. Est-ce le cas pour Interprefy ?

Non. La compression de la plage dynamique n'est généralement pas nécessaire. Cela ne signifie pas pour autant que nous ne l'utilisons jamais. Nous travaillons actuellement en laboratoire sur un système de compression très prometteur. Il est conçu pour les auditeurs, qu'ils soient membres du public, délégués ou interprètes. Chacun peut l'activer ou le désactiver à sa guise. 

L'excellence découle de l'utilisation judicieuse et appropriée de la technologie. Il s'agit d'optimiser, de rechercher la perfection à chaque étape et d'appliquer progressivement de petites améliorations à l'ensemble du système.

Parlons un instant des délégués, car nous avons tous déjà vécu cette expérience où un orateur s'exprime de façon tout simplement affreuse.

Oui, absolument Dora. Et je suis vraiment déterminé à remédier à cela. Les problèmes majeurs résident dans le matériel de piètre qualité utilisé par de nombreux intervenants et leur méconnaissance des mesures à prendre pour garantir une bonne qualité sonore.

Comment résoudre ce problème ?

Comme pour presque tout, la solution réside dans la prise en compte de nombreux facteurs. Il faut que les intervenants utilisent de meilleurs microphones, qu'ils maîtrisent mieux les techniques de prise de son et qu'ils soient plus attentifs au bruit de fond et à l'écho. Il y a un important travail de sensibilisation à mener, que nous avons d'ailleurs amorcé avec notre campagne vidéo de conseils pratiques pour les intervenants .

Nous pouvons également utiliser la technologie pour nous aider. Plus tard, nous pourrons revenir sur ce sujet et discuter de la manière dont la technologie peut aider les gens à améliorer leur qualité de vie et à pallier les difficultés qu'ils rencontrent.


La grande différence réside entre un bon équipement bien configuré et un mauvais équipement mal configuré.


Donc, si l'on comparait le son reçu via un matériel tel qu'une console physique et celui reçu via Interprefy, il n'y aurait pas beaucoup de différence tant que l'orateur utilise un équipement approprié ?

Oui, c'est exact Dora. La différence majeure ne réside pas entre le travail sur site et à distance, mais entre un équipement performant et bien configuré et un équipement médiocre et mal configuré. La qualité audio d'un système local basé sur du matériel est fondamentalement la même. De nombreux participants à des réunions et événements utilisant des systèmes RSI disposent de microphones de meilleure qualité que ceux utilisés sur place. Certains souhaitent participer avec des appareils moins performants. Comme pour tout en entreprise, cela nécessite une gestion appropriée.

Alors, quelle est la différence entre une solution RSI et une solution matérielle ?

Ce que l'ISR offre, c'est le choix. Le choix grâce à la flexibilité. Lorsque ma femme est tombée enceinte, son employeur, un homme, lui a tout simplement annoncé qu'elle était licenciée. Heureusement, c'est illégal aujourd'hui. J'aime à penser que l'ISR permet aux interprètes qui ne souhaitent pas ou ne peuvent pas se déplacer de travailler de manière plus flexible. J'ai été choqué par le traitement inhumain infligé à ma femme et, tout comme je pense que les employeurs doivent tout faire pour permettre à leurs employés de travailler, quelles que soient leurs conditions de travail ou leurs contraintes, il nous incombe, à nous, fournisseurs de systèmes, d'intégrer également cette flexibilité.

Les solutions RSI offrent également une grande flexibilité aux organisations. Vous pouvez organiser une conférence ou une réunion n'importe où et configurer ou modifier l'espace instantanément. Nous avons récemment aidé un astronaute à s'adresser au monde entier depuis la Station spatiale internationale. Exiger sa présence physique aurait évidemment été absurde.

Pour en revenir à la compression, que diriez-vous à ceux qui demandent son élimination totale ?

Supprimer la compression, quelle qu'en soit la forme, n'est pas une solution miracle. Je le répète, il n'existe pas de solution miracle. Une partie de la solution globale consiste à éliminer les mauvais usages de la compression, qu'il s'agisse de la compression dynamique ou de la compression du débit binaire. Cela implique de disposer d'ingénieurs du secteur qui maîtrisent parfaitement la technologie.

Qu’en est-il de l’utilisation successive de plusieurs fonctions de compression ? Est-ce automatiquement une mauvaise chose ?

On appelle cela la compression en cascade. Non, ce n'est pas forcément une mauvaise chose, que ce soit pour la compression dynamique ou la compression du débit binaire.

La compression en cascade présente des problèmes spécifiques et sa mise en œuvre exige un travail considérable. Il est tout à fait légitime de s'inquiéter de la compression en cascade, car sa mise en place est complexe, mais avec des compétences adéquates, c'est possible. Et même excellent. Prenons l'exemple de la compression dynamique : deux des plus grandes innovations audio de tous les temps sont issues de l'utilisation de la compression dynamique en cascade.

Certaines personnes semblent particulièrement douées pour évaluer des facteurs comme la compression ; devriez-vous faire appel à elles pour vous aider ?

Il n'existe qu'une seule méthode d'évaluation audio : le test à l'aveugle. Idéalement, un test en double aveugle. Si quelqu'un prétend avoir une excellente perception des défauts audio, demandez-lui si ce test a été réalisé dans le cadre d'un programme où les participants ignorent l'identité des personnes testées et où l'évaluation est supervisée par une personne extérieure à l'équipe. De plus, tout test devrait impliquer un panel d'auditeurs variés.

Beaucoup de gens, probablement la plupart, pensent avoir une ouïe exceptionnelle, mais seulement une personne sur vingt environ en a réellement une. C'est un peu comme si nous nous prenions tous pour d'excellents conducteurs.


Un bon son s'obtient en y mettant beaucoup de soin et en travaillant de manière holistique.


Certaines personnes semblent avoir des opinions très tranchées sur la qualité sonore et la manière de l'obtenir. Que leur répondez-vous ?

Ceux qui raisonnent en termes binaires, qui parlent en termes d'« obligatoires » et d'« interdits », se trompent, comme l'expérience me l'a prouvé. Je n'aime pas voir la compression, ou tout autre outil audio, injustement décrié. Non pas que j'y sois particulièrement friand, ni que je défende la compression en particulier, mais parce qu'un bon son s'obtient en y mettant beaucoup de soin et en adoptant une approche globale. Les vrais perfectionnistes ne se limitent pas à une vision binaire, utilisent tout l'arsenal des outils et ne se résignent pas aux simplifications excessives.

Tout traitement du son peut être réussi ou raté. Un traitement réussi repose sur l'utilisation d'une configuration adéquate, appliquée à bon escient. La compression dynamique peut être désastreuse si elle est mal maîtrisée, mais cela ne signifie pas qu'elle soit systématiquement mauvaise. Correctement appliquée, c'est un atout précieux.

Dora Murgu

Écrit par Dora Murgu

Découvrez les dernières nouveautés chez Interprefy grâce à Dora Murgu, responsable de la formation et de l'engagement chez Interprefy.