Normalisation audio
La normalisation audio est un processus qui consiste Ă augmenter ou diminuer l'amplitude (volume) d'un enregistrement audio dans un rapport constant sur toute la durĂ©e afin que l'amplitude de crĂȘte ou la valeur efficace de crĂȘte ou le volume perçu (sonie) atteigne un niveau dĂ©fini Ă l'avance, la norme. Si le signal a plusieurs pistes, elles subissent toutes la mĂȘme correction.
- Une collection d'enregistrements numĂ©riques est crĂ©Ă©e avec une norme de modulation crĂȘte de -3dB FS.
- Un nouvel enregistrement stĂ©rĂ©o est mesurĂ©. Le niveau de crĂȘte le plus Ă©levĂ© est Ă -5,5 dB FS sur la piste gauche, -5,7 dB FS sur la piste droite.
- La normalisation consiste Ă appliquer un gain constant de 5,5 - 3 = 2,5 dB.
La normalisation nécessite deux passages. Le premier détermine le niveau maximal, le second applique la correction à l'enregistrement entier.
- La normalisation de crĂȘte change le niveau, mais pas la dynamique sonore.
- La normalisation de volume perçu ou sonie implique souvent une compression qui change la dynamique sonore.
Normalisation de crĂȘte
La normalisation de crĂȘte applique un gain constant Ă un enregistrement entier pour apporter la plus haute crĂȘte Ă un niveau cible, en audio professionnel 89 % (-1 dB FS crĂȘte vraie (True Peak))[1].
La dynamique sonore de l'enregistrement est à peu prÚs conservée, à ceci prÚs que le maintien d'un bas niveau de distorsion aprÚs la multiplication de tous les échantillons peut impliquer l'application d'un bruit de décorrélation d'erreur de quantification connu sous le nom de redithering (fourmillement du bit de faible poids)[2], qui augmente trÚs légÚrement le niveau de bruit de fond.
Normalisation de volume
L'objectif d'une normalisation de volume est d'amener tous les Ă©lĂ©ments sonores d'une collection au mĂȘme niveau de volume sonore, de façon Ă pouvoir les Ă©couter sans avoir Ă retoucher le volume. En effet, la normalisation du niveau de crĂȘte ne garantit nullement une homogĂ©nĂ©ĂŻtĂ© de volume sonore perçu (Sonie).
Une approche simple de la normalisation de volume, fournie par plusieurs logiciels, consiste à normaliser la valeur efficace (niveau RMS) du signal intégrée sur quelques dixiÚmes de secondes. Des machines plus perfectionnées utilisent des algorithmes élaborés pour une évaluation plus précise du niveau sonore ressenti. L'Union européenne de radio-télévision a publié en 2011 une recommandation[1] donnant une méthode relativement simple pour cette évaluation.
Si la norme n'est pas assez basse, la normalisation de volume implique une compression pour les enregistrements dont la dynamique sonore serait supĂ©rieure Ă ce qui a Ă©tĂ© implicitement prĂ©vu en fixant la norme par rapport au niveau maximal. Si ce n'Ă©tait pas le cas, les crĂȘtes du signal dĂ©passeraient les limites de la quantification.
Dans son implĂ©mentation la plus simple, la normalisation de volume collecte les donnĂ©es de volume pendant la premiĂšre passe, dĂ©termine le gain ou l'attĂ©nuation nĂ©cessaire pour que le volume maximal atteigne la norme, et applique cette correction dans la deuxiĂšme passe. Si les Ă©lĂ©ments de la collection partagent les mĂȘmes caractĂ©ristiques de facteur de forme, de facteur de crĂȘte et de dynamique, comme c'est le cas pour des collections de musique populaire ou de parole enregistrĂ©e, cette approche donne des rĂ©sultats satisfaisants.
Les implĂ©mentations Ă©laborĂ©es utilisent une norme qui inclut non seulement un volume sonore, mais aussi des valeurs de crĂȘte maximales et une dynamique sonore. Elles collectent les niveaux de sonie et les valeurs de crĂȘte dans la premiĂšre passe, et effectuent, dans la seconde passe, les corrections dynamiques nĂ©cessaires pour parvenir aux valeurs prĂ©vues par la norme.
Notes et compléments
- recommandation pour l'échange des programmes audiovisuels, émise par l'Union internationale des télécommunications ITU BS. 1770-2 reprise par l'Union européenne de radio-télévision UER/EBU (en)recommandation EBU R 128.
- voir Tramage (informatique).
Articles connexes
- Niveau (audio)
- Indicateur crĂȘte vraie (True Peak Level Indicator)
- Dynamique sonore