Эммануэль Дерюти. Динамический диапазон и война за громкость - Часть 4

Измерение диапазона громкости по методике EBU

В декабре 2010 года EBU выпустила документ Tech 3342, являющийся частью технической рекомендации EBU R128. Он даёт практическое руководство по поводу измерения «диапазона громкости», параметра, у которого есть хорошие шансы стать [а может уже и стал] стандартом для измерения динамической вариабельности аудио. Поэтому, будет нелишним потратить несколько минут, чтобы в деталях выяснить, что же скрывается под словами «K-взвешенная RMS-вариабельность со стробированием и временным окном 3 секунды».

Итак, во временном окне продолжительностью три секунды выборка осуществляется каждую секунду. Это означает, что измерение относится к динамическим событиям продолжительностью более трёх секунд. [Здесь не совсем понятно: скорее всего, подразумевается интегрированное значение всех замеров в данном окне]. С одной стороны, такое измерение не будет учитывать ударные звуки. С другой стороны, вариации громкости, связанные со структурными изменениями, тоже не всегда будут чётко видны, поскольку их могут замаскировать вариации, происходящие в более мелких масштабах. Впрочем, именно такой компромисс был выбран EBU.

Вместо того, чтобы наблюдать за значениями RMS, мы измеряем значения громкости по методике, описанной в ITU-R BS 1770. Процесс измерения не очень сложен: берём оригинальный файл, эквализуем его и затем измеряем RMS. Как Вы видите на рисунке, фильтр довольно прост. Может стать неожиданностью, что ITU пользуется столь простым инструментом, чтобы вычислить различие между RMS и громкостью, но, как они заявляют, «для типичного монофонического вещательного материала, основанное на энергии простое измерение громкости сравнимо с более сложными методиками измерения, включающими детальные перцепционные модели». ITU называет это «К-взвешивание» и даёт «LKFS» в качестве единицы громкости [громкость, К-взвешенная, относительно полной цифровой шкалы]. Таким образом, мы имеем последовательность измеренных значений, соответствующих «кратковременной громкости», описанной в EBU 3341. Впрочем, EBU вместо LKFS рекомендует использовать термин LUFS [единицы громкости, относительно полной цифровой шкалы].

Теперь, последовательность измеренных значений подвергается такому процессу, как стробирование. Используется два последовательных процесса. Первый называется «абсолютным стробированием», который исключает из результатов измерения все значения ниже -70LKFS. Сюда попадают паузы, фоновый шум и прочие очень тихие звуки, могущие исказить результаты и негативно повлиять на дальнейшую обработку. Второй процесс называется «относительным стробированием». После того, как очень тихие части сигнала были убраны, измеряется средняя громкость. Теперь исключаются все значения, которые ниже средней громкости на 20dB. К примеру, если после абсолютного стробирования средняя громкость получилась -15LKFS, то все значения ниже -35LKFS будут исключены из результатов измерения. Относительное стробирование нужно для того, чтобы устранить «нетипичные» части сигнала. И вот теперь, после всех этих манипуляций, мы и получаем «K-взвешенную RMS-вариабельность со стробированием и временным окном 3 секунды».

И вот теперь мы подходим к ключевому моменту, и именно – измерению диапазона громкости звуковой программы. Это долговременная интегрированная громкость за весь хронометраж, вычисленная статистическими методами на основании вышеописанных измерений. Этот параметр состоит из одного числа (в LUFS), который показывает, насколько громка программа в среднем. Для относительных измерений используются единицы громкости (LU), где 1 LU эквивалентно 1 dB.

Диапазон громкости и ограничение

Так уменьшают ли ограничители диапазон громкости или нет? И да, и нет. Фактически, эта проблема намного сложнее, чем выглядит на первый взгляд. Представьте, что у Вас есть нормализованный аудиофайл и Вы не можете уже увеличить его уровень, не вызвав искажений. Но используя на таком материале компрессор или ограничитель, Вы можете поднять уровень, одновременно увеличив значение RMS. Это также расширяет динамический диапазон носителя: к примеру, в 16-битном файле это 96 dB, но Вы можете его как бы растянуть до 100 или 105 dB. На верхней диаграмме этот дополнительно доступный динамический диапазон отмечен серым прямоугольником. С этой точки зрения, лимитер не только не уменьшает диапазон громкости, но и даже увеличивает его.

Идея относительно того, что компрессор или ограничитель могут расширить доступный динамический диапазон, конечно интересна, но уже далеко не нова. Много десятилетий назад, звукоинженеры вставляли компрессор между микрофоном и рекордером с целью увеличить динамический диапазон носителя записи и уменьшить проблемы с низким отношением сигнал/шум.

Диаграмма показывает анализ RMS трёх файлов: оригинальный нормализованный, ограниченный с порогом -6 dB и с порогом -12 dB. Для начала, давайте сфокусируемся на различии между оригиналом и вторым файлом (-6 dB). Если смотреть со стороны низких уровней, то второй файл даёт 6 dB прироста RMS. Но, поскольку высокоуровневые события были ограничены, то прирост RMS для них только 5 dB. Таким образом, уменьшение RMS-вариабельности составляет всего 1 dB. Теперь давайте установим порог на -12 dB: низкие уровни поднимутся ещё на 6 dB, но высокие – только на 3 dB. RMS-вариабельность уменьшится ещё на 3 dB, составив в общем 4 dB. С этой точки зрения, лимитер конечно же уменьшает диапазон громкости – в этом случае, величина уменьшения составляет примерно 4 LU.

Однако, 1 dB потери RMS-вариабельности – это очень маленькая величина. Порог, ниже которого лимитер начнёт реально вмешиваться в сигнал, зависит от типа музыки. Вторая диаграмма показывает RMS-вариабельность в различных масштабах для трёх музыкальных композиций. Обратите внимание, что поп/рок музыка имеет RMS-вариабельность более устойчивую к воздействию ограничения, нежели две другие композиции, представляющие оперу и джаз. Это особенно заметно в более мелких временных масштабах: в данном случае, порог должен быть установлен как минимум на -6 dB, чтобы получить заметное уменьшение RMS-вариабельности. Это может быть связано с наличием громкого и заметного большого барабана, что указывает нам на то, что чем больше у музыки первичная RMS-вариабельность, тем сильнее она сопротивляется ограничению. Отсюда следует, что высокую вариабельность не так легко уменьшить. Эта первичная «упругость» - ещё один аргумент к утверждению, что ограничение автоматически не означает уменьшение диапазона громкости, особенно если первичный материал обладает очень высокой вариабельностью уровня.

Ремастеринг и ограничение

Многие альбомы, выпущенные в до-цифровую эпоху, подверглись ремастерингу и были выпущены в новых форматах. В качестве примера, давайте рассмотрим дискографию группы Cure. Начиная с 2004 года, все их альбомы, выпущенные до 1990 года, были ремастерены и изданы с дополнительными материалами. Первая диаграмма сравнивает уровни RMS оригинальных и ремастерённых версий. «Deluxe»-версии реально громче оригиналов, и их RMS в среднем на 5 dB выше. Тем не менее, они тише альбомов, выпущенных после 1995 года. Здесь можно заметить, как недавние альбомы Cure стали жертвой войны за громкость: между Wish и Wild Mood Swings мы видим внезапный скачок на 6 dB.

Давайте более пристально рассмотрим альбом Pornography, первоначально выпущенный в 1982 году. На рисунке Вы видите сигналограммы оригинальной и ремастерённой версий. Очевидно, что ремастер 2005 года подвергся тяжёлому цифровому brickwall-ограничению. Это хорошо или плохо? Лично мне нравится слушать обе версии. С более объективной точки зрения, давайте сфокусируемся на выделенном фрагменте сигналограммы, который относится к окончанию «A Strange Day». В оригинале, как раз перед короткой паузой, мы видим небольшое декрещендо, за которым следует короткое крещендо. Наши читатели, которые знают эту песню, согласятся, что эти вариации громкости очень согласуются с музыкальным контентом (кульминационный момент песни и затем пауза). Как мы видим, в оригинале использована первая парадигма громкости. Теперь, давайте посмотрим на ремастерённую версию. Вариации громкости теперь имеют другую природу и, возможно, это не очень хорошо. По моему мнению, это может быть главной опасностью ремастеринга альбомов, выпущенных до-цифровую эпоху: по неосторожности можно увеличить плотность высокоуровневых сэмплов, уменьшить крест-фактор и превратить первую парадигму громкости во вторую.

Альбомы знаменитых групп, как например Beatles или Pink Floyd, зачастую неоднократно подвергаются ремастерингу, так что, бывает довольно трудно найти референсную версию для любого из них. Для примера, возьмём Dark Side Of The Moon. Третья диаграмма показывает плотность высокоуровневых сэмплов для пяти его релизов. Здесь есть две версии с названием Original Master Recording, но даже они очень сильно отличаются. Скорее всего, потому что первая – это пластинка, а вторая – компакт-диск.

В контексте войны за громкость в голову приходит один вопрос: а насколько уважительно отнеслись эти ремастерённые версии к оригиналу 1973 года? Диаграмма даёт нам некоторые ответы. Версии 1981, 1989 и 1992 годов показывают общее количество ограничения, вполне сравнимое с альбомами 1973 года (об этом мы писали в начале статьи). Версия 2003 года уже более проблематична, поскольку количество ограничения здесь уже сравнимо с 1995 годом. С версией 2007 года ситуация пока не очень ясна: «Eclipse» либо ограничена, либо сильно скомпрессирована, но вот другие треки показывают очень умеренную плотность высокоуровневых сэмплов.

Послушав каждую версию и изучив сигналограммы, мы усовершенствуем результаты анализа. Версии 1981, 1989 и 1992 годов звучат очень «по пинк-флойдовски», и используют исключительно первую парадигму громкости. Напротив, релиз 2003 года не очень убедителен в этом отношении. Этот ремастеринг был сделан в формате 5.1 и его правый и левый каналы подверглись тяжёлому ограничению, с преобладанием второй парадигмы громкости. Он звучит как Pink Floyd на FM-радио. Даже то, что окружающие каналы не расплющены, совершенно не компенсирует это. Релиз 2007 года – более интересный случай. На мой взгляд, он обработан очень элегантно. Хотя, к примеру, «Eclipse» звучит громко – намного громче оригинала. С другой стороны, «Eclipse», как финал альбома, разве не должна звучать громко? Другие же песни были ремастерены уже по-другому. К тому же, в «Eclipse» нигде не используется второй парадигмы громкости, хотя, взглянув на сигналограмму, мы ясно видим, что она находится буквально на пределе между ними. Хорошо, что правообладатели издеваются не над всеми легендарными альбомами: релиз 2007 года Dark Side Of The Moon демонстрирует нам настоящее уважение и понимание этой музыки, создавая хороший компромисс между «ароматом» оригинального альбома и современными вкусами.

Перевод подготовил Бережной Вячеслав

РЕКОМЕНДУЕМ К ПРОЧТЕНИЮ:

Война за громкость: хронология

←ЧАСТЬ 3


Загрузка беседы