Эммануэль Дерюти. Динамический диапазон и война за громкость - Часть 1

Опубликовано в журнале Sound on Sound в сентябре 2011 года

Эммануэль Дерюти

«Почему музыка стала звучать хуже». «Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».

Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.

Действительно ли теперь музыка стала громче?

Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.

По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.

Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.

Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.

Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением.

Что такое динамический диапазон музыки?

Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.

Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.

Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.

Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.

Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.

То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».

Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.

ЧАСТЬ 2→


Загрузка беседы