
エンジニアAlan Silvermanによる、ストリーミング時代のマスタリング術とは(世界に学ぶ! Vol. 7)
1980年代からエンジニアとして活躍し、グラミー賞候補作50タイトル以上のマスタリングを手掛けているAlan Silverman氏。現在はニューヨークに自身のマスタリング・スタジオ「Arf Mastering」を構え活動している他、NYU Tisch School of the Artsにてインストラクターも務めています。
今回の「世界に学ぶ!」シリーズは、昨年NYで開催された「MixCon 2019」で、彼がパネル・ディスカッションに参加した時の映像をご紹介。「音量とラウドネスは全く別のもの」と語る、ストリーミングにおけるマスタリングの未来について語った貴重なレクチャーをお届けします。
CDの時代には音圧戦争を経験した音楽は、ストリーミングという新しいサービスでどう聴かせていくべきなのか? すぐに試せるテクニックなど、ヒント満載の動画をお楽しみください!
ストリーミングによってルールが変わった
音量が大きければ良く聴こえるようにできている人間の耳。であれば、音量を上げればエンジニアの仕事は終わりでしょうか? そんなに簡単なものではありません。
できるだけ大きく聴こえるようにと、CD等の新しいメディアが登場するごとに様々なテクニックや技術が開発されてきましたが、ストリーミングが主流になったことで、今までにない変化が訪れています。
ストリーミング時代のオーディオの扱いは「不思議の国のアリス」の世界のように、全く違う世界になっています。プロデューサーやエンジニアもそれを認識し、理解しなければいけません。
また音量を調節するときに使う「ラウドネス」という言葉も、非常にシンプルな考えのように聞こえますが、実は非常に複雑な考えで、ニュースのように‘‘フェイク・ラウドネス”が存在するんです(笑)。
“ピークを揃える音作り”から、“ラウドネスを揃える音作り”へ
今までエンジニアは、記録媒体に音を載せる際、その媒体から発生するノイズより大きな音量で音楽を乗せることに頭を悩ませてきました。
レコードであれば、レコードの静的ノイズであったり、1950年代車でラジオを聴くとすると、ラジオのノイズや車からのノイズと戦わなければならず、エンジニアはそういったノイズより大きく音楽を乗せることを努力することで、音楽として聴かせることができていたのです。
カセットもそうですね。我々はカセットのノイズとも戦ってきましたが、カセットが大きかったのは、ウォークマンなどで音楽を持ち運びできるようになったことです。
そして最初の大きな変化は、1982年に登場したコンパクトディスクです。オーディオの歴史において、記録媒体のダイナミックレンジが音楽のダイナミックレンジより大きかったのは、これが初めてでした。
以前であれば、自然な低音や高音をコンプレッションをかけて音楽を凝縮して媒体に収めなければいけなかったところ、コンパクトディスクではそれが必要なかったのです。
ですが、レコードの旋盤をCDレコーダーに変えれば良いわけではなく、また技術的にも新しかったので、例えばアナログ・カッティング用に使っていたEQも必要なかったのですが、当時はアナログと同じようにCDに落とし込んでいたため、最初の頃のCDは明るい音質になっていたりと、試行錯誤を繰り返していました。
そしてCDの音圧戦争などを経てiTunesが登場します。我々はディスクの代わりにファイルで音楽を聴くようになり、これをストリーミング・サービスが完全に乗っ取ります。
ストリーミングによって、オーディオの世界にも、“ピークを揃える音作り”から、“ラウドネスを揃える音作り”に変化している、という大きな転換期がきているのです。なのでラウドネスとは何か?どう機能するのか?ということを理解しないといけない時代となったのです。
今までラウドネス用のツールとして使ってきたのは、FairchildやLA2、最近であればiZotope Neutronなどの素晴らしいコンプレッサーやプラグインでした。これらはダイナミック・レンジを狭めてレベルを上げるプラグインです。
60倍ものディストーション、1/5のダイナミックレンジ
では今日の状況を見てみましょう。
プロフェッショナル・オーディオは1924年にスタートしました。General Eletricが最初の商業用ラウド・スピーカーをリリースした年です。
1924年には、60dBのダイナミックレンジ、0.3%のディストーションレベルでした。
1996年には、人間はデジタルのブリックウォール・リミッターを開発し、これが音圧戦争の始まりとなったわけですが、現在のディストーション・レベルは20%以上、そしてダイナミックレンジはポップスとなれば12dBです。1924年から比べて、60倍ものディストーションがあり、ダイナミックレンジは1/5となっています。それもこれも我々がラウドネスを求めたから、です。

ダイナミックレンジとディストーションレベルの過去&現在
https://youtu.be/EiRMYoqU3ys?t=607
「12dBに圧縮されてしまうのであれば、そもそも良い音で録る必要はあるんだろうか?」とまでエンジニアたちも思いましたが、「何が欠けているのか?」と思い立ち、ダイナミックレンジを改めて勉強します。
まず最初に確認したのは「人々はどのようなダイナミックレンジを期待しているのか」「どのようなダイナミックレンジを心地よいと思うのか」でした。そこで解ったのは、ダイナミックレンジは“置かれている環境で違ってくる”ということでした。

各環境におけるダイナミックレンジ
https://youtu.be/EiRMYoqU3ys?t=669
例えば映画館にいるのであればダイナミックレンジはおよそ60dB。青色の部分が、誰かがポップコーンを食べているなどのノイズ音ですが、全体的にノイズは低いですね。緑色の部分が映画の平均的な音量でヘッドルームが大体24dBあります。これで拳銃を発砲した音が大きく聴こえるわけです。
ホームシアターであれば、例えば子供が近くでゲームをしていたり、リビングに誰かがいたり、キッチンで料理していたりするためダイナミックレンジは狭くなります。車であれば更に狭くなる。
飛行機は飛行機のノイズが非常に大きいので、ダイナミックレンジは12dBくらいになります。ということで、最近リリースされているポップスの平均的なダイナミックレンジは機内で聴くことのできる音楽と同じ、ということになります。
これが現状です。何とかすべき課題であり、我々は今、ここまでピークを意識してダイナミックレンジを狭くしなくても、ラウドネスを獲得できる時代に突入しているのです。
デジタルになった途端、ピークをゼロに設定することが世間一般の通念のようでした。ただ、音楽の性質によってピークが違うということが問題でした。
映画の場合だと、ウイスパーや叫び声、銃声、コウロギの鳴き声、爆発音などがそれぞれきちんと聞こえるよう、大きなピークが必要になります。
ですが例えばラウドロック系の音楽であれば、コンプをかけてピークが低くなるようにするのが普通かもしれません。となるとロックは映画より24dB音量が大きいということになります。このように、音・音楽の性質によってラウドネスが違ってくるというわけです。
これはストリーミングにとっては問題です。ストリーミングは色々な年代の曲が瞬時に聴けるため、コンプがかかっていない1930年の曲を聴いた後に24dB音量が大きい曲を聴いたら、鼓膜を傷つけてしまうかもしれません。なのでラウドネス問題はリスナーのリスニング体験という側面だけでなく、安全面からも重要になってきます。
リスナーの耳を痛めることなく、またリスナーがひっきりなしにレベル調整をしなくてもいいように、この問題をストリーミングサービス上で解決し、曲を一定のレベルで聴けるようにしなければなりませんでした。
ストリーミング・サービスでは自分で音量を決めることができない
ここで、ラウドネスを標準化する、という考えが登場します。基本的に何が行われているかというと、音量を、緑色の部分が一緒になるように各楽曲の音量を下げる、ということです。
例えば、ターゲットが「-24」だとします。これはテレビの基準ですが、ロック曲の音量を-24dB下げ、映画であればそのままにしておく。ということを施すことで、テレビであれば映画系のチャンネルでもチャンネルでもニュース系のチャンネルでも、またラジオであればトーク系のチャンネルでもロック系のチャンネルでも、大体一貫した感じで音が聴こえるわけです。

ピークを標準化すると
https://youtu.be/EiRMYoqU3ys?t=792
これが所謂、ピークを標準化することですね。ただし、ダイナミックレンジは音楽のジャンルによって違います。例えば、このチャートであれば大きなブレードが広いダイナミックレンジを持つシンフォニー。そしてアックスヘッドが狭いダイナミックレンジのヘビーメタル、という感じです。

各ジャンルの音楽のダイナミックレンジをイメージしてピークを標準化してみると
https://youtu.be/EiRMYoqU3ys?t=891
昔であればコンプをかけて狭くすることでピークを標準化することに対応してきましたが、我々の考えるラウドネスとは重心のようなものと考えられていて、シンフォニーであれば重心は低いところにあり、ヘビーメタル系であれば高いところにあり、ジャンルによってラウドネスはバラバラです。
我々はコンプをひたすらかけて問題を解決しようとしていましたが、シンフォニーなどはかなり残念な音質になってしまうことがわかります。いくらレベルを合わせられたとしても、これも100点満点の回答ということにはなりません。では何が正解なのか?ラウドネスを標準化し、音量を下げても全ての曲が大きくに聴こえるようにすることです。
そして我々は今、ラウドネスを計測することができる新しいテクノロジーを持っています。今まで我々は、曲のラウドネスを調べる制定された計測方法を持っていませんでした。ですが今はラウドネスを調べることができ、またヨーロッパではEB128、アメリカではテレビの標準規格ATSC A/85などの、ラウドネスについての基準もあります。そして、これらのラウドネスの単位を読み取るメーターのような新しいツールがあります。

ラウドネスで標準化してみると
https://youtu.be/EiRMYoqU3ys?t=858
今、ストリーミング・サービスで何が起こっているかというと、ストリーミング・サービスはテレビ局のようなもので、アーティストによっては「俺の曲が今週金曜日にドロップするぜ」と言ったりもしますが、実際に何が起きているかというと、曲がストリーミング・サービスに消化されて変化してしまうということです。
ストリーミングサービスに曲が納品されると、ラウドネス値をスキャンされて、そのスキャン値に従って、サービスの標準に合わさるように音量を上げ下げされる。だから音量を自分で決めることができないわけです。どんなに有名なアーティストが「自分の曲のレベルを-14にしないでくれ、-6にしてくれ」と言ったとしても、できないのです。
といった状況に我々は向き合わなくてはならず、Spotifyであれば-14、YouTubeであれば-13、Apple Musicであれば-16と基準が決まっているなかで、自分の曲を自分が望むように聴いてもらうにはどうすればよいのでしょうか。
“ヌルテスト”でわかるリミッターの効果
ここで理解してほしいのが、レベルは本当はラウドネスではないということです。
まずレベルとは、基本的には単一の変数SPLの客観的な測定値です。電話やマイクで音を拾うときと同じです。
ただ人間にとってラウドネスは知覚的なものであり主観的なもので、ダイナミックレンジやトランジェントの反応、ピッチのバランス、音の色調などのバランスで決まるものです。レベルとラウドネスには明確な関連性がありますが、同じレベルのトラックでもラウドネスが全く異なる場合があります。そこで僕達エンジニアの腕の見せ所になるわけです。
では音を聴きましょうか。まず最初に我々の業界でヌルテストと呼んでいるものを試したいと思います。
ヌルテストは、位相反転して付け足されたものだけを浮き上がらせる、2つのオーディオファイルの間に何の違いがあるかを確認する方法です。このレゲエの曲で試したいと思います。
課題曲
https://youtu.be/EiRMYoqU3ys?t=1270
この曲を別トラックにコピーして、一つの位相を反転して両方をプレイバックしてみます。何をやっているかというと、一つのトラックからもう一つのトラックをデジタル的に差し引いてるので、このセッションを再生してみると何も聴こえません。
ですが例えば一つのトラックのクリップゲインを1/10dB下げるだけで、これらファイルの違いが聴こえてきます。そのくらい敏感なテストです。
ではここで、3つのリミッターで調整した音を聴いてみましょう。なぜリミッターでテストするかというと、我々がラウドネスを得ようとする場合リミッターが不可欠だからです。EDMにはどのリミッターがいいか、ヒップホップにはどれがいいかなど、我々は常に考えていますよね。
3つの別々のリミッターをかけたものと、リミッターをかけていないオリジナルバージョンを並べます。これをオリジナルバージョンと比較してヌルテストをすることで、リミッターの”秘伝のタレ”が聴こえてきます。
ではXenonをオリジナルと比較してみましょう。違いが聴けますが、これはオーディオの中で行われているものなので、リミッターをかけたファイルを聴いても、これを聴き分けることはできません。
Xenonでコンプをかけた課題曲から、ヌルテストで課題曲を差し引いてみると…
https://youtu.be/EiRMYoqU3ys?t=1354
fabfilterで聴いてみましょう。
fabfilterでコンプをかけた課題曲から、ヌルテストで課題曲を差し引いてみると…
https://youtu.be/EiRMYoqU3ys?t=1379
少し歪みがかかっているように聴こえますね。DMGではこのように聞こえます。
DMGでコンプをかけた課題曲から、ヌルテストで課題曲を差し引いてみると…
https://youtu.be/EiRMYoqU3ys?t=1395
何故EQに手を付けていないにも拘らずリミッターによって音が違うかというと、これらの歪みが、オリジナル音源のデジタル信号を変化させているからなのです。
我々はこのような歪んだ音を、リミッターを使ってマスタリングされる全ての音楽に加えているのです。全てです。
音楽の中でこのようなディストーションが鳴っているということは、人間にとっても何らかの影響があるはずです。これがリミッターを使って極力レベルを上げることの代償であり、絵に例えるならば、絵画の上に色を塗っているようなものです。
音楽の中でこのようなディストーションが鳴っているということは、人間にとっても何らかの影響があるはずです。これがリミッターを使って極力レベルを上げることの代償であり、絵に例えるならば、絵画の上に色を塗っているようなものです。
ストリーミング・サービスでは、最もコンプがかかっている曲が一番小さく聴こえてしまう
これがマスタリングにおける問題の一つですが、これには解決策があります。
ではここで3つの別々の曲を聴いてみましょう。1曲は基本的にリミッターもコンプもかかっていないもので、もうひとつは少しかかっているもの、最後の1曲は結構かかっているものです。これらを聴くと、まずレベルの違いがわかると思います。
コンプレッションのかかり方が違う3曲を試聴
https://youtu.be/EiRMYoqU3ys?t=1459
1曲目のレベルは約-17RMS ですね。次の曲は約-9ということで、大半のポップス系楽曲より低いですね。最後の曲は最近のアグレッシブなマスタリングの典型的なパターン。更にレベルが上がっています。
これらのレベルを全て同じにするとどうなるでしょうか。ストリーミング・サービスのレベル、-17 RMSにして聴いてみましょう。
3曲をストリーミングサービスで聴いた時にどう聴こえるか
https://youtu.be/EiRMYoqU3ys?t=1533
何が起きたのでしょうか。アリスの不思議な物語のように世界が真逆になってしまったかのようです。静かだった曲が大きく聴こえ、大きかった曲が静かになってしまいました。ストリーミング・サービスでは、最もコンプがかかっている曲が一番小さく聴こえてしまうのです。
何故かというと、レベルを上げて音を大きくするために、コンプレッサーが音の幅を狭めているからです。ただストリーミング・サービスでは、我々がレベルに関与できないため、マスタリングでレベルを上げることの恩恵を得ることができません。
この-17の状態が、SpotifyやApple Musicで曲を聴くときのサウンドで、3曲目を大きく聴かせたかったとしても、我々にはそれができないのです。
今まで使ってこなかった“ヘッドルーム”
ですがストリーミングサービスは、音量レベルに代わるものを提供しています。それはヘッドルームです。今まで使ってこなかったヘッドルームに、スネアやキックなどを持ってこれるわけです。ラウドに聴こえないんじゃないかと怖がる必要もなく、自分たちが望む形のダイナミックレンジでミックスを作ることができる時代なのです。クリップすることから解放され、スタジオで聴くのと同じようにリスナーにも聴いてもらえる形でマスター納品できるのです。
ですが、リミッターやコンプレッサーが悪いということではなく、アーティストはクリエイティヴな手法でコンプレッションやリミッターを作品に取り入れています。EDMや最近のヒップホップ、そしてアーバン・ミュージックも、コンプやリミッターに頼っています。これはこれでいいのです。フォーク系の音楽やジャズにまで使う必要がないということです。
最後に一つ、提案があります。これから自分の作品をミックスする際に、1940年から存在するVUメーターを使ってみてください。ラウドネスを視覚的に確認することができます。
どういう風に使うかというと、VUメーターのキャリブレート値を例えば-12にしてみると、Spotifyで聴いたのと同じようになりますし、もしレファレンスを使いたいようであれば、音量を上げ下げして、中心が0VUになるように設定しましょう。
各ストリーミングサービスのターゲットから少し上に設定すると、サービス上でも良い感じで聴くことのできるミックスに仕上げられるでしょう。
<編集後記>
ヌルテストでコンプレッサーのかかり方を確認できる手法は知りませんでしたね!マスタリング=CDのためのもの、という風に捉えがちですが、今後はこういった、配信用のマスタリングが主流になっていくのでしょうね。
文:岩永裕史(Soundmain編集部)