エンベロープについて

2003/8/23 平野拓一


1. はじめに

音色のパラメータとして重要なエンベロープ(Envelope)について説明する。シンセサイザーなどの音色を作る音色職人はパラメータだけを変化させて音を作るが、ここではなぜそのパラメータがあるのかという物理的考察も説明する。


2. エンベロープ(Envelope)について

エンベロープ(Envelope)は音色のパラメータとして重要なものである。エンベロープ(Envelope)とは日本語では包絡線(ほうらくせん)を意味する、ここではある波形を遠くから眺めたときに見える形を表す。


(a)


(b)


(c)


(d)
図1 ある音の波形

図 1(a)はある音(例えば、フルートの音など)の波形を表す。横軸が相対時間(単位は別に気にせず、軸の範囲は音が出た瞬間から消えた瞬間までを表す)、縦軸は振幅(空気の粗密波で言うと、最初の空気分子の静止位置からの変位)を表す。例えば、木琴の1つの木を叩いたとき、音が鳴り始めた瞬間から音が止まった瞬間まで波形を記録したものだと思ってほしい。(a)を眺めていると、ある波形が見える。それは上下対称で、その上半分を見ると、波形の境界線は図 2に示すような波形になっている。音の鳴り始めから終わりまではこのように一般には振幅が変化する。この振幅のゆっくりした変化をエンベロープ(Envelope, 包絡線)と言う。


図2 エンベロープ

次に、図 1(a)の波形を細かく見ていこう。図 1(a)の相対時間0.1〜0.2を拡大して描いてみると図 1(b)のようになる。内部にさらに波形が見えてきた。さらに、図 1(b)の相対時間0.1〜0.11を拡大して描くと図 1(c)のようにはっきりと正弦波が見える。図 1(d)は図 1(a)の相対時間0.7〜0.9を拡大して描いたものである。このように、波形をマクロに見たときは図 1(a)のようになっているが、実は内部では正弦波(これはもちろん楽器によって波形が異なる)の振幅(聞くときは音量に対応する)がエンベロープの振幅になるように変化させられていた波形だったのである。エンベロープ内部の細かい波形は楽器特有の波形であり、一周期分が繰り返されている。もちろんそれだけでなく、音の出だしから鳴り終りまでの音量の変化であるエンベロープも楽器特有のものであり、楽器の種類によってエンベロープの形は異なる。
さて、フルート、バイオリンなどの楽器では音の出だしと鳴り終りでは音を伸ばし続けて一定の音に聞こえるときとは違った特徴のある音となる。例えば、フルートを例にして説明しよう。フルートで息を吹き込んだ瞬間は綺麗なフルートの音色だけでなく、擦れた息を吹く音が聞こえる(だから音が汚いという訳ではなく、それがフルートらしさなのである)。それが図 1(a)の波形の最初の音がだんだん大きくなる部分に相当する(実際には図 1(a)は説明のために作った抽象化した波形だから実際はもっと複雑である)。そして一定の息を吹き続けているとフルートの管内でだんだん定在波が出来ていく。あるときその振幅は最大となり、それ以上息を吹いていても音量(振幅)が変化しなくなる。吹き続けている息(外から与えるエネルギー)は定在波が減衰しないためだけに使われる。なぜなら、息を吹くのを止めたらすぐに音が拡散したり、空気の摩擦によって定在波が消えてしまうからである。このように一定の定在波が作られていて安定した音(ある波形の繰り返し波形が連続して出されている状態)を出している状態が図 1(a)の一定振幅が長く続く時間である。次に、息を吹き込むのを止めてもフルート管内で振動している空気はすぐには止まらない。しかし、音を出し続けてエネルギーを拡散したり、空気の摩擦ですぐに音は減衰していく。それが図 1(a)の最後の音が減衰していく時間である。このように、音のエンベロープの特徴を抽象化して表すと図 2のように描くことができる。これはRoland SC-88 VLの取扱説明書(p.21)に載っているものである。MIDI音源でもこのパラメータを設定することができる。本当はもっと複雑なエンベロープとなるかもしれないが、大体これらのパラメータで音の特徴をとらえることができるのである。MIDI(正確にはPCMだが)以外の他の音源でもエンベロープは波形とともに楽器の特徴を象徴する音色設定の重要なパラメータなのでPSG音源, FM音源など多くの音源でエンベロープを設定できるようになっている。
図 2のパラメータの説明をすると、横軸は時間であり、音の鳴り始め(Note On)から鳴り終り(Note Off)までを描いている。縦軸はエンベロープ(音量の変化のしかた、正の値)を表す。まず、音を出した瞬間(ピアノでは鍵盤を叩いた瞬間、フルートでは息を吹き込んだ瞬間・・・)には振幅0の状態からだんだん音が大きくなっていき、最大音量アタック・レベル(Attack Level)に達する。その時間がアタック・タイム(Attack Time)と呼ばれる。物理の問題として一般的なことを言うと、アタックタイムは0にはならない。なぜならば、物理現象として不連続な変化をするものはないからである(江崎玲於奈氏が発明したエサキダイオードなどに見られる量子現象のトンネル効果などは別。あれは原子レベルのミクロな現象だから起こりうることであり、原子よりもはるかに大きい世界では厳密に不連続な現象は起こらない。余談だが、そのような不連続を記述する数学の分野は「カタストロフィー」である)。不連続な変化をしないことは普通に考えて想像できるであろう。例えば、フルートを吹くときに小さな肺活量の人がゆっくり息を吹き込んだら空気の振動エネルギー(エッジに当たってカルマン渦として振動する?)のうち、共振する周波数成分だけが少しずつ定在波のエネルギーに伝えられていってだんだん定在波の振幅が大きくなっていく。また、大きな肺活量の人が息を吹き込めばすぐに音が最大状態に達するであろうが、それでもミクロに見ると波形の立ち上がり方は連続になっているはずである。他の楽器でも同様なことが起きており、物理現象として見たら振幅が0の状態からだんだん振幅が大きくなっていくのである。そして、最大振幅に達したら少し音量が減少する。これは、楽器にもよるが、フルートの場合で言うと、人間が息を吹き込む際に最初から一定の音を出そうとして強く息を吹き込むが後は弱まってしまうから・・・などの要因によるものと思われる(詳しく調べればわかることであるが)。どちらにせよ、多くの楽器の波形を観察するとこのような波形になっているようである。このように音の出だしで音量が最大レベルに達し、ちょっと減衰する時間をディケイ・タイム(Decay Time)と呼ぶ。そして、それ以降一定の振幅となり、周期波形とも言える状態が続く。この一定振幅をサステイン・レベル(Sustain Level)と言う。図 2にはその時間をあえてサステイン・タイム(Sustain Time)と書いたが、これはフルートでは息を吹き続ける時間で如何様にもコントロールすることができるから、あえてサステイン・タイムと言う必要はない。サステイン・タイムの波形は通常音色の周波数解析で使われる部分である。この時間は聞くと何も変化のない一定の音として聞こえる。また、ピアノやギターのようにサステイン・タイムが0の楽器も多くある。外部からエネルギーを与えるのは弦を叩いた瞬間だけで、後は減衰の一途をたどるからである。そして、フルートで息を吹き込むのを止める(外部から加える力を無くす)と音が消える・・・が上でも述べたようにすぐに音が消えるわけではない。フルートの管内に出来ていた空気の振動がだんだん弱まっていってついに消えるのである。この時間をリリース・タイム(Release Time)と呼ぶ。最後に付け加えると、アタック・タイム、ディケイ・タイム、リリース・タイムではサステイン・タイムの波形とは異なる波形をしているかもしれない。フルートの場合は当然アタック・タイムのときに息を吹く音がするわけであり、波形は確実に異なっている。PCM音源では音色を録音することで解決している(ある意味、0から音を作り出そうとするエンジニアから見ると「ずるい」)が、他のPSG音源、FM音源などの本当に音を0から作り出す音源ではそれを言ったら音色の制御が難しくなりすぎるので、波形の変化までは考慮しない。波形の振幅の変化だけを見るパラメータがエンベロープだと思えばよい。また、図 2のアタック・タイム、ディケイ・タイム、リリース・タイムの波形にもいろいろあるが、一般の波形を用意したらきりがない。音源によって固定した直線あるいは曲線が使われるようである。
さらに、エンベロープは図 2だけのパラメータだけでは記述できないように思えるが、例えばフルートや尺八で音をふるわせる奏法(トレモロ)などは別のパラメータとして用意されている。また、演奏環境(コンサートホール)の違いによって、直接波と反射波との干渉で起こる振幅変化の設定もエフェクタとして別のパラメータで用意されている。このように波形変化の要因毎に切り分けてパラメータが用意されているのである。

音の波形のエンベロープが大体図 2のパラメータで表されることはわかったと思うが、より理解しやすいようにここでは電気回路と対応付けて説明しよう。R, L, Cが繋がった共振回路に交流電源をつないで電流を流すことを考えよう。そのとき、電源はフルートを吹く息に相当し、電流がフルートが出す音の波形に相当する。アタック・タイム、ディケイ・タイム、リリース・タイムは電気回路で言うと過渡状態(Transient State)と言われ、波形が時間的に変化する時間である。一方、サステイン・タイムは電気回路で言うと定常状態(Stationary State)と言われ、波形が時間的に変化しない(周期波形となっている)時間である。

3. 音の立ち上がりとエンベロープ

3.1 低音楽器は音の立ち上がりが遅いのはなぜか?

オーケストラを演奏する場合などに、低音楽器の方が高音楽器よりも音の立ち上がりが遅いと言われるようである。

その物理的理由について考えてみる。管楽器を例にして説明する。
高音楽器のトランペットに比べて、低音楽器のホルンの方が音の立ち上がりが遅いと言うのは人間の肺活量が楽器の大きさに対して非力だからである。音を出すとき、安定した周期波形になるまで、外部から力(息を吹くこと)を加え続けないとならない。そして、一定時間経つと管楽器の管内には空気の疎密波の周期波形が出来上がってそれ以上変化しなくなる。外部から加え続けている息は、波形が減衰しないためだけに使われる(減衰は空気の摩擦や音としてのエネルギーの拡散で起こる)。

この一定の波形にたどりつくまでの時間が立ち上がり時間(アタック・タイム+ディケイ・タイム)ということで、管楽器の大きさに比べて人間が吹く息は少なすぎるためになかなか安定した周期波形までたどりつけないから低音楽器は音の立ち上がりが遅いということである。例えば、象のような大きな肺活量のある動物がホルンを演奏したとしたら音の立ち上がりはすごく速くなるはずである。オーケストラなどでは低音楽器の奏者はこの現象を経験的に理解して、少し早めに、フライング気味に音を出したりして無意識に(または意識的に)調整しているようである。

この問題は音楽に限ったものだけでなく、電気回路でも言える。例えば、大きな容量を持った電池に充電するときのことを想像してみよう。電気回路の電流が音楽演奏の息に相当する。同じ電流源を使った場合、大きな容量を持った電池を充電して、それ以上電流が流れない状態にするには小さな容量の電池を充電するときよりも時間がかかる。電気回路ではこのように音の立ち上がりに相当する時間的に電流、蓄積電荷などが変化する時間を「過渡状態(transient state)」と言う。安定した電流が変化しない状態(交流では周期波形の状態)を「定常状態(stationary state)」と言う。方程式が同じなので(作っていないがそうなるはずである)、これらは支配方程式が同じで片方の現象を知ればもう一方の現象も容易に想像できる。

今の話を弦楽器に対して適用しても、弦に与えた振動を空気の振動を介して共振器であるひょうたん形の部分に伝えて安定した波形になるまで待っていることになるので、やはり、最初のエネルギーが非力だから大きさが物理的に大きい低音楽器では音の立ち上がりが遅いと言える。

シンセサイザーなどの音色職人は波形(倍音の混合の仕方)やエンベロープで音色を操る。そのレベルの考察でも十分音色作りは出来るが、よりミクロに現象を見ると上記のような現象が起きているから楽器特有のエンベロープがあるのである(もちろん、それ以外の音の発生形式によるエンベロープ変化の要因もある)。


Copyright(c) 2003 Takuichi Hirano, All rights reserved.
商用以外でしたらこのページの内容は自由にコピーして教育用にお使い下さい。

また、ご意見・ご質問・ご感想もお待ちしています。

Go Back