絶対音感と音程の科学

絶対音感に関して、主に私の所属する合唱団のメイリングリストで盛り上がった様々な意見の中から、音階を科学的に説明した私の投稿2点を掲載し、また音程の実験をした人の投稿1点をあわせて紹介しましょう。

なお、「絶対音感の人の感じる音の色」についての意見はこちらに掲載しました。


Aさん>
それはともかくとして、強靭な絶対音感を持っている人に伺いたいことがあります。旋律を歌うときはともかくとして和声を構成するときにはどうしても純正律とは違う音を出さざるをえないと思うのですが、それってどんな感じがするものですか?例えばC durの和音でEを担当している場合は少し低めに出した方が和声的には落ち着きますけど、和声的に気持ちいいのと絶対音感的に不快なのとどっちが勝つのでしょう?
Kaくん>
その場合、やはり絶対音を捨てて和声的に気持ちいいことを追究すべきだなあと頭では思います。例えば、C durで和声的に気持ちいいEの音程と、絶対的なEの音程は何Hz(セント)くらい違うのでしたっけ?

1 octave = double frequency = 12 x 半音
C-E interval (平均律) = 4 x 半音 = 4/12 octave = 2の (4/12) 乗 = 1.2599
C-E interval (純正律) = 5/4 = 1.2500

よって平均律÷純正律 = 1.0079

もし、男声の 165 Hz(ヘルツ)のEだとすると、1.3 Hz の差異しかないことになりますね。

(平均律の)半音を確か 100 cents と数える(オクターヴは 1200 cents)のであるが、半音は

2の (1/12) 乗 = 1.05946 倍である。つまり約6%増し。

( log_[1.05946] 1.0079 ) x 100 = ( log_[2] 1.0079 ) x 1200 = 13.7

つまり約 14 セントだけ純正律の方が低いことになります。半音の 1/7 だけ低いわけですから、この高さを「絶対音として」低い、と感じ取ることができるひとはそうはいないと思います。もしいたとしたら、その人は1オクターブの中に7×12=84段階もの音を区別できることになって、それは大変な事でしょう。同じ議論から、440 Hz と 442 Hz の差 (8 cents) が本当に気になる人もほとんどいないと僕は思います。

私も、せいぜい半音の 1/3 か 1/4 くらいしか分からないし、みんなと一緒に歌っていて音が下がってきたとき、気になり出すのは半音の 1/3 から 1/2 くらいまでずれたときですから、1/7 は問題ではありません。もちろん、CとGが与えられていれば、相対音としては両者のEには十分聞き分けられるほどの違いがあるのですが、これは相対音感であって、絶対音感の有無とは関係ない問題です。

ちなみに、五度に関しては、

C-G interval (平均律) = 7 x 半音 = 7/12 octave = 2の (7/12) 乗 = 1.4983
C-G interval (純正律) = 3/2 = 1.5000

よって平均律÷純正律 = 0.9989 = 1 - 0.0011 (1.96 cents)

で、半音の 2/100 の違いしかないので、こんな差異を聞き分けられる人がいたとしたら異常だといえましょう。たとえば、男性の声だとすると 0.1 Hz くらいの差にしかならないわけで、両方のGをうなりで聞き分けるとしても 10秒にわたるうなりなので、ほとんど無理ではないでしょうか。

Kaくん>
そしてその幅は、そもそも、「普通の」人間の発する声の線幅(横軸を周波数、縦軸を強度として、強度分布をかいたときの幅)よりも十分広く、また、そのふらつきの幅よりも十分に広く、「普通の」人間の声で十分区別されうる幅なのでしょうか?

これはとても興味深い問題ですね。両者の違いが分かる演奏がある以上、声の線幅自体はともかく、ふらつきの幅が 14 セント以下にできる人は居る、と言っていいのでしょうね。白ばらなどの合唱団の場合には、個人の能力もそうですし、また人によって出している音に少しずつ差異があるので、総体としての声の線幅やふらつきの幅は、残念ながら 14 セントをゆうにこえてしまっていると思います。

Oさん>
それとも、人間にはある特定の純正律を自然に選択する能力が潜在的にあるのでしょうか。
#あ、だから純正律っていうのか?・・それにしても、西洋音楽の音階だって人間が決めたものじゃあ・・・?

純正律、という言葉自体は相対音階の用語だと捉えています。(相対音感の)純正律を好む能力は人間にあると思っています。純正律は周波数の比が整数比になるもので、たとえば C-E は 5/4、C-G は 3/2 ですが、すると C x 5 = E x 4 = e' (一点eのつもり)となって、Cのなかに含まれている5倍音と、Eのなかに含まれている4倍音が一致するので、これが人間の耳に心地よく聞こえる理由のようです。たとえばE音が少しずれると、倍音の e' が両者の間でずれてうなりを生ずるので、不快な音になるというのです。

つまり、整数比の音(=純正律)の間では、倍音が一致するので心地よい。一般の楽音では倍音が豊富に含まれていて、これが豊かな音色を生んでいるのですが、逆に、倍音を全く含まない単純正弦波の音(音色を持たない)では純正律が気持ちいい、とか、ハモる、とかいった感覚を感じることができないそうです。

ところで、音階は人間が決めたものではないと私は思っています。「オクターヴが周波数の比率にして2倍」であるのは、人間の(あるいは動物一般の)耳が決めたものですが、これはこれで受け入れるとしましょう。ただし、決して人間の脳味噌が決めたものではありません。

さて、2の 7/12 乗が 3/2 = 1.5 に限りなく近い、というのが12平均律にとって決定的な数学的偶然でした。果たして、Cから辿って 1.5 倍の周波数ごとに、G、d、a、e’という風に音階ができてきます。12 回巡ったところで、(近似的に)Cに戻るのです。ただし、もとのCに比べて7オクターヴだけ上になっています。7/12 の7と12 の意味がわかりますよね。

そうして作られた音階が 12 平均律なのですが、その12音は(それより以前から存在した)純正律、つまり

C-Es = 5:6
C-E = 4:5
C-F = 3:4
C-G = 2:3
C-As = 5:8
C-A = 3:5

や、ピタゴラス音階(省略)といった整数比音階から出てきた音と(近似的な精度で)対応づけができるものでした。これも重要な事です。

話が逸れますが、ピタゴラスは音階は(美しい)整数比であるべきだと考えていたようでジレンマに陥っていたのですが、これは人間の耳にとって整数比が気持ちいい反面、音の周波数は比率、もしくは対数的(オクターヴは2倍の周波数比)な感覚で、2を底とする分数(1/12)の対数がどうやっても整数比(有理数)にならないことにそもそもの(数学的な)原因があったわけです。

高校生のときに、11 平均律や 13 平均律の音階があったらどうなっているかを計算してみたことがあるのですが、整数比に近い音と対応づけられるものは全くといっていいほど存在せず、8,9,10,11,13,14.. の各平均律について壊滅的な結果でした。

後に、大学になってから本で読んだところ、12 平均律の次に理に適っている(整数比に対応づけられる近似音が比較的多い)ものは 53 平均律である、と知りました。たとえば、 C-G = 2の (31/53) 乗 = 1.49994 で、12 平均律より精度が上がっています。ただ、1オクターヴを 53 段階に区切るのは細かすぎて人間には無理のようです。ピアノで1オクターヴが 53 鍵あったとしたら、一体だれが弾けるでしょう。

こう考えてくると、「12 平均律は必然の結果生まれた」というのが私の持論なのですが、どう思われますか。


Mさん>
で、機械の音でもいいんなら、ピッチベンダーのついたキーボードで第3音を鳴らしながら、同じ音色が出せるもう一台のキーボードをならべて残りの2つの音をだせばできますよね。
Aさん>
機械で鳴らす楽器音って正しい倍音を含んでいるのかしら?それとも平均律の倍音(何だそりゃ)を適度な割合で混ぜることによって楽器の音色を真似ているのかしら?後者だったらこの実験はうまくいかないよねぇ。

平均律の倍音というのは変ですね。
倍音は基本波に対して正確に整数倍の周波数なのであって、平均律とか純正律とかはオクターブを細分する仕方をいうのですが、Cから始めたとして、2倍音はオクターブ上のc、3倍音はg、4倍はもう1オクターブ上のc’、5倍はe’、6倍はg’、7倍がだいたいb’(変ロ)、8倍はc'' に対応します。つまりオクターブが2倍だから、GはCの 3/2 倍、EはCの 5/4 倍、BがCの 7/4 倍ということになります。これが純正律です。(この議論は少々いい加減で、正確には、純正律ではBはCの 16/9 倍とされる。)ただしもっと上にいくと、どんどんずれてくるので、これ以上先は11/8 倍がなになにの音、というのではなくて、むしろ定義されていない、というのが正しいのではないでしょうか。

 機械では、整数倍の周波数を生成することは容易ですが、2の 1/12 乗などという中途半端な周波数はたやすくつくることはできないので、含まれている倍音は「正しい」ものです。
 本物の楽器をまだうまく再現できていないとすれば、それは倍音が混ざる割合の調整だとか、音の立ち上り/立ち下がりといった経時的な、音量/音色=倍音比率/微妙な音程 の変化をうまく表しきれていないところに起因するのだと思います。

Kaくん>
声の線幅については、きっと、14centよりも小さいでしょうから、中心移動で十分対処できそうな気がしてきました。

いわゆる張りのある声でないとそうもいえないでしょう。ぼわーとした出し方をしていれば、線幅はもっと太いという気がします(あくまで個人的な想像です)。肉声に関していえば、ある程度 発声法をマスターした人の声でないとだめだとおもいますよ。

一方、ふらつきのことについてですが、特に、ビブラートに関してはどうなのでしょう?ビブラートがかかっていると、きっとふらつきの幅は14centよりもかなり大きいと思います。その場合も、中心がちゃんと純正律の第三音の位置にあれば大丈夫なのでしょうか?

ビブラートのたくさんかかったオペラ歌手は素晴らしいが、オペラ歌手が何十人もいて(宗教曲のような)合唱曲を歌ったとするととても聞きたくはないなあ。

 つまり、中心があっていればいいなどというのはあまり信じません。倍音の中に同じ音が含まれるから美しいのですが、音の線幅が細くて、共鳴がはっきりしている(Q値が高い(?))方が音がぴたっとあう感覚が顕著になります。同じ音が本当に共鳴しあうと(位相が揃うと)その音は大きくはっきり聞こえるようになりますが、音がぼやけているとその効果は小さいものになります。反対に、音の線幅がシャープだと、ちょっとずれただけでも倍音が不協和のうなりを発生するので、はっきりときたない音だと分かるようになります。要するに、音の線幅や、ふらつきが大きいと、全てがぼやけてしまって、第3音の純正律と平均律の違いも はっきりとしなくなってしまうはずです。

 ところで、私の感覚では、ビブラートは中心音ではなく、高い方の音に聞こえます。たとえば、cのビブラートは、cと、それより半音近く低いだいたいHの音との間で音程が揺らいでいる現象、だと私は認識しています。平均ならHi(ヒ)というか、つまりcとHの中間音になるはず。(クマさんに依ると、シャープは -is だが、半シャープは -i と言うらしい。)これは私だけの感覚なのかも知れませんが、聞くときも、自分で出すときも、自然とそう聞き、そう歌っているようです。
 ひょっとするとビブラートがかかるとき、時間的にcとHの間を平等に行き来しているのではなくて、多くの時間がcで、短い時間だけHに揺らぐのかもしれません。あるいは、cとHの間を徐々に連続的に変化するのではなくて、わりとc or Hというように離散化していて、その間の連続的変化の時間は短いのかも知れません。その場合は、cとHの両方聞こえるうち「人間は隣り合う2音のうち高い方の音を認識し易い」という仮説を立てればcの方が聞こえる、ということなのかもしれません。私の感覚からすると、後者の説明の方が近いような気がします。

 話がちょっと難しくなったかもしれませんね。
 あくまで、今の私の感想&想像なので、とんでもない嘘がまざっているかもしれません。あまり鵜呑みにしないでくださいね。

 そもそも、なぜ人間の声にはビブラートがかかる仕組みがあるのでしょうか。(慣れていない人はかけられないかもしれないが。)不勉強なのでよくわかりませんが、ご存知の方 いらっしゃいますか?


Aさん>
ところで線幅もふらつきの幅も0の完璧な発声をマスターしたけれど位相まではコントロールできない人(^^;)が大勢集まって同じ音程と音量で一斉に声を出したなら...

位相まで本当に揃えられるものなのか、私には疑問だったのですが、位相がぴったり合えば、2人で4倍、10人で100倍の音量が出せるのですよ。なら、耳で聞きながら音が大きく響くところを探していけば(その間には周波数を微妙に変化させている訳で、その過程で位相が揃う時が存在するからそこで周波数を固定することで)位相までちゃんと合わせられるものなのかもしれません。もちろん、音符が長い必要があるでしょうね。オケの人など(たとえば弦楽器)は、本当に音の高さがぴったり合った時には音がとても大きく響いて聞こえるものだ、というそうですが、これなどは
本当に位相までよく合わせた結果なのかもしれません。合唱ではなかなか簡単ではないでしょうねえ。1秒以上のあいだ、周波数が 1 Hz すらも揺らがずに(もちろん音の幅も狭くて)声帯を維持するのは。

ところで、昨日の私の投稿(上述)に間違いがありました。家に帰って「合唱事典」など数冊をめくってみたのですが、「純正律ではBがCの 7/4 倍となる」と書いたのはやはり嘘で、「純正律ではBはCの 16/9 倍」でした。63/64 だけ違っていたわけですが、これは 20 セントくらいになるので結構大きいですね。

ただし、七の和音つまりセブンスコード (C7,G7 など) が綺麗に聞こえるのは、上の純正律ではあまりちゃんと説明できないように思います。(純正律の議論では二音の関係および長三和音についてよく説明がなされていますが、四和音についてはほとんど書かれていないようです。というより、七の和音というもの自体が、ひょっとすると平均律の産物なのかもしれません。よくは知りませんけど。)

  純正律 C=1, E=5/4, G=3/2, B=16/9

E-B, G-B の間はかなりひどい整数比になるものね。それよりもむしろ、B=7/4 に近いと思って、

  C=1, E=5/4, G=3/2, B=7/4

にすると、 C:E:G:B = 4:5:6:7 となって綺麗な整数比になる。昨日書いたように C の倍音は8倍音まで全てが E,G,B のどれか(のオクターブ)に重なるので綺麗なのだ、と考えた方がすっきりするでしょう。


Kaさんの行った、絶対音感と音程に関する実験についてここに紹介します。

「実験」ですが、ギターやピッチベンダーつきの鍵盤楽器が手元になかったので、とりあえず、クロマティックチューナー(平均律の音から、何セントくらいずれているか針で示してくれるもの)と、電子ピアノを使って、簡単な実験をしてみました。

まず、電子ピアノで、ド、レ、ミなどと、一つづつ音を出し、チューナーの針の指示値をみてみました。その結果、440HzのAを基準とした平均律中の対応する音からのずれは、それぞれ+/-3cent程度で、電子ピアノの調律精度とチューナーの精度を合わせても、このくらいにはよいということが、まず確認されました。

次に、五度は、純正律と平均律で2セントしか違わない、ということから、電子ピアノのドとソが近似的に純正律の5度となっていると仮定します。そして、ドとソを鳴らしておき、チューナーの針を見ずに、一番気持ちいいと思われるミの音を自分の声で出してみました。ここで、チューナーが、平均律のミよりも14セント低いところを示せば、純正律の和音となり、自分の相対音感が正しいことを示すことになります。

実際やってみた結果は、平均律のミの位置にむしろ近いところを示す結果となり、自分の相対音感に疑問がのこる結果となってしまいました。私の場合、ピアノという平均律楽器がいつもそばにあって絶対音感が刷り込まれたため、「平均律が美しい」と思うようになっていて、どうしても平均律のミに引っ張られてしまうのかもしれません。(絶対音感の弊害はここにもあるかもしれませんね)

次に、チューナーが平均律のミよりも14セント低いところを示すように、今度はチューナーの針を見ながら声を発してみました。そのときのミの音は確かに、絶対的にも低いと解るくらいの音であることが実感され、無伴奏合唱をやるときはここを狙わなければいけないのだ!ということが認識されました。

ただ、この音を発しているときに、十分な共鳴が感じられたかと言われると、そんな感触は得られませんでした。その理由としては、先に書いた、電子ピアノのドとソが近似的に純正律の5度となっているという仮定が悪い、ことが考えられます。また、電子ピアノの音色と人間の声の音色(倍音成分構成)が違うため、相対音感の、正しい検証実験となっていない、という可能性もあります。さらに、肉声に対するチューナーの応答にも、確度、精度(ふらつき)の点でやや問題があるようでした。この原因は、肉声自身のもっている線幅やふらつきにあるのかもしれません。(ミの音を出しているのに、その周波数の半分の音であるラの音として、チューナーが認識してしまうことすらありました)

無伴奏合唱長三和音をキメることをゴールとしたいので、次の実験は、以下のようにして行ってみたいと考えています。

実験:
安定した音程を出すことのできる人2人に協力していただいて、1人にはピアノの音からとったドを声で出してもらう。そのドの音の位置をチューナーで確認しておく。もう一人の人に、そのドに対して純正律5度のソをだしてもらう。そこへ自分が、一番気持ちいいと思われるミの音を出し、チューナーが、平均律のミより14セント低い値を示すのかどうかをみる。

しかしながら、この実験でも第三音を静的な状況で確認したにすぎません。最終的には、音楽の流れの中で、いわば動的な状況でこれができるようになりたいものだと思います。


関連文書: 絶対音感絶対音感持論様々な人の意見集音程の科学絶対音感の音の色絶対音感の幼児教育

書籍紹介: 「絶対音感」最相葉月著、小学館



鳥居の音楽メインページに戻る
鳥居のホームページに戻る

リンク先 東京大学白ばら会合唱団ホームページ
リンクリスト: 音楽リンクのリスト