注意!
「コンピュータと音楽の世界」の生原稿です。内容は、無断引用できません。
引用に関しては、ご連絡下さい。

4.6 音楽の構造解析とその応用
はじめに 
 本節では、音楽の構造解析を音楽認知科学の視点から客観的に捉える理論や手法を紹介する。これらの取組は、構造解析システムや自動演奏システムにおいて重要なものであるが、残念ながらこれまで日本では音楽学やコンピュータ音楽の領域では十分な解説が行われていない。
 現在、代表的な認知的な音楽構造の解析理論には、Meyerの「暗意ー実現モデル」[1]の流れをくむNarmourのクロージャー解析理論[14]と、Schenkerの音楽分析理論の流れをくむLerdahlと Jackendoffによる生成音楽理論(a Generative Theory of Tonal Music;GTTM)[4]がある。ここでは後者を中心に、音楽構造の階層的な解析理論を解説するとともに、その応用について論じる。

1.GTTMの理論基盤
 GTTMは今日音楽心理学や音楽情報科学の分野で最も注目を集めている音楽解析・認知理論の1つである。1994年の国際音楽知覚認知学会(ICMPC)では「GTTM出版から10年」という論題が議論されており、現在でもこれらの領域における最も重要な著述の一つとして位置づけられている。
 GTTMの目的は、ある音楽語法(調性音楽)の経験を持つ聴衆に共通した音楽的直感によって得られる内容を形式的に記述することにある。その理論基盤は、Schenkerの音楽解析理論とChomskyの生成言語文法理論にある。Schenkerは声部書法解析という「和声と対位法が相互に影響する構造を解析する手法」を用いた。その解析手法は楽曲の表層から深層までを前景・中景・後景といった階層構造に還元するものであるが、楽曲解釈や演奏理論を考える時に強力な方法になる。なお、還元とは、楽譜情報から構造的に重要な部分を抽出することを意味する。一方、Chomskyは言語構造を、文-句-品詞-単語のような構造に階層的に解析し、構造をツリー(樹木)に例えた構造図(図-1)によって表記する。


図-1

 SchenkerとChomskyに共通しているのは、表層から深層までを階層的な構造に解析することである。
なお、生成文法のツリー構造解析手法を音楽に適用したのがGTTMである。
 
2.GTTMによる構造解析の概要
 GTTMの根底に流れる基本的な考え方は、人間の音楽知覚・認知過程をもとに、音楽を階層的な構造に解析することである。実際の楽曲の構造解析では、音楽の知覚・認知に必要な、グループ構造(Grouping Structure)・拍節構造(Metrical Structure)・タイムスパン還元(Time-Span Reduction)・延長的還元(Prolongational Reduction)の4つの構成要素によって解析され、各々は「基本的な構造特性を明らかにする」構成ルール(well-formedness rules)と「経験豊かな聴衆の聴取によって導かれるものを指定する」選好ルール(preference rules)の2種類に分類された詳細なルールによって厳密な階層構造に解析される。

3.グルーピング構造
 グルーピング構造の解析では、楽曲を音楽的にまとまり感があるグループに分割するとともに、各グループの階層構造を決定する。解析ルールには、グルーピング構成ルール(Grouping Werll-Fomedness Rules;GWFR)とグルーピング選好ルール(Grouping Preference Rules;GPR)がある。
3.1 グルーピング構成ルール(GWFR)
 連続した音符情報に対応するようなグルーピング構造規則はWell-Formednessルールとして以下のように定義される。
1.構成要素が連続している場合のみグループを形成することができる。
2.1つの曲は1つのグループである。
3.グループはより小さなグループ(サブグループ)を内部に含んでもよい。
4.グループはサブグループの一部だけを含むことは許されない。サブグループ全体を内部 に含まなければならない。
5.グループがサブグループを含むなら、グループ構造が交差しないサブグループ群によっ て内部を埋めつくされねばならない。
 GWFRを適用したグループ構造は、スラーによって表わされる階層構造になるが(図-2)、GWFR4,5によってbのグルーピングは禁止される。


図-2

3.2 グルーピング選好ルール(GPR)
 音楽経験のある聴衆がグループ構造を知覚するためには、局所的なルールと大きなレヴェルでのルールの2種類に大別されるGPRがある。
●GPRの局所的なルール
1.(alternative form):非常に小さいグループへの解析 は避ける、特に単音をグループとす ることは避ける。
2.(Proximity):4つの音符(n1,n2,n3,n4)が連続しているとする。以下の条件のどれかが成 立すればn2とn3の間がグループの境界と認識される。(nに休符は含めない)
 a.(Slur/Rest):n2の終わりからn3の始まりまでの時間間隔が、n1の終わりからn2の始ま  りまでの時間間隔及び、n3の終わりからn4の始まりまでの時間間隔よりも長い。
 b.(Attack-Point):n2の始まりからn3の始まりまでの時間間隔が、n1の始まりからn2の  始まりまでの時間間隔及び、n3の始まりからn4の始まりまでの時間間隔よりも長   い。
            GPR2a     GPR2a    GPR2b


譜例-1

 譜例-1はGPR2によって、それぞれ第3音と第4音の間にグルーピングの境界がある。

3.(Change):4つの音符(n1,n2,n3,n4)が連続しているとする。以下の条件のどれかが成立すればn2とn3の間がグループの境界と認識される。
a.(Register):n2-n3 間の音高差がn1-n2 間の音高差およびn3-n4間の音高差よりも大きい。
b.(Dynamics):n2-n3 間でダイナミックスの変化がありn1-n2 間、n3-n4間でそれがない。
c.(Articulation):n2-n3 間でアーティキュレーションパターンの変化があり、n1-n2 間n3-n4        間でそれがない。
d.(Length):n2とn3が異なった音長をもち、n1とn2もしくはn3とn4が同じ音長の場合。
          GPR3a    GPR3b   GPR3c   GPR3d


譜例-2

 譜例-2はGPR3によってそれぞれ第3音と第4音の間にグルーピングの境界がある。

3.3グルーピング構造の解析例
 譜例-3はMozartの交響曲第40番の開始部のグルーピング構造を示している。


譜例-3 

 では、どのようにGPRを適用してグルーピング解析をおこなうのであろうか。譜例-4の上部の数字は音符の番号を示し、下にGPRの適用を示している。


譜例-4

 まず、2から5までの音符について考察する。2と3のアタックポイントの間隔は8分音符であり、4と5のアタックポイントの間隔も同じである。一方、3と4のアタックポイントの間隔は4分音符であるため、GPR2bのAttack-Pointルールにより、3と4の間にグループの境界がある。また、GPR2aのSlur/Restルールが、2と3の間に潜在的な境界をもたらす考えられるが、3と4の間にはスラーがないのでGPR2aの条件にあわず、2と3の間は境界として認知されない。
 譜例-4の下に表示した各ルールは、このような考察によって適用されたものである。以上の解析では、楽譜-4に示したGPR2,3が適用された箇所は、譜例-3に示したグループの境界にほとんど一致する。ただ、グループ内であるにも関わらず、8-9、9-10、18-19にはGPRの適用が現われている。これら部分は誰も認知しないような部分に潜在的なグルーピングの境界が現われているが、それはどのように扱うべきなのであろうか。
 9-10は簡単に説明可能である。なぜなら、GPR1で10のみをグループとして定義することはないとしているので、9-10、10-11が同時にグループの境界と存在することはできない。10-11では、4分休符によってGPR2aが支配的であり、さらにGPR2bによって10-11間がグループの境界として強調され、結局9-10間におけるGPR3aの適用は除外される。(8-9、18-19間については後述)
 GPR2と3によって示されたこれらの境界(3-4、6-7、10-11、13-14、16-17)は、最も低い階層のグルーピングを導く。しかし、GPR1-3ではより高次なレベルのグルーピングは取り扱っていないため、より大きなレヴェルでのグルーピング解析にはさらに次のルールが必要となってくる。

●GPRの大きなレヴェルでのルール
4.(Intensification):GPR2、3で示される効果が比較的明白なところは大きなレヴェルにお  いてもグループの境界がそこで位置づけられる可能性が高い。
5.(Symmetry):グループの分割が長さの等しい2つの部分からなるようグルーピングするこ とを優先する。
6.(Parallelism):グループ間で並行した部分を形成することができる2つもしくはそれ以上の グルーピングは、並行性のあるグルーピングを行う。

 譜例-4へのGPR4以下の適用を考えてみよう。
 GPR5は2種類の効果を持つ。第一は、高次のレベルの境界としてGPR4によって裏付けられる10-11の境界を強化する。なぜならこれは、楽節を2つの等しい長さに分割するからである。第二は、中間レベルのグループが、それぞれ4分音符2つの長さからなる最初の2つのサブグループと4分音符4つの長さがある3番目のグループの計3つのグループを含んでいる。これにGPR5を適用することで最初の2つのサブグループを一緒にグルーピングし、4分音符4つ分の長さをもつ2つのグループになる。
 また、GPR6も2つの効果をもつ。第一は、楽節真ん中の大きなグルーピングの分割を示す際に、GPR4、5を補強する役目を持っている。第二に、GPR2aによって、8-9、18-19は潜在的なグループの境界になり得るが、GPR6の並行性の要因によって1-3,4-6,7-9の各々がグループとなることによって、これらが潜在的な境界になることを防いでいる。もし、グループの境界が8-9にあるとすれば、2-3,5-6もグループの境界となり、3と6がGPR1に違反して単音によるグループになってしまう。結局、 GPR6によって8-9、18-19はグループの境界にはならならず、譜例-3のようなグルーピング構造が解析される。
3-4.GPRの強さについて
 ある楽曲のグルーピング解析を行う時に、GPRのコンフリクトが生ずることがある。このような場合は、各ルールの優先順位を決定する必要性がある。


譜例-5

 譜例-5のaではGPRの適用が一点に一致しているので問題はない。しかし、b〜dではルールの適用が各々2箇所に見られるが、GPR1で単音へのグルーピングが禁止されているので、どちらかを選択する必要がある。例えば、cではGPR2aと3aのどちらが強いのだろう。結論的に言えば、GPR2aはそれが局所的に適用される場合GPR3aよりも優先される。
 なお、局所的なルールの影響力は以下のような関係にまとめられる。

GPR1>(GPR2a,3b)>GPR2b>(GPR3a,GPR3c,GPR3d) 

 また、一般的に大きなレヴェルのGPRは、局所的なGPRよりも優位であると考えられる。(なお、GPRの知覚的な強さの実験研究をDeli夙eが行っているので[9]、参照されたい。)
 
3.5.グルーピング原則の補足
 グループ構造が交差する構造はGWFRでは禁止されていた。しかし、オーバーラップや省略として許容されるものがある。これらはあるグループの最後の音e1が次のグループの開始音e2と重複する部分で、e1=e2であればオーバーラップに、e1とe2が和声的に同一で後続グループの開始か先行グループの終結ならば省略になる。

4.拍節構造
 拍節構造は以下のルールによって、各レヴェル毎に強拍と弱拍をもつ階層構造に解析される。解析ルールには、拍節構成ルール(Metrical Werll-Fomedness Rules;MWFR)と拍節選好ルール(Metrical Preference Rules;GPR)がある。
4.1 拍節構成ルール(MWFR)
1.全てのアタックポイントはより細かな拍節構造に組織化される。
2.あるレヴェルのすべての拍は、より小さなレヴェルでの一つの拍でもある。
3.各々の拍節的レヴェルで、強拍は2または3拍の間隔を持つ。
4.tactusや大きな拍節レヴェルは、同等な間隔をもつ拍によって構成される。
 譜例-6は以上のルールによってMozartのピアノソナタのk.331の開始部を解析したものである。音符の下の点が各レヴェルの拍を、└─┘が各レヴェルの拍が支配する時間間隔(タイムスパン)を、スラーがグループ構造を示している。なお、八分音符あるいは付点4分音符の単位のきざみは"tactus"と呼ばれる、指揮する拍打数や音楽に合わせて手を打つ単位構造を示す。


譜例-6

4.2 拍節選好ルール(MPR)
1.(parallelism):複数のグループ、またはグループの各部を並行的と解釈できる場合、 並行  的な拍節構造を優先する。
2.(Strong Beat Early):最も強い拍がグループ内で比較的早く現われる拍節の構造を優先す る。
3.(Event):拍点に音符がある場合、強拍であることを優先する。
4.(Stress):強調された拍が強拍であることを優先する。
5.(Length):より長い音長をもつ音が強拍であることを優先する。なお、MPR5は以下のa-f に拡張される。
 a.相対的に長い音
 b.相対的に長く続く一つの音量
 c.相対的に長いスラー
 d.相対的に長い同じアーティキュレーションパターンの繰り返し
 e.タイムスパン還元による相対的に長くつづく一つの音高1 (同一音高音の連続)
 f.タイムスパン還元による相対的に長くつづく一つの和声(同一和音の連続)
6.(Bass):拍節的に安定した低音の優先。同じ和音では、根音バス音が優先され、さらによ り低いバス音が優先される。
7.(Cadence):カデンツでは拍節的に安定した構造を優先し、局所的なGPRの違反は避けな ければならない。
8.(Suspension):掛留音はその解決よりも強拍である拍節構造を優先する。
9.(Time-Span Interaction):タイムスパン還元におけるコンフリクトが最小になるような拍 節解析を優先する。
10.(Binary Regularity):より大きなレヴェルで1つおきの拍が強いことが優先される。

4.3拍節構造の解析例
ここでは、Mozartの第40番交響曲の開始部へのMPRの適用を譜例-7に示す。まず、8分音符レベルでのルールの適用から解説する。開始音と同じ音価の8分音符がある拍が、MPR 3によってマークされる。アクセント記号や強弱記号はなく、MPR 4の適用部はない。MPR5aは4分音符の部分をマークし、MPR 5cはスラーの始まりをマークする。連続した同一音高音の最初の音はMPR5eによってマークされる。最後に、MPR 5fは27での和音変化部に適用される。
 8分音符レベルでのMPRの適用を見ると、ルールが適用された連続した3つの拍に、ルール適用のない1つの拍が続いている4拍パターンがあることが分かる。つまり、この4拍パターンは4拍目にルールの適用がないのでMPR3によって、1拍と3拍に強拍を割り当てることができ、4分音符レベルの解析が可能になる。


譜例-7

 4分音符レベルでは15と31を除くすべての拍に音があり、それらはMPR3によってマークされる。さらに相対的に長い音価である各4分音符がMPR5aによってマークされ、各々のスラーの始まりはMPR5cよってマークされる。11はMPR5aと5cが共に適用される唯一の拍である。次に、2つの4分音符の連続の開始部である11と27にMPR5dが適用され、同一音高が次の拍まで連続する19、23、27はMPR 5eがマークされ、和音が変化する27にMPR5fがマークされる。
 以上のルール適用に加え、MPR1によって開始部のee q パターンは以後も同じ拍節構造をになるため、4分音符レベルの強拍は1つおきの4分音符分にあることになる。ただ、4分音符レヴェルでのほとんどの音にMPR5aか5cが適用されており、どの拍が強拍か曖昧である。一方、ee q パターンでは、4分音符に強拍があることが一般的である。ここではMPR5aと5cがコンフリクトするが、5aの方が優先される。そうでないなら、演奏時に始めの8分音符を強調し、4分音符を意図的に弱く・短くする必要があるだろう。また、11と27でのMPRの集中、19,23のMPR5aと5eの適用を総合すると、強拍がほとんどMPR5aの適用部にあることが分かり、2分音符レヴェルの拍を抽出することができる。
 2分音符レベルでは、音符がある拍にMPR3が適用され、ルールが適用された連続した3つの拍に、ルール適用のない1つの拍が続いている4拍パターンが連続していることが分かる。このような4拍パターンは8分音符レヴェルでの解析と同様に、MPR3によって、1拍と3拍に強拍を割り当てることができるが、その判断はバス音や和音変化によって強化される。つまり、バス音が3、11、19、27でのMPR3の適用を強め、次に和音の変化によって27にMPR5fが適用され、2分音符レヴェルの最初の3拍がD音であるのでMPR 5eが3に適用される。このような解析によって抽出された3,11,19,27が、全音符レヴェルでの拍となる。
 全音符レベルでは、拍節構造に影響を与えているものは和声構造と低音の安定性である。26までは同じ和音でバス音も根音であるが、より低いバス音をもつ11がMPR6によって強拍となる。また、和音が変化し、より低いバス音をもつ27が強拍となる。結果、11と27が小節を超えた構造(Hyper Measures)で最も強い拍であることが解析できる。
 このように、拍節構造は最小の音符単位から小節を超えた大きなレヴェルに至るまで、階層的に解析される。

4.4MPRの強さとGTTMの特徴
 各MPRの強さに関しては、GTTMでは十分な整理が行われていないが、基本的に「より多くのルールが一致して適用された部分が高次レヴェルでも強い拍になる」と判断できる。また、調性的な要因によるMPR6-10はMPR1-5よりも強い影響を持つと考えられ、そのためMPR-5では5fが最も強い強度を持つとされている。
 グルーピング構造や拍節構造の解析は、これまでの音楽理論でも見られたものであり、GTTMではそれを認知的な視点から詳細な解析ルールを設定し、階層構造に解析したことが特徴であった。一方、GTTMの最も大きな特徴は、Schenkerが提唱した階層的な音楽分析理論を、生成言語理論で使用されるツリー構造へ応用した点であるが、そのために必要となるのが還元という概念である。

5.還元理論について
 例えば、変奏曲では1つのテーマを様々な方法で変形するが、人間はそれらを別々の音楽として聴くのではなく、それぞれが1つのテーマから派生していったものだと認知する。つまり、変形された音楽に共通する抽象的な構造をつくって相互に関連づけているのである。還元(reduction)とは、音楽の表層構造からこのような抽象的な構造を抽出することを意味している。言い替えれば、装飾や変化形が理解できるというのは、構造的に重要な音というものを直感的に理解しているからであり、ある音符が他の音符を装飾していると感じたなら、その音符は他の音符よりも構造的にあまり重要ではないと認識するということである。
 
5.1強い還元仮説
 GTTMでは、還元という概念によって「聞き手は、首尾一貫した構造でもって楽譜の中の全ての音を関連づけようとする。そしてその結果、各音は相対的な重要性という尺度でもって階層化される」という「強い還元仮説」を提唱している。なお、この仮説はSchenkerの分析理論のような、楽譜を段階を追って簡約化することを目的としている。
 譜例-8はJ・S・Bachの "O Haupt Voll Bult und Wunden"のテーマの表層構造から構造的に重要な部分を抽出していく過程を示している。




譜例-8

 譜例-8の還元過程を見ると、元の楽譜が4分音符単位、2分音符単位、小節単位などに簡約化されている。しかし、単純に拍節構造に基づいて簡約化されていない。GTTMがSchenkerの流れをくむ調性音楽の解析理論であるので、還元化には「調性的に安定的な部分を抽出する」という原則がある。ただ、Schenkerの解析は実際の楽譜上の幾つかのレベルを、前景・中景・後景といったレベルにまとめているところに問題があり、さらに、何が何を修飾しているのかが明示されておらず、他の楽譜情報(スラーや音長など)を利用していない。このような課題を解消するために、GTTMでは以下に述べるような条件を加えている。

 a)音は、厳密な階層性を伴って聞かれる。
 b)構造的に重要でない音は、単なる経過音として聞かれるのではなく、周りのより重要   な音との関係を明確にさせる働きを持つ。

 GTTMでは、以上のような点を明確にするために言語学で用いられるツリー構造を利用して、還元の階層的性質を表現する。

6.タイムスパン還元
 タイムスパン還元とは、楽曲を階層的な時間間隔(タイムスパン)に分割し、各タイムスパンを構造的に重要な音に簡約化することである。つまり、各タイムスパンには構造的に重要な音とそうでない音が含まれる。このような各音の構造関係を階層的に表示するのが、タイムスパン還元ツリーである。解析ルールには、タイムスパン還元構成ルール(Time-Span Reduction Werll-Fomedness Rules;TSRWFR)とタイムスパン還元選好ルール(Time-Span Reduction Preference Rules;TSRPR)がある。

6.1.タイムスパン構成ルール(TSRWFR )
 TSRWFRを要約すると、「タイムスパンはそれぞれ内部に最も重要な音(ヘッド)を持ち、厳密な階層構造により再帰的に構成される。つまり、上位レヴェルのタイムスパンにおける構造的に重要な音は、下位レヴェルのタイムスパンでの構造的に最も重要な音でもある。」という内容である。
 各々のタイムスパン長さの決定は基本的にグループ構造と拍節構造の相互作用によって行うが、局所的なレヴェルでは拍節構造が優先し、大局的なレヴェルではグルーピング構造が優先する。また、中間レヴェルでは拍節構造とグルーピング構造が相互に影響する。また、解析結果はタイムスパン還元ツリーとして表記される。
 タイムスパン還元のツリー構造では、枝(branch)が幹(head)の従属部となっており、幹が枝より構造的な音であることを階層的に示している。譜例-9は "O Haupt Voll Bult und Wunden"のテーマのタイムスパン還元ツリーであるが、譜例-8で段階的に還元されたレヴェルに応じた構造をツリー構造によって表記している。



譜例-9

 なお、GTTMでは調性的な構造が開始したり、終結する部分を構造アクセント(Structural Accent)と呼び、タイムスパン構造の最も重要な部分とされる。この概念は、ボトムアップで行う解析を、大きな構造に発展させる働きをもつ。


図-3.

 図-3はMozartのピアノソナタk.331のテーマの1-18小節のタイムスパン還元における構造アクセントの部分を示している。ツリーの下に表記されているb
はグループの開始(beginning)を、cはカデンツ(cadence)を表わし、bとcの後ろに表記された数字は、その開始部やカデンツ(終止)が機能する小節数を表示する。つまり、最初のb18はテーマ全体の18小節を開始する機能を持ち、次のc4は開始部から4小節の終止を表示する。また、最後のc18は18小節のテーマを終止する部分であることを表わす。このような楽曲の大局的な支配関係と、局所的な音の支配関係を図式的に解析・表記するのがタイムスパン還元理論の価値である。しかし、楽譜に表記された各々の音符がどのように、支配ー従属の関係を持つのであろう。
 それを解説するためには、タイムスパン還元における選好ルールが必要となる。

6.2タイムスパン還元選好ルール(TSRPR)
 TSRPRは、以下の・・に分類される2種類のルールがある。なお、各ルールの番号はGTTTMにおけるTSRPRの番号を示す。
・構造的に重要な部分の優先ルール
 1.より強い拍の部分の優先。 
 2.協和部やトニックに関連がある部分の優先。 
 3.旋律の高い音、より低いバス音の優先。
 7.カデンツ進行部の優先。
 8.開始部の優先。
 9.開始部よりも終結部(cadence)の優先。
・タイムスパン構造の特性を示すルール
 4.並行的な部分は、並行したヘッドとなる。
 5.大きなレヴェルの構造では、和声構造と拍節構造の変化が一致する必要がある。
 6.延長的還元におけるより安定的な選択を優先する。2
 なお、ボトムアップに階層的な時間間隔を構築するので、レヴェルが高くなるにしたがって、拍節構造よりも調性を支配する和音構造と声部進行の安定性が還元を引き起こす強い要因になる。

6.3タイムスパン還元の解析例
 Mozartのピアノソナタk.331の最初の四小節(譜例-10)のタイムスパン還元を行う。


譜例-10

 付点8分音符レヴェルまでの還元は拍節と和声構造のコンフリクトがなく解析は譜例-11aのようになる。しかし、符点2分音符レヴェルへの還元は、譜例-11のbかcのどちらになるのか、意見が分かれるところである。


譜例-11

 3小節目のより重要な音は・mの和音であると考えられ、符点2分音符レヴェルへの還元はcよりbが選択される。この判断は、和声リズムとバス音の進行に基づくが、bとcの差異を以下に解説する。
 bでは全ての小節で和音が変化しているが、cでは2-3小節の和音構造は・hであり、4小節目で・に達する。譜例-10が示すように、この部分は2小節ごとに強拍を持っているので、cでは和声リズムと拍節構造がシンコペーションを起こしてしまっている。また、MPR5fの「タイムスパン還元の適切なレヴェルでの相対的に長くつづく一つの和声の開始部に強拍が優先される」というルールを適用すると、cは2小節目が最も強い拍となってしまい、拍節構造自体がコンフリクトを生じる。しかし、bではそのようなコンフリクトは生じない。なぜなら、和音が各小節ごとに変化し、拍節的に安定しているからである。さらにバス音の進行がbでは順次進行であり、2小節レヴェルおよび4小節レヴェルでの還元を考える際にcよりも安定している。
 タイムスパン還元では、このような手続きを繰り返すことによって、音楽の表層を深層構造まで還元していく。この過程を図式化したものが、タイムスパン還元ツリーであり、譜例-12はk.331のタイムスパン還元ツリー構造を示す。なお、枝に○を付けた部分は、調性的な終止構造であるカデンツを示す。


譜例-12

 GTTMでは音楽構造をさらに大規模な視点から認知的に解析するシステムである、延長的還元理論を提唱している。以下にその概要を解説する。

7.延長的還元
 GTTMでは、人間が音楽を聴取する基本的な構造を「音楽聴取における緊張ー弛緩の認知構造」とし、その解析手法を延長的還元(prolongational Reduction)と呼んでいる。延長(prolongation)とは、ある音がグループやタイムスパンの境界を超えて引き伸ばされたように認知することを意味している。
 延長的還元理論は楽曲を大局的な視点から心理学的に構造化するもので、演奏家などにとっては有効な手法である。その価値はSchenkerの分析では削除されていた非和声音など、楽曲に含まれる全ての音の関係性を調性的な視点から、解析・表示できることである。また、フレーズ構造について、これまでの音楽理論では形式化できなかったが、緊張ー弛緩の構造という視点によって「規範的なフレーズ構造」を初めて形式化した。解析ルールには、延長的還元構成ルール(Prolongational Reduction Werll-Fomedness Rules;PRWFR)と延長的還元選好ルール(Prolongational Reduction Preference Rules;PRPR)がある。ただ、解析方法がトップダウンで行われるために、コンピュータで扱うには難しさがある。よって、本節ではその概要を解説するに止める。

7.1.緊張と弛緩の解析原理
 同一音反復は特に緊張感をもたらさない。ただ最初のC音が延長されたように聞かれる。しかし、譜例-13のように2つの同一音の間に別の音が挿入されれば、緊張感が生成され、また弛緩感が生成される(tはtensingを、rはrelaxingを表わす)。


 譜例-13 

7.2.緊張ー弛緩の表記法
 緊張と弛緩はツリー構造によって表記される。緊張していく進行は右枝によって表され、弛緩していく進行は左枝となる。つまり、幹にあたる部分の音がより安定している。また、ツリー構造は内包する音の協和度によって下の3種類に分類されている。

1.進行:(異なった和声への進行)
2.弱延長:(和音は同じであるが、どちらかが協和度の少ない形態への進行)
3.強延長:(旋律・和音・バス音が同一の進行)

7.3.延長的還元解析によるツリー構造と第二次楽譜
 譜例-14は "O Haupt Voll Bult und Wunden"のテーマの延長的還元ツリーと延長的還元によって簡約化された第二次楽譜である。ツリー構造の枝に、強延長は○を、弱延長は●をトップダウンにつけ、異なった和音への進行は印をつけない。このような表記によって大きなレヴェルでの調性的な緊張ー弛緩の構造を明らかにできる。


譜例-14

 さらに、還元された構造の表記に応用される。まず、強延長を点線のスラーで、弱延長と進行を実線のスラーで結び、直接結合しない枝はスラーで結ばない。大きな構造の開始部とカデンツ部は全音符で表示する。すると、第二次楽譜(secondary notation;譜例-14の下の楽譜)と呼ばれる、延長的還元構造が表記される。
 第二次楽譜はツリー図よりも声部進行を明示し、延長的なグルーピング構造もわかりやすいが、弱延長と進行の区別ができない。また、支配ー従属関係がわかりやすいが、緊張ー弛緩の構造は明らかにできない。また第二次楽譜は一見SchenkerのUrsatzに似ているが、表現する内容は異なっている。それはUrsatzよりも広い範囲に適用でき、音楽的に完全なパターンであるとされる「規範的な延長的構造(フレーズ構造)」を表わしていることである。

7.4.規範的なフレーズ構造
 GTTMでは、緊張と弛緩の観点からフレーズ構造を以下のように定義している。フレーズとは「一般に、比較的穏やかに開始し、緊張部へ向かって進行し、やがて終止部で解決的に弛緩していく構造」を持つ。つまり、フレーズとして優先されるものとしての原則は、すくなくとも一つの重要な右枝進行(一つの開始および緊張の増加)と、二重に埋め込まれた左枝進行(準備されたカデンツ、弛緩)を含むものであり、これが完全なフレーズ構造の基本形式である(図-4)。


図-4

 トニック(T1)によって開始され、いくつかの内的な緊張を経てドミナント(D1)あるいはトニック(T2)にたどり着く。多くの場合、D1は半終止、T2は後続部の開始部となる。その後、終止準備 のサブドミナント(S)を持つドミナントートニック進行によって弛緩する。つまり、二重弛緩構造の開始部(S)において、音楽の緊張と弛緩の境界(構造的転換点)がある。このように延長的還元では、グループやタイムスパンの内部構造を明らかにすることができる。

7.5.保科の演奏解釈理論について
 Meyerは「聞き手がグループ(音楽的なまとまり)として認知するには、そのグループの内部に、最も強く印象づけられる部分が必要である」ことを原則づけているが[1]、延長的還元という手法によって、楽曲の持つ様々なレヴェルでの構造的転換点を解析することができる。
 日本では兵庫教育大の保科が作曲者・演奏者としての経験を元に,音楽構造が生成する音楽的なエネルギー感覚に基づいた、階層的なグルーピング解析理論を提唱している[12][33]。保科は「音楽的な緊張ー弛緩」の構造を持ったものをグループとしゲシュタルト的な知覚体制化ルールと様式的な認知ルールによって分析し,グループ内部の最も緊張度の高い部分(構造転換点)を重心として明示化している。さらに複数のグループ集合をフレーズとするが,それはグループ間の緊張ー弛緩の分析によるものである。譜例-15の上部の括弧はグループ構造を矢印は重心の部位を示し、下部の括弧はフレーズ構造を矢印はその重心を示している。


譜例-15

 保科の理論では階層的なグループ構造と内部の構造転換点を重心として明示することによって、演奏者が直感的に楽曲構造を把握することができる。竹内は認知的な視点による演奏解釈研究を行ったが[18][26]、保科の言う重心は延長的還元によるフレーズ構造と拍節認知構造を相互作用させることによって決定できると考えている。これは演奏者の直感的な操作を客観的にルール化したものであり、演奏ルールへの適用が可能である。

8.GTTMの応用研究
 GTTMは詳細な解析ルールを持ち、階層的に各音符レヴェルにまで解析が行える。このような特徴があるため、コンピュータ音楽や音楽心理学などの領域で非常に多くの応用研究がある。以下にGTTMを応用したいくつかの研究を紹介する。

8.1.コンピュータ音楽領域
 自動演奏の領域では、Todd[5],Widmer[16]のタイムスパン構造に対応した演奏表現の研究がある。また、延長的還元理論を応用したものには、片寄[26],竹内[31],青野[28],上符[32]などの研究がある。構造解析モデルの領域ではHalsz[21]やStammen[24]らがグルーピングやタイムスパン還元の自動解析の研究を行っている。また、有吉は音楽構造の表記モデルの研究を行い[29]、Largeはビートトラッキングモデルへの応用を研究した[19]。

8.2.音楽知覚認知領域
 音楽知覚認知の領域では、Palmerらによるタイムスパン還元構造と拍節構造に基づくフレーズ構造の知覚研究[8],Deli夙eのグルーピング選好ルールの知覚実験研究[9],竹内のグルーピング構造に対応した演奏ルールについての実験研究[27]、Dibbenの無調性音楽の階層構造の研究[20]などがある。

8.3.音楽構造の分析理論領域
 GTTMの解析ルールの研究には、Bothelhoのグルーピング解析に追加すべき調性的グルーピングルールの研究[22],Londonのグルーピング解析への弱延長仮説適用の研究[23]などがある。また、認知的な音楽解析理論の比較研究には水戸[11],平賀[25],村尾[30]らのものがある。

8.4.GTTMの応用に関する課題
 上記に紹介したもの以外にも、GTTMを応用した研究は多くある。また、現在でも音楽構造に関連した様々な研究において、GTTMは参考文献に揚げられている。しかし、GTTMはコンピュータ上での処理を目的に書かれたものではない。これについてGTTMでは、計算機への応用の難しさを以下のように述べている。
1.類似の問題は音楽の理論では特定することが難しい。より明確な心理学上の検討が必要である。
2.ルールが明確な解析を生みだすことができない理由は、2つの選好ルールが競合したときの結果が明確に判断できないことである。
3.ルール適用を数値で表し複雑な計算で表現することは、音楽的・心理学的な問題よりも細部にこだわることになる。
 つまり、その実現には、音楽的心理学的な課題についての今後の研究が必要であり、実際の解析に際しては音楽的な文脈を理解した上での各ルールの適用が必要であると考えられる。また、延長的還元ようなトップダウンで認知される音楽構造を、どのように組織化するかという課題がある。

9.音楽の構造解析理論の課題
 GTTMは人間の音楽認知構造を反映しているが、
対象としているのが調性音楽であるので、基本的にShenkerと同じように従来からの機能和声理論を応用して解析を行っている。そのため、例えばアポジャツーラは強拍にあるにも関わらず、後続する弱拍の解決音がより構造的に重要な部分と解析される。(拍節構造と和声構造のシンコペーションであるが、一般的にアポジャツーラは演奏アクセントによって強調される。)
 一方、Meyerは音楽の持つ構造的特徴を「その楽曲にある独自な構造(ideo structure)」にあるとし、Narmourは「暗意-実現のプロセスモデル」を原理とするより認知的なクロージャー構造の解析を提唱している。
 つまり、音楽構造といった概念は理論によって異なった内容を持つ可能性があることを理解しておくべきである。

10.最後に
 GTTMが出版されて、15年が経過しようとしている。GTTMで論じられ課題となった内容は、現在でもホットなものであるが、その全てが明確に検証された訳ではない。例えばGTTMにおけるツリー構造について、MeyerとRosnerは「音楽認知構造と言語認知構造は異なるので、GTTMのツリー構造は音楽認知的な視点を欠いている」と述べている[6]。このようなGTTMの課題を探すことは、簡単であるかもしれない。しかし、楽曲構造の解析理論としては、GTTMのように精緻で詳細な解説を行っているものは、他にないのも事実である。
 また、解析された音楽構造を演奏表現に応用する場合、構造と演奏変数の対応をどうするのか?という課題がある。GTTMで解析される音楽構造的に重要な音が、演奏時に強調されるとはかぎらない。例えば、上述したアポッジャツーラでは、構造的に重要でないとされる強拍の不協和音が、一般的に演奏アクセントによって強調される。このような課題に関しては、5章の演奏の表情づけに関する節で論じられるであろう。

謝辞:GTTMから図表や解析譜例の引用を快く引き受けて頂いた、R.Jackendoff教授・F.Lerdahl教授およびMIT Press社に感謝いたします。

参考文献
[1] Cooper and Meyer : The Rhythmic Structure of Music. University of Chicago Press (1960)
[2]J.Tenny & L.Plansky:Temporal Gestalt Perception in Music.Journal of Music Theory,24,pp.205-241(1980)
[3] マティス・ルュシィ:近代音楽におけるアナクルーズ,板野 平訳,全音楽譜出版社(1980)
[4] Lerdahl and Jackendoff : A Generative Theory of Tonal Music. MIT Press(1983)
[5] N. Todd : A model of Expressive Timing in Tonal Music, Music Perception,pp.33-58 (1985)
[6]B.Rosner & L.B.Meyer:The perceptual roles of melodic process,contour and form,Music Perception,
pp.1-39 (1986)
[7] J. Lester : The Rhythms of Tonal Music. Southern Illinois University Press(1986)
[8] C.Palmer&C.Krumhansl : Pitch and temporal contributions to musical phrase perception:Effects of harmony,performance timing,and familiarity,Perception & Psychophysics,pp.505-518 (1987)
[9] Deli夙e : Grouping Condition in Listening to Music: An Approach to Lerdahl and Jackendoff's Grouping Preference Rules, Music Perception,pp.325-360 (1987)
[10]村尾忠廣:音楽と認知,東京大学出版会(1987)
[11]水戸博道:音楽の理解における基礎的能力の探究、pp.345-352,新潟大学教育学部紀要第31巻第2号(1989)
[12] 保科 洋 : 音楽における表現の基礎について,全日本学校音楽研究会「教材の研究と指導」(1989)
[13]N.Cook:Music,Imagination,and Culture, Clarendon Press;Oxford(1990)
[14] E. Narmour : The analysis and Cognition of Basic Melodic Structure.University of Chicago Press (1990)
[15] 村尾忠廣: クロージャーの客観的測定に基づく構造音の抽出について, 音情研夏のシンポジウム予稿集, pp. 67-72 (1992)
[16] G. Widmer : Understanding and Learning Musical Expression, Proc. ICMC,pp.268-275 (1993)
[17] R.Rowe:Interactive Music Systems Machine Listening and Composing. MIT Press(1993)
[18] 竹内好宏 : 認知的視点による演奏解釈の研究,兵庫教育大学修論 (1994)
[19]E.W.Large:The Resonance Dynamics of beat Tracking and Meter Perception,pp.90-91,proc.ICMC(1994)
[20]N.Dibben:The Cognitive Reality of Hierarchic Structure in Tonal and Atonal Music,Music Perception,pp.1-25 (1994)
[21] P.Halsz: Computer Simulation of Time-Span Reduction,pp.267-268,proc.ICMPC(1994)
[22] M.Bothelho: Tonal Grouping:An Addendum to Lerdahl and Jackendoff's "a Generative Theory of Tonal Music",pp.265-266,proc.ICMPC(1994)
[23] J.London: The "Strong Reduction Hypothesis" of GTTM ,pp.261-262,proc.ICMPC(1994)
[24] D.R.Stammen & B.pennycook:Real-time segmentation of music using an adaptation of Lerdahl and Jackendoff's Grouping Principles,pp.269-270
,proc.ICMPC(1994)
[25]平賀: 音楽認知研究の諸問題,情処研報94-MUS-6.pp.15-22(1994)
[26] 片寄,竹内 : 演奏解釈の音楽理論とその応用について,情処研報94-MUS-7.pp.15-22(1994)
[27] 竹内好宏 : グループ構造を明示する演奏変数の研究.音楽知覚認知研究会第14回例会資料.pp.23-28(1994)
[28] 青野他: 重回帰分析による演奏ルールの抽出,情処研報95-MUS-11 (1995):
[29]Y.Ariyoshi:Hyperscore:A Design of a Hypertext model for Musical Expression and Structure,Journal of New Music Research,pp.130-147.(1995)
[30] 村尾忠廣: 作品構造から構造認知の音楽理論へ, 音楽知覚認知研究第1巻, pp. 3-16(1995)
[31] 竹内好宏 : 演奏表情を知覚させる演奏変数の研究.音楽知覚認知学会第8回例会資料.pp.7-12(1996)
[32] 上符他:演奏ルールの抽出について,情処研報96-MUS-115(1996)
[33] 保科 洋:「生きた音楽表現へのアプローチ」,音楽之友社(1998)(予稿)

1 タイムスパン還元に関しては、6.タイムスパン還元を参照.

2 延長的還元に関しては7.延長的還元を参照.


   トップページへ戻る

 GTTM 追加---12章----


「心理学と言語学への接近」


 1章で我々が述べたように、我々の音楽理論の適切さの基準の一つは普遍的な心理学的課題に光を注ぐことができたことである。

 ナイサーは生成言語学と1920-1940年のゲシュタルト心理学の精神的類時性を指摘した。我々の理論も言語学と同様に普遍的なゴールを目指している。(Neisser.1967.Cognitive Psychology.pp.245-248)
例えば、ほとんど無意識な人間の知識の領域にある説明を加える、ある階級の直感の性格の解説を行う、この直感を先天的なものと後天的なものに区分することなど。

 しかし、我々の音楽理論はナイサーによる認知理論とは異なっている。この章の一つの要点は、単なる普遍的言語学とゲシュタルト心理学との間の精神的な結合以上のものを作るために、音楽理論を使うということである。1章では3章で示した、音楽的グルーピングのルールと視覚形式知覚における関連づけられるプロセスの類似性を検討する。これは、現代心理学の観点や現在の音楽理論においてゲシュタルト理論がもついくつかの欠点がどのように克服される可能性があるかという話題に導く。最後に、我々の音楽理論に類似した視覚における最近の普遍形式(general form)をサーベイする。

  1章ですこし述べたように、言語理論と音楽理論の大きな差異は、音楽理論におけるプリファレンスルールの存在である。そして、その1つのルールの典型は生成変形文法(generative-transformational grammar)とは相い入れないのである。
 2章では言語理論における現在のいくつかの課題を提示する。そこではプリファレンスルールによる形式主義(形態心理学)は洞察的解説を示しているように見える。そこでは言語学と音楽理論はこの点においては違った風に想像されたより、異なっていないということを提示している。
 3章では、音楽構造と言語構造との強い類似性について述べる。音声学(音韻論)における最近の研究は、タイムスパン還元に似ている階層的構造の点から言語の音響構造の分析を目的としている。我々は、この音声学的構造とタイムスパン還元は形式的に非常に関連があることを示すであろ。そして、それは類似した規則システムの結果であるが、ルールを操る(扱う、処理する)統一体は全く異なっている。


12.1ゲシュタルト理論と視覚形態(様式、形状)の知覚


3.2および3.4で指摘した視覚的と聴覚的なグルーピング両者の間の類似性を思い出せ。
そのような類似性の存在はWertheimerによって観察された。;kohlerは二つの領域の(変数;domain)における類似した心理学的組織の結果であると推測する。Lashleyはまた、本質的に類似した心理的な表現は空間的に、かつ時間的に連続した記憶に奉仕すると主張する。しかし、たくさんの高度に暗示的な証拠にもかかわらず、時間的組織の構造について言うときこれらの心理学者の誰もが非常に体型的というわけではない。時間的組織のひとつのタイプとしての形式理論を発達させたが、我々は類似性についてさらに詳しく調べるべき時にいるのである。
1923年に、Wertheimerの示した例は、3.2における視覚と音楽のグルーピングの図表と正確に類似している。そして、3つの一般的な特性がこのような判断に関係していることを暗示している。(例:3.6-3.11):より近い近接とより強い類似性はグルーピングの判断を強め、原則がコンフリクトした場合は判断が不明確になり、ある状況では1つの原則がほかのものを無効にする。これらは我々が用いた優先ルール形式主義のはっきりとした特性である。他の原則のかなりの数のある類似した観察が、形と地の対比、3D、Koffkaの討論に見られる。WertheimerとKoffkaは、対称性や規則的なカーブに添う線の連属性、スペースを囲むパターンの能力、そして見る人の直感のなどの、機能の影響を証明した。3.2に我々が適用したものは、一般的に非公式に彼等が主張したルールであるが、3.3のようなより公式なルールは見られない。


WertheimerとKoffkaはゲシュタルト心理学の基本的な主張を論証した。

 知覚はほかの心理的活動と同様に、組織化の動的過程であり、知覚領域の全ての要素は他の独自な部分の組織化に巻き込まれてしまう。この主張の2つの実際の様相を指摘し、証明することは苦しいことである。最初に、知覚は環境でおいて存在する単なる生産物でだけではない。普通無意識に見る人はある活動を行う。かれが感じたことの決定を区分(分配)すること。2つめに、知覚したものである「領域の総合性」は、各々その部分の個別の認識の蓄積として少しずつ増加るももではない。(全体は部分の総和以上のものである。=ゲシュタルト理論概念。補足:竹内)


 知覚のゲシュタルト的説明の基礎を形成する「一般的根本原則」はウエルトハイマーによって形式化された「プレグナンツの法則」である。コフカはそれについて以下のように短い解説をしている(1935.p.110)


 心理学的機能は常に、一般的に認められる状況として、「良い」とされるものであろう。 この記述において「良い」という概念規定はない。それは規則性、対称性、単純性などの特 質をもつものである。

言い替えれば、コフカが示した視覚知覚の様々な原則は、「良い」組織化の観念の解説であるといえる。

 to be continued