2002.11.09

東図書館で借りた雑誌「言語」６月号「コミュミケーション出来ない脳」と「科学」９月号「ヒト知性の脳科学はどこまで可能か？」を読んだ。後者は「科学」2000.05～2001.12に連載された「ヒト知性の計算神経科学」という連載への反響によって企画された討論会の記録である。連載は川人光男、銅谷賢治、春野雅彦で、知性の働きはモジュール化されているように見えるが、共通の神経科学的メカニズムを持っているのではないかということで、特に言語機能が生得的に特有の機能ユニットとして存在しているという生成文法の言語学に対して挑発的な内容であった。大脳皮質、大脳基底核、小脳はそれぞれ構造が異なり働き方も異なるが、それぞれの場所において知性のさまざまな機能は共通のメカニズムを使っているということである。サルとヒトとはこういう意味においては連続的に捉える。以下面白い部分だけ記録しておく。

ある行動が状態のどういう変化につながるかを予測する「内部モデル」、ある状態や行動が将来どれくらいの報酬につながるかと予測する「価値関数」、感覚入力の冗長性や欠落に対処する「状態表現」、という基本的な機能が想定される。これらの機能は小脳では「教師あり学習」、大脳基底核では「強化学習」、大脳皮質では「教師なし学習」の原理で獲得されると考える。これらの機能と学習のメカニズムは具体的な知性の働き（運動制御と認知、コミュニケーション、言語）で共通していると考える。

具体的にいろいろな例題を計算機上で解く過程において、付加的に重要な構造が浮かび上がって来る。例としてロボットが立ち上がる動作を学習させるには自分の身体の動作や状態をモニターしながら、結果としてどれくらい頭が上にあるか、とか転んだとかの報酬関数を最大にするように立ち上がりかたを学習していく。しかしここで学習を速くするために重要となったのが、階層性であった。すなわち立ち上がる途中での離散的な状態を目標として設定していくという上位階層と、その目標姿勢に達するように修正していくという下位階層である。戦略の設定と戦術と言ってもよいし、神経回路の分業と言ってもよいし、モジュール化と言ってもよい。このような分業が出来てくるハードウェアーシステムとしてモザイク構造が考えられている。すなわち同じように立ち上がる動作の学習ではあるが、各モザイクが独立して予測し、制御しようとする。これらの競合は結果によって決まるので、試行を繰り返す内に予測が容易な（線形な）行動部分がそれぞれのモザイクで分業されて、全体の行動は各モザイクをつないでいくことによって達成されるようになる。つまり自動化し易い各部分を各モザイクが分業して、それらの全体を束ねるという学習のやり方が自然に発生する。これが一連の運動の記述と実行の為の離散的な内部表現であり、記号的な表現につながるものと考えられる。連続した音声から音素を聞き分けるというプロセスも同様な離散化のメカニズムが働くと思われる。脳の各部分の分業構造は実は見かけのものであって、一連の感覚運動の中にモジュール構造を見出して戦略を設定するのが大脳であり、個々のモジュールの学習に特化しているのが小脳であり、学習を定着させるための強化を司令するのが大脳基底核である、という分業なのではないか？そういう意味で、学習とはいっても、学習の仕方自身も学習されねばならず、そのメタ学習機能に重要な役割を果たしているのが、脳幹から投射される神経制御物質である。セロトニンは評価の時間スケールを、ノルアドレナリンは探索のランダムさを、アセチルコリンは学習速度を制御していると考える。（銅谷）

言語機能が本当にこのような神経ネットワークモデルで学習できるのか？その最初の成功例がエルマン・ネットである。これは明示的な教師信号による誤り訂正機構なしで文法を学習する。通常のニューラルネットに対して、内部の状態を保存しておき、それを入力信号として使うことが出来るという構造を持っているために、単に正しい文や単語を提示していくだけで、時系列的な「予測」の学習が効率的に行われる。埋め込み文の処理、時制の一致、性や数の一致、長距離依存性などが学習出来る。

サルが言語を使えるかという問題の設定に対して、一生懸命言語を教えて使うようにさせるという研究の意味をよく考えてみなくてはならない。心理学では刺激等価性という実験がよく行われる。これはＡ→Ｂ、Ｂ→Ｃを学習させることによって、Ａ→Ｃという推移律、Ｂ→ＡやＣ→Ｂという対称律が発生するか、という実験である。推移率はサルでも出来るが、対称律は非常に困難である。この点ではセキセイインコは対称律を発生させるので、ヒトに近い。言語で言うと物理的語（音声や記号）と意味の対応が可逆かどうかということである。チンパンジーに絵カードを示してその意味を教えるのと、チンパンジーが意味を伝える為に絵カードを使うのは別々に教える必要があるということである。この状況はヒトにとってはたいへん理解し難いことである。「奇跡の人」のヘレン・ケラーが水の冷たい感覚を受けるたびに手にWATERと書かれていて、意味から言葉への繋がりが出来ていたとしても、それでもWATERがあの冷たい水の感覚のことである、と気づくにはずいぶん時間がかかった。これは単に神経回路網の物理的複雑さから来るものではなく、どれくらい大きな社会を形成しているか、ということから来る適応現象なのではないか？セキセイインコは大きな社会を作っていて視覚や聴覚など複数の感覚で個体識別をしていて、個体間関係も複雑であるから、個体の特徴を統合的に捉えることが必要である。こういう適応が言語の発生の基盤に前適応として必要である。話言葉に限って言えば、まず発声器官を制御することが必須であるが、それに加えて文法の発生に対する前適応としては、コミューニケーションの為の発声とは別に、単に複雑性を誇示するような発声（求愛）によって発語そのものの規則性の確立があるのではないか？つまり言語とコミュニケーションとはとりあえず別の機能と考えた方が良くて、そういう意味で言語を持つのはヒトと鳥である（鯨も）ということになる。（岡の谷）

「科学」に連載された川人、銅谷、春野の「ヒト知性の計算神経科学」を読んだ。基本的な考えは順モデル（予測器）と逆モデル（制御器）を対にして、それに責任信号予測器を付随させたものである。それぞれが神経回路であるが、順モデルは筋肉系への制御信号のコピーを受け取って、その制御信号によって感覚で得られる外界と自分の関係がどうなるかを予測する。予測された結果は実際に得られた変化と比較されて、その差が小さければその予測が強化され、差が大きければ失われる、という「教師付き学習」を行う。また、このような予測器は並列に多数動作していて、それぞれの予測の正しさが比較されて差が小さいものほど大きくなるような「責任信号」が作られる。制御器は予測器の逆である。外界と自分との関係を変えるという運動指令を受けとってその為の制御信号を出すが、これは責任信号の重みが付けられて他の予測器からの信号と足し合わされて実際の制御信号となる。これも自分の出した制御信号との差によって学習に使われるが、その学習の度合いは責任信号で重み付けられる。（制御器の学習機構としては、それよりも制御結果の評価結果（快不快）による「強化学習」と見た方が良いようである。）制御器の精度が上がれば予測器の予測精度が上がり、逆もまた成立する。この非線型なプロセスによって、制御器と予測器は対を成して一つの環境での一つの動作に特化されていく。こうして出来た一つ一つのユニットが集まって運動の全体を作り上げるのであるが、結局のところ責任信号の分配状況によってその階層の運動が表現されることになる。そこで一つ上の階層ではこの責任信号を予測する予測器と運動指令を出す制御器の対がある。感覚器から入ってきて階層的に整理された外界の情報の変化によって下の階層のどのユニットを働かせるべきかを逐次司令していくという制御器と、その指令がどのような下の階層の責任信号分配状況を生み出すかを予測する予測器の対である。こうして何重にも階層が積み重なって実際の運動が行われることになる。下層のユニットは主として小脳に出来上がる。小脳は機構的にも教師付き学習が行われる様になっている。プルキンエ細胞への多数の入力が小脳核へ伝えられる確率は一本の登上繊維によって強化されたり、減衰されたりする。この登上繊維が学習に必要な誤差信号を運んで来る。予測器の場合は予測結果と実際の感覚からの結果の差であるが、制御器の場合は運動指令の空間に逆写像した誤差信号を伝えている。これは判りにくいが、上記の「強化学習」や大脳における空間と自己身体のモデルを使った運動指令と運動軌跡の関係から作られていると考えられる。

小脳が「教師付き」（誤差信号による）学習であるのに対して、大脳基底核には行動結果や外界の変化からその先の「快不快」を知る神経細胞（線状体）がある。大脳皮質から信号を受け取って現在の状態を知りその評価予測を行う。その結果を使ってもっとも評価の高い行動出力が視床を介して大脳に返される。実際に得られた報酬結果と線状体での評価の時間変化から黒質がtemporal differencce信号（ドーパミン）を線状体に送り、学習させる。

大脳皮質そのものは外から来る信号によって学習が直接制御される、という形態があまり見られない。むしろ個々の神経細胞が入力－出力を繰り返す事によってその結合が強化されていく。双方向に繋がりあったネットワークが結果として作り出すものは特定の目的に沿った運動指令や予測ではなく、入力情報からその特徴を抽出して貯えるという働きである。感覚刺激が知覚として整理される。また身体感覚が空間と自己との関係として整理される。また大脳基底核や大脳内の知覚刺激を行動軌跡として纏め上げ、これを小脳のユニットに送る。大脳のそのような働きを強化する信号として知られているのは前頭前野にあると言われる一時記憶がドーパミンで強化される、という事である。意識や夢や記憶といった働きがどうやって生じるのか？そのための必要条件は多く知られてきたが、まだそれだけで本質を理解した気にはなれない。中田力の仮説をもう一度検討してみる必要がある。

コミュニケーションのメカニズムは「感覚－運動連鎖」として発達した上記の予測器－制御器－責任信号生成器－報酬評価器－自由連合の複雑に階層化されネットワーク化されたシステムを使って同じように行われる。コミュニケーションとはつまるところ発信者の内部状態から運動が起こり、それを知覚した他者が発信者の内部状態を推定するプロセスである。更には受信者が推定された内部状態から運動を起こし、それが発信者にとっての制御対象でもある。予測－制御対象はヒトであるから確かに難しいが基本的には同じことである。受信者は知覚した運動から内部状態を推定する逆モデルを持っていて絶えず学習を続けている。推定された内部状態から発信者の運動を予測する順モデルも持っていて、これも学習されている。このシステムは多数あって、それらに責任信号を割り当てることで特定の順－逆モデルの対が特定の受信者の運動ユニットに対応するようになる。

コミュニケーションの始まりは見真似と考えられる。発信者の内部状態を推定しそれから自らの運動指令を作り出せば良い。ここから言語のような抽象化された手段に至るには長い間の社会的な淘汰があったと推定される。ところで、コミュニケーションという足場を括弧に入れて社会的な約束事の構造を捉えるという立場が構造主義の言語学である。ヒトは音の連鎖から音素を、音節を、単語を切り取る事が出来るが、それは音の連鎖がそれらを持っているからではない。受け取った感覚信号から訓練された予測器で予測し、とりあえずそれを候補として持ちながら場合によっては修正していく。また平行して切り取った単語から制御器で発音の模擬を行いながら確認していく。一人一人の頭の中に出来ているこのような仕組みが言語をその都度作り出している。そして共同行為や合図やといった運動によって確認して学習を強化している。したがって共時的な意味での言語に社会構造が刻印されているのは確かである。しかしそれに執着するという事は言語を社会構造を研究する手段としているに過ぎない。勿論言語であるが故の構造もいろいろな言語の共通点として見つかるであろう。それは蜂の巣の奇麗な形を研究するようなものである。場合によっては蜂の動きも判るだろうし、生活も判るかもしれない。しかし蜂そのものの研究ではない。勿論言語の起源がコミュニケーションである、というのは一面的な見方であり、その前に利用されるべき手段としてある種の言語行為が存在していて、それは大脳皮質の遊びというべきものであろう。言語の構造的特徴がいずれに由来するのか、という問いには多分確定的な答えは無い。

＜一つ前へ＞＜目次＞