視覚の誘導場の工学的応用

視知覚の場による顔表情認知モデルの検討

●　まえがき

　さまざまな顔表情を，喜びや怒りなど複数のカテゴリーで捉える考え方と，快―不快など情動や覚醒―睡眠など覚醒度などの連続量で次元的に捉える考え方が対立している¹⁾．しかし，顔表情の連続的な情動的評価であっても，喜び― 恐れのカテゴリー境界が認められる²⁾など，次元とカテゴリーは必ずしも対立していない場合が報告されている．顔表情は，カテゴリー，次元の双方の側面をもっていると考えられるが，両面から顔表情を説明する認知モデルは余り検討されていない³⁾．
　さて，視知覚の場で顔表情が説明できることが示唆されている⁴⁾．視知覚の場は，図形の周りに静電場のような場を仮定，視知覚現象を説明する心理学的概念である⁴⁾． 図 1下段は視知覚の場の例である．図 1上段の図形の周辺に等高線状に分布しているのが視知覚の場の等ポテンシャル線で，中央から外に行くほど場は弱くなり飽和値に達する．
　横瀬は場の分布が，文字の類似性，錯視の解釈など我々の物の見方，感じ方と関連すると考え，図 1の線画による顔表情の視知覚の場の分布が表情により異なることを指摘，また，表情を強調する歌舞伎役者の隈取が場の分布に似ていることから，場が表情の強さと関係があると推察した⁴⁾．

図1　顔表情図形と視知覚の場

　カッツは，図2(b) の上段の口が省略されると顔表情が壊れてしまうが，図2(c) の上段のように，顔輪郭の一部が省略されても顔表情の受ける影響が少ないのは，顔の部分ではなく，顔全体で捉えているというゲシタルト性で説明している⁵⁾．視知覚の場は，元々横瀬がゲシタルト性の具体的な理論として提案した概念である⁴⁾．図2 の下段に視知覚の場を示す．図2(b) は口が省略されているため，口周りの場の分布は図2(a) と異なるが，顎の輪郭がない図2(c) は，眼や鼻付近の場の分布は図2(a) に類似しており，図2(a)と同じ表情に見えると考えられる．

図2　一部欠損した顔表情と視知覚の場

　視知覚の場は，文字，図形の印象の強さやレイアウトの良さなど，感性を定量評価できることが報告されている⁶⁾．以上から，視知覚の場で，顔表情の違いを定量的に説明できると考えられる．本研究は，まず，図 1の分析から，視知覚の場による顔表情認知モデルを提案，他の顔表情が説明できるか検証，モデルの妥当性を考察する．

●　視知覚の場による顔表情認知モデル

　文字，図形のレイアウトが美しい，バランスが良いなどの状態とは，対象パターンの視知覚の場の分布がパターン全体で平均化されている状態が良く，場の分布形状が，凹凸が少ない円や楕円であり，その記述には視知覚の場の等ポテンシャル線の複雑度が有効である^{6) 7)}．複雑度は，ある等ポテンシャル面の閉曲線を構成する点の個数（周囲長）の二乗を，閉曲線の内側に存在する画素総数（面積）で割ったもので，円に近いと1.0，複雑になるほど大きな値をとる．
　この複雑度が，視知覚の場のポテンシャル値ごとのシグモイド関数である感性評価モデルで，文書のレイアウトの良さが評価ができる可能性が示されている⁸⁾．そこで，顔表情も場のポテンシャル値ごとの関数となっているか， 図 1の場の分布の複雑度の変化を調べた．

　図 1の下段は，上段の線図形による顔表情の視知覚の場を計算した結果である．計算は文献9)の方法による． 図 1の顔表情画像は，64 × 64 ドットの矩形に入るように拡大または縮小させて，64 × 64 ドットの大きさのパターンの領域を含む128 × 128 ドットの範囲で視知覚の場を計算する．複雑度は各等ポテンシャル面ごとに求める．視知覚の場の計測は，場の強さ0.01（視知覚の場の等ポテンシャル面が画像の外枠に接触しない限界）から0.399（文字画素の近傍付近）まで，0.001 ステップで行う．

　図3は，図 1の下段の各顔表情の視知覚の場について，縦軸に場の複雑度，横軸に場のポテンシャル値をとったグラフで，図3「怒り」のグラフは図 1(a)，「普通」のグラフは図 1(b)，「悲しみ」のグラフは図 1(c) である．図3から，各顔表情のグラフはシグモイド関数に類似しており，表情によって，グラフの変化が異なっていることがわかる．
　視知覚の場の分布の複雑度をC，ポテンシャル値をx，a, b, t, p 定数とするとシグモイド関数は次式で表される．

　表1に，図3を上式で近似したパラメータを示す．表1から，「普通」はt が0.081 と大きくグラフの傾きが緩やかだが，「怒り」「悲しみ」はt が0.02 程度と小さくグラフの傾きが急である．このように，顔表情は視知覚の場の分布の複雑度とポテンシャル値のシグモイド関数で表現できると考えられる．

図3　表情別の視知覚の場の複雑度とポテンシャル値

表1　図3のシグモイド関数で近似したパラメータ

●　視知覚の場による顔表情認知モデルの検証

　顔表情が視知覚の場の分布の複雑度とポテンシャル値のシグモイド関数で表現できるか，山田が顔表情の認知実験で使った顔図形¹⁰⁾で検証する．図4に顔図形を示す．これらは，線分で構成された基本的な顔のパーツの位置，傾きを変えてつくった顔感情である．顔写真などの画像は多様な要素が顔認知過程に影響を与えると考えられる¹⁰⁾ ので，影響が少ない簡素な線図形で検証を行った．

　図1と同様に，図4の顔図形の視知覚の場を計算，複雑度を求め，図4の顔表情別の複雑度とポテンシャル値をシグモイド関数で近似したグラフを図5に，図5のシグモイド関数のパラメータを表2に示す．
　図5，表2から，図4の顔表情が視知覚の場の複雑度とポテンシャル値のシグモイド関数で表現できることがわかる．シグモイド関数のパラメータt は0.03 程度の表情が多い．「怒り」「悲しみ」は，パラメータp がそれぞれ 0.199， 0.184 と大きく，ポテンシャル値 0.15 程度以上のグラフの傾きが急である．一方，「普通」「喜び」「驚き」などは，p は 0.15 程度と小さくグラフの傾きは緩やかである．
　今回実験した図1と図4は，基本表情と言われる6つの顔表情である¹⁰⁾．このうち，「怒り」「悲しみ」は，顔表情認知の実験で取り上げられることが多く¹¹⁾，より基本的な表情であると考えられる．

　図3を含め，より基本的な表情と考えられる「怒り」「悲しみ」のシグモイド関数のグラフの傾きが，「普通」や「喜び」「驚き」など，他の基本表情に比べ急である傾向が見られる．パラメータ t または p は，表情の違いに関連していると考えられる．しかし，「普通」「怒り」「悲しみ」のシグモイド関数のパラメータ t，p は，表1と表2では近い値ではない．また，パラメータ a,b も，図1の場合 a が 400 程度以上，b は「普通」が -20 と大きく，図4の場合 a が 300 前後，b はほぼ 0 と，異なっている．a,b は，複雑度の上限と下限を決めるパラメータで，視知覚の場の広がり方で変わる⁸⁾． 図1，図4 共に，64 × 64 ドットの矩形に入るよう元の顔図形の大きさの正規化をしたが，場の広がり方までは充分正規化されていないと考えられる．場の広がり方を正規化をすれば，同じ感情であれば図形が異なってもシグモイド関数が類似すると推測される．

図4　山田の実験の顔表情図形¹⁰⁾

図5　図4の視知覚の場の複雑度とポテンシャル値のシグモイド関数近似

表2 図5のシグモイド関数のパラメータ

●　むすび

　本研究では，視知覚の場が感性を定量評価できることから，顔表情認知モデルを提案，顔表情は視知覚の場の分布の複雑度とポテンシャル値のシグモイド関数で表現できる可能性が示された．そして，シグモイド関数のパラメータ t，p が顔表情の違いに関連していることが示唆された．このように，視知覚の場による顔表情認知モデルは，顔表情というカテゴリーの違いを，シグモイド関数のパラメータの組合せで連続量で捉えることができるので，カテゴリー，次元の双方の側面をもっている認知モデルの１つと考えることができる．
　しかしながら，シグモイド関数のパラメータで，異なる顔図形の顔感情を一意に表現することはできなかった．これは，場の広がり方の正規化を行うことで解決できる可能性があると考えられる．
　今後，いろいろな線図形の顔表情で実験を行い，シグモイド関数のパラメータと顔表情の関連性を詳しく調べる予定である．

参考文献

1）渋井進，繁桝算男：“順応を用いた顔表情処理モデルの検討: 次元説とカテゴリー説に関して”，信学技報，HIP-103，166, pp.45-50(2003)

2） Fujimura,T.,Matsuda,Y.,Katahira,K.,Okada,M.,Okanoya, K.： “Categorical and dimensional perceptions in decoding emotional facial expressions”，Cognition& Emotion, 26, 4, pp.587-601(2012)

3) 谷卓哉，長谷川浩司，坂本博康，坂田年男：“正準相関分析と注視特性による顔表情画像からの感情の測定法”，知能と情報，22 ,1, pp.52-64 (2010)

4) 横瀬善正著「形の心理学」名古屋大学出版会 (1986)

5）ダヴィッド・カッツ：“ゲシタルト心理学”，新書館，pp.59-60 (1989)

6) 長石道博，視覚の誘導場による感性評価，『認知科学』,Vol.10,No.2, pp.326-333 (2003)

7) 長石道博，視知覚の場による手書き文字品質評価の検討日本認知科学会　テクニカルレポート JCSS-TR-68 1-16< (2012)

8) 長石道博，視覚の誘導場の複雑度による文書レイアウトの評価日本認知科学会　テクニカルレポート JCSS-TR-67 1-15 (2011)

9) 長石道博:"視覚の誘導場モデルを用いたパターン認識時の心理実験結果の検証", テレビジョン学会誌誌, vol. 50，No.12， pp.1965-1973 (1996)

10) 山田寛：“顔面表情の知覚: その心理物理的説明モデルの提案”，脳の科学, 22，2, pp.159-164(2000)

11）間所洋和，佐藤和人，門脇さくら：“表情の時系列変化を可視化する表情空間チャート”，知能と情報, 23，2, pp.157-169(2011)

本ページの原典
　長石道博: "視知覚の場による顔表情認知モデルの検討", 映像情報メディア学会誌, Vol.66, No.9, pp.J414-416 (2014)