感性評価



● 誘導場による文字,図形の感性評価

 近年,文字や図形,画像に対して人間が直感的・洞察的にとらえる印象などの感性情報を工学的に扱 い,使い易いインターフェースや画像の評価などに応用する研究が注目されている(辻, 1987; 井口・猪 田・小林・田辺・長田・中村, 1997).そこで,写真や絵画など画像における感性情報,例えば印象など を量的に予測する試みがされている.例えば,田中らは人間が画像を見たとき注目する領域を抽出し, その領域の物理的特徴から人間の印象を推定する方法を提案している (田中・石若・井上・井上, 1997). 笠尾らは画像を領域に分割して,各領域の画素,色などの相関性から画像の感性情報を分析する方法を 検討している(笠尾・中嶋, 1998). また,戸嶋らは画像の構図と感性情報との対応付けを検討している (戸嶋・八村, 1999)

 一方,人間の感性に関する現象や特性などが研究されている(三浦, 2000).例えば,今井らは楕円の 配列について,パターンの良さや類似性判定と感性の関係を検討している (今井・須藤・細田, 1995). また,遠藤らは無意味図形について幾何学的特徴がパターンの複雑さなどの判断に及ぼす影響を検討し ている(遠藤・齋木・中尾, 2002). しかし,感性に関する検討はまだ比較的簡単な図形にとどまっており, 画像の感性情報を量的に予測する一般的なモデルには至っていない.

 最近,視覚の誘導場による,文字,図形,画像の感性評価が注目されはじめている(深水, 2001). 誘導場が感性評価に注目される理由は次の通りである.まず,感性評価の1つである文字などパター ンの「良さ」が,誘導場の分布で説明できることが示唆されている (横瀬, 1986)

 そして,「良さ」の 認知判断を説明する変換構造説の道筋モデル(今井,1986) を,誘導場に適応した認識モデルが提案され ている (長石, 1996). この認識モデルが,人工的な文字,手書き文字など,いろいろな文字の類似性を 説明できることが示されている(長石, 1999)

 次に,従来定量的な推定が難しく人間の経験に頼っていた評価,例えば,読み易い文字列の配置 (長石,1998 ; 三好・下塩・古賀・井手口, 1999), 毛筆文字の美しさ(平形, 1990, 1991; 押木・岡本, 1996), 橋梁のアーチライズのバランス(扇長・深水・吉田・白石,1996), 安定した写真のレイアウト(厳・八村, 1993) が,誘導場で評価できることが報告されている.

 これら誘導場による感性評価方法は,従来の画像から感性情報を推定する方法のように,対象となる画 像の画素,色などの要素や構造を分析するのではなく,画像全体が醸し出す誘導場の分布を利用してい る.また,人間は絵の細部や構造を見て理解しているのではなく,テクスチャーなど含めゲシュタルト 的に全体として理解すると考えられている(Solso,1994).

 以上の研究から,誘導場を用いれば,文字や図形などいろいろな対象に対し,人間に近い感性 評価ができると考えられる.しかし,従来の誘導場の感性評価は,評価対象ごとに方法がまちまちであ り,誘導場のどのような特性が感性評価を可能にしているか,それにはどのような評価尺度が必要かな どについて基本的な評価方法は明らかにされていなかった.

 本ページでは,誘導場がパターンの「良さ」などを評価できることから,手書き文字の左右バランスや画 像のレイアウトの良さが誘導場で評価できるか検討した.更に,誘導場が印象の強さを評価できること が示唆されていることから,文字フォントや画像の印象の強さが誘導場で評価できるか検討した.そし て,誘導場で実際に文字や図形などの感性評価が行える可能性を考察した.

【 パターンの「良さ」 】
 ゲシュタルト心理学では,簡潔でエネルギ−が低い状態を「良い」と考えている(三浦, 2000).この 「良さ」を定量的に記述する指標はいろいろ検討されているが,ほとんどが人工的な線図形や簡単な パターンが対象である(黒須, 1994).その中で,今井は楕円列の配置を例に,プレグナンツの原理におけるパターンの良さを定量化する観点から, 具体的な認識モデルである道筋モデルを提案している(今井, 1986).

 しかし,一般的な文字などのパターンを対象とした検討はほとんどされていない. 一方,横瀬は文字などのパターンの「良さ」が誘導場の分布と関係有ることを示唆している(横瀬, 1986).
 そこで,この誘導場の性質に着目し,今井の道筋モデルを基にパターン類似性が定量的に説明できる誘導 場の認識モデルが提案されている(長石, 1996). そして,手書き文字を含めたいろいろなパターンについて,誘導場の認識モデルの有効性が示されている (長石, 1999).このことから,誘導場の分布からパターンの「良さ」を定量化できると考えられる.

 誘導場による手書き文字切り出しでは,出来るだけ円形の誘導場の分布が,個々の文字であるという 仮定により切り出しが可能である(長石, 1993). また,この手書き切り出しの原理を応用して,複数の文字が集合した文字列の読み易い状態を決められることが示されている (長石, 1998). このことから,読み易い文字というような,「良い」と判断されるパターンの誘導場の分布は,円のように簡潔な形状 になる傾向があると考えられる.

 そして,毛筆文字の美しさの定量化(平形, 1990, 1991; 押木・岡本, 1996), 誘導場による橋梁のアーチライズのバランス (扇長・深水・吉田・白石, 1996), 安定した写真のレイアウト(厳・八村, 1993) の評価から,局所的に誘導場の強い部分があるのではなく,誘導場の分布がパターン全体で平均化されて いる状態が良いと考えられる.
 これを誘導場の分布形状で捉えると,凹凸が少ない円や楕円のような分布になっている状態が良いと言える.
 以上から,パターンの良さは,そのパターン(またはパターンの集合体)の醸し出す誘導場の分布形状に対応し,分布が円に近いほど「良さ」も高いと考えられる.


【 印象の強さ 】
 我々は絵画や風景などの画像を見たとき,分かりやすい,美しい,さっぱりしているなどの形容詞で 記述される感性とは別に,言葉にはならないが印象の強さを感じる.例えば,ポスターの題字は極め て力強いフォントが使われるが,題字の内容を読まなくても題字を見ただけで強い印象を受ける(注1).

 また,似たような内容のプレゼンテーションであっても,文字や写真の配列などで聴衆の受ける印象は大 きく異なる.たとえ内容が外国語で解らなく,時には内容を忘れても印象の強さだけ記憶に残る場合 もある.このような印象の強さを,我々は実際に感じていることが生理学的に示されている(前川・中津・河合・仁科・大橋, 2001).

 しかし,その強さを画像そのものから直接判断する方法はほとんど検討 されていない(井口・猪田・小林・田辺・長田・中村, 1997; 辻, 1987).また,従来の誘導場による感 性研究は,バランス,美しさ,読み易さなど形容詞で記述される感性評価が中心である(深水, 2001).

 印象の強さのような感性は一種のポテンシャルの強さに対応するとの示唆がある(三浦, 2000).ま た,誘導場が強い図形は我々の印象を引きやすいと言われている. 実際,横瀬らは誘導場の分布から,目立ち易い鉄道遮断機の柵を考案している(横瀬, 1986).
 誘導場はクーロンポテンシャルと解釈できる(長石, 1996) ので,パターン(またはパターンの集合)をひとかたまりと見たポテンシャルエネルギ−を考えることができる.

 このことから,パターン全体の醸し出す誘導場のポテンシャルエネルギ−と印象の強さは関連しており,ポテンシャル エネルギ−が強ければ印象も強いと考えられる.

 注1: 活版印刷を発明したグーテンベルクはフォントも発明した.彼によって同じ文字種でも,題字や本文というように, 文字が与える印象を変えられるようになった(Brookfield,1993)



◆ 実験

【 パターンの「良さ」 】

 パターン(またはパターンの集合体)の醸し出す誘導場の分布形状が円に近いと「良い」状態かどう か,対象パターンの誘導場の形状を計測し,パターンの良さと比較した.誘導場の分布形状の記述に は,手書き文字の切り出し(長石, 1993) と同様に,誘導場の等ポテンシャル線の複雑度を用いた.

 ある等ポテンシャル線の閉曲線を構成する点の個数を周囲長 li,閉曲線の内側に存在する画素総数 を面積 Si とすると,複雑度 Ci は次式で与えられる(長谷川・輿水・中山・横井, 1986).

上式より,複雑度の単位は無次元である.複雑度は図形が円に近いと最も小さな値をとる.図形に凹 凸が多く複雑になるほど大きな値をとる(長谷川・輿水・中山・横井, 1986).

 まず,単独のパターンの良さが判断できるかどうか,手書き文字の偏と旁の左右バランスの良さを心 理評定した結果(押木・岡本, 1996) を検討した.図1は,「和」「植」について偏と旁の左右バランスを 評定した例である.図1中の数字は左右バランスの評定値である.0 が最もバランスが良く,右または 左に偏るほど数字が大きくバランスは悪くなる(最大値 7 )

 文字データは,押木がweb で公開している文書(http://tegaky.shosha.kokugo.juen.ac.jp/oshiki/ronbun/hent95/ht95.htm (2002))から,文字部分を抽出し,64×64 ドットの大きさ,解像度は72dpi で作成,各文字データの誘導場を計算し複雑度を求めた.この例 を含め本報告のデータはすべて72dpi の解像度で作成した.



図1  実験に用いた手書き文字


 次に,パターンの集合体について,レイアウトした時の良し悪しが判断できるか検討した.図2 Aの 3つの顔画像(白黒2値)を正三角形の頂点に配列したレイアウトを基準に,図2 BからF のように, 個々の顔画像位置を徐々に大きく移動,回転させた6 つのレイアウト(256×256 ドット)を準備した.

 レイアウトの良さは,官能検査法の1つであるサーストンの一対比較法(佐藤, 1985) により定量 評定した.一対比較法は,複数の試料から2 個づつ取り出して比較,順序づけから各対象の距離尺度 が求められる方法である.この方法は試料の判断がやさしく定量化が容易なため,味覚など嗜好の評価 から,最近ではインクジェットプリンタの画質評価など広く使われている.
 ここでは,図2 A 〜 F の 6 種類のレイアウトから 可能な6*(6 - 1)/2 = 15 対を,72dpi の解像度で白背景に,2 個のレイアウトを横 に並べて作成し,パソコン画面上にランダムに呈示した.被験者は,視距離 50cm から各対の 2 個のう ち,どちらのレイアウトが良いか口頭で報告した.正常な視力の 30 代男性 5 名の被験者に1人あたり 10 回評定させた.以降の評定に関する心理実験の視距離,被験者の条件は同じである.

 最後に,各レイアウトの誘導場を計算し,図1と同様に複雑度を求めた. なお,誘導場が強い部分の等ポテンシャル線は,文字やパターンに近いため凹凸が多過ぎて複雑度が正確に計 測しにくい.ここでは誘導場の強さが弱い等ポテンシャル線(誘導場の強さは,図1:0.02-0.099,図2:0.01-0.099,0.001 ステップ)で計測した. 複雑度は各等ポテンシャル面ごと求め,その平均を心理評定値と比較した.これ以外の実験で は,誘導場の計測は誘導場の強さ0.01 から0.399,0.001 ステップで行う.



図2  実験に用いた顔画像レイアウト例


【 印象の強さ 】
 最初に,パターン全体の醸し出す誘導場のポテンシャルエネルギ−を定義する.あるパターンの誘導 場において,誘導場の強さ p における等ポテンシャル面の面積を S (p) とすると,このパターンのポテ ンシャルエネルギ− E は次式で与えられる.

 まず,図1と同じ「和」「植」の多種類のフォントについて,印象の強さとポテンシャルエネルギ−の関 係を検討した.図3は実験に使用したフォント例である.手書きに近い繊細な教科書体や正楷書体,文 書本文で使われる明朝体,ポスターや広告の強調に使われるPOP 文字やウインZ10 など8 書体4)を用 意した.フォントの大きさは62 ポイント(72dpi)である.

 各フォントの印象は一対比較法で定量評定した.フォントの場合,例えば,教科書体とウイン Z10 のように,フォント間の印象の違いに大きな差があると考えられる. 前述のサーストンの一対比較法は,試料間の違いが少ない場合,評価する組み合わせが少ないが,フォントの印象評価は組み合わせが多く,被験者の負担が大きい。 そこで,印象の違いを評点で判断するシェッフェの一対比較法(中屋変法)(佐藤, 1985) を用いた。
 図2の場合と同様に,8 書体から可能な 8(8-1) / 2 = 28 対を作成し,パソコン画面上にランダムに呈示した.各被験者は,各対の 2 個の書体 i, j のどちらが印象が強いか比較,表1の尺度で 5 段階判断し口頭で報告する. 各フォントは64×64 ドットの文字データに変換後,誘導場を計算,ポテンシャルエネルギ−を求めた.



図3  印象の実験に用いたフォント例


表1  印象の評定尺度



 次に一般的な画像について,印象の強さとポテンシャルエネルギ−との関係を検討した.図4 A の 顔画像( 64×64 ドット)を基準に,顔画像の 8×8 ドットの領域をランダムに 2 箇所欠損させた顔画像 B,同様に顔画像 C( 6 箇所欠損),顔画像 D( 10箇所欠損)を用意した.図3のフォントの場合と同 様に,4 つの顔画像から可能な 4(4 - 1) / 2 = 6 対を作成し,各顔画像の印象をシェッフェの一対比較 法(中屋変法)で評定した.そして,各顔画像の誘導場を計算しポテンシャルエネルギ−を求めた.

 最後に,図5に示す面積が等しい円,正六角形,正方形,正三角形の印象の強さとポテンシャルエネ ルギ−との関係を検討した.図5の図形は,例えば交通標識に使われており,横瀬は各図形の中心にお ける誘導場の強さと図形の目立ち易さの関連性を示唆している(横瀬, 1986).ここでは,図5の図形を 64×64 ドットの大きさの画像に変換後,誘導場を計算してポテンシャルエネルギ−を求めた.


図4  実験に用いた欠損した顔画像例



図5  実験に用いた図形

◆ 実験結果

【 パターンの「良さ」 】


 図6(a),(b) は,図1「和」,「植」について,縦軸に複雑度の平均,横軸に右または左の偏りの心理 評定値をとって,手書き文字の左右バランスと複雑度の関係を示したグラフである.グラフ左上の数値 は相関係数である.
 図6から手書き文字の左右バランスの心理評定と複雑度の平均は,相関係数 0.8 程 度以上の強い相関がある.左右バランスの評定が悪く心理評定値が大きくなると,複雑度の平均が大き くなっている.押木らも誘導場の広がり,バランスなど複数の要素を定量化して,心理評定との相関係 数 0.7 程度を得ている(押木・岡本, 1996)
 一方,複雑度を用いると,更に心理評定と高い相関を得ら れる.このことから,左右バランスのような単独のパターンの良さを誘導場の複雑度で評価できると考えられる.


図6  手書き文字の左右バランスと複雑度


 図7は,縦軸に複雑度の平均,横軸に図2の各レイアウトの良さの心理評定値をとって,一般的な 画像についてレイアウトと複雑度の関係を示したグラフである.グラフ左下の数値は相関係数である. 心理評定値はレイアウトが良い場合は大きく,悪い場合は小さくなっている.
 図7から,図2のレイアウトの良さの心理評定と複雑度の平均は相関係数 0.923 と強い相関がある. このように,パターンの集合体についてレイアウトした場合, 心理評定値が低く見にくいレイアウトは誘導場の複雑度が大きくなっていることがわかる .以上からパターン単体だけではなく,パターン集合体の良さも誘導場の複雑度で評価できると考えられる.


図7  顔レイアウトの良さ心理評定と複雑度

【 印象の強さ 】

 図8(a) は「和」,(b) は「植」について,縦軸にポテンシャルエネルギ−,横軸に図3の各フォント の印象の強さの心理評定値をとって,フォントの印象の強さとポテンシャルエネルギ−との関係を示し たグラフである.グラフ左上の数値は相関係数である.
 図8から,「和」「植」共にフォントの印象の強さの心理評定とポテンシャルエネルギ−は相関係数 0.98 程度の強い相関があり,フォントの印象が強いほどポテンシャルエネルギ−が大きくなることから,フォントの印象の強さをポテンシャルエネルギ−で定量化できると考えられる.


図8 フォント印象の心理評定とポテンシャルエネルギ−

 図9は,縦軸にポテンシャルエネルギ−,横軸に図4 の各顔画像の印象の強さの心理評定値をとっ て,一般的な画像の印象の強さとポテンシャルエネルギ−との関係を示したグラフである.グラフ左上 の数値は相関係数である.
 図9から,顔画像の印象の強さの心理評定とポテンシャルエネルギ−は相関係数 0.961 の強い相関があり,顔画像の印象が強くなるに従い,ポテンシャルエネルギ−が大きくなることがわかる. 以上から,フォントや画像の欠損程度など,画像の印象が強くなれば,誘導場のポテ ンシャルエネルギ−は大きくなると考えられる.


図9 欠損顔画像印象の心理評定とポテンシャルエネルギ−

 図10は,図5の各図形のポテンシャルエネルギ−および複雑度の平均を示したグラフである. 図10から,交通標識でよく使われる正方形と円のポテンシャルエネルギ−が大きい.正三角形のポテンシャ ルエネルギ−は,正方形や円ほど大きくないが,複雑度が非常に大きい.したがって,正三角形は図形 としての印象はやや弱いが,「良さ」は低く背景との違いが目立つと推測される.実際,正三角形は注意や警告を発する交通標識に使われている(http://www.hrr.mlit.go.jp/road/hyosiki/qa.html)

 一方,正方形や円は,ポテンシャルエネルギ−が大きいので図形の印象は強いが,複雑度が小さく図形の良さ が高い.実際,速度や方向など数字や矢印などで細かな情報を伝える交通標識に使われている(http://www.kictec.co.jp/material/keijyou/1.htm).このように,図形の誘導場のポテンシャルエネルギ−と複雑度を指標に,その図形の印象の強さ,目立ち易さなどが説明できると考えられる.


図10 図形のポテンシャルエネルギ−と複雑度


◆ 考察

 図6より手書き文字の左右バランスの良さが,図7より画像レイアウトの良さが高いほど複雑度が低くなることから,パターン単体の「良さ」は誘導場の複雑度で定量化できると考えられる.

 また,図8よりフォントの違いによる印象が,図9より画像の欠損程度による印象が強いほどポテンシャルエネルギ−が大きくなることから,印象の強さは誘導場のポテンシャルエネルギ−で定量化できると考えられる.

 したがって,これまで定量化が難しかった感性評価である,「良さ」「印象の強さ」は,それぞれ誘導場の複雑度ポテンシャルエネルギ−定量化できる可能性が示された.

 更に,図10から,誘導場のポテンシャルエネルギ−および複雑度の双方の指標を用いて,図形の印象,目立ち易さなど,我々が図形に対する感性を説明できると考えられる.





参考文献

Brookfield, K. (1993). Ancient Art & Architecture Collection; 8tl, 10cl. Dorling Kindersley. (浅葉克己監修(1994). 『ビジュアル博物館第 48 巻 文字と書物』, 40-45. 同朋舎出版.).

遠藤信貴・齋木潤・中尾陽子(2002). 無意味輪郭図形の心理・幾何学特性間の分析. http://staff.aist.go.jp/n-endou/database/psygeo.htm

深水義之(2001). 図形認知モデルの構築と橋梁への応用に関する基礎研究. 『東京大学 博士(工学)論文

長谷川純一・輿水大和・中山晶・横井茂樹(1986).『画像処理の基本技法 ―技法入門編―』. 技術評論社.

平形精一(1990). 字形要素による学習漢字の分類< I >. 『書写書道教育研究』, 4 64-74.

平形精一(1991). 字形要素による学習漢字の分類< II >. 『書写書道教育研究』, 5 34-42.

今井四郎(1986). 『パターン認知の変換構造説(心理学モノグラフ17)』. 東京大学出版会.

今井四郎・須藤昇・細田聡(1995). 感性,感性情報処理とその適応的意義. 『心理学評論』, 38 (3)

351-367. 井口征士・猪田克美・小林重順・田辺新一・長田典子・中村敏枝(1997). 『感性情報処理』. オーム社.

笠尾敦司・中嶋正之(1998). 画像の印象解析を目的とした適応的分割k-平均アルゴリズム. 『電子情報通信学会技術報告』, PRMU97-558 111-118.

前川督雄・中津良平・河合徳枝・仁科エミ・大橋力(2001). メディア視覚像の精細度感性評価. 『映像情報メディア学会誌』, 55 (8/9), 1186-1197.

三浦佳世(2000). 感性認知. 『知性と感性の心理 −認知心理学入門−』. 行場次朗・箱田裕司 (編) 60-73. 福村出版.

長石道博(1993). 視覚の誘導場を用いた手書き文字の切出し. 『電子情報通信学会論文誌』, J76DII (9), 1948-1956.

長石道博(1996). 視覚の誘導場モデルを用いたパターン認識時の心理実験結果の検証. 『テレビジョン学会論文誌』, 50 (12), 1965-1973.

長石道博(1998). 視覚の誘導場による読み易い和文文字列表示. 『映像情報メディア学会誌』,52 (12), 1865-1872.

長石道博(1999). 視覚の誘導場モデルによる手書き文字の文字品質評価と心理実験結果との比較.『映像情報メディア学会誌』, 53 (8), 1176-1182.

三好正純・下塩義文・古賀広昭・井手口健(1999). 視覚の誘導場理論を用いた感性にもとづく文字配置の設計. 『電子情報通信学会論文誌』, J82-A(9), 1465-1473.

扇長洋子・深水義之・吉田登美男・白石照美(1996).アーチライズの見誤りと心理ポテンシャルの関連について. 『デザイン学研究』, 43 (2), 77-84.

押木秀樹・岡本正行(1996). 左右の部分形から構成される漢字の外形に関する研究(1) −縦方向の大きさに関する感覚と要素−. 『書写書道教育研究』, 10 51-60.

黒須正明(1994). 文字の知覚. 『新編感覚・知覚心理学ハンドブック』. 大山正・今井省吾・和気典二(編) 969-973. 誠信書房.

佐藤信(1985). 『統計的官能検査法』, 225-298. 日科技連.

Solso, L. (1994). Cognition and the visual artsMIT press. (鈴木光太郎・小林哲生共訳 (1997). 『脳は絵をどのように理解するか −絵画の認知科学−』. 新曜社.).

Kaji, S., Yamane, S., Yoshimura, M., Sugie, N.(1974). Contour Enhancement of Twodimensional Figures Observed in the Lateral Geniculate Cells of Cats. Vision Research, 14 113-117.

田中昭二・石若通利・井上正之・井上誠喜(1997).画像からの感性要因の抽出 −注目領域抽出法の評価−.『電子情報通信学会技術報告』, IE96-110 9-14.

戸嶋朗・八村広三郎(1999). 絵画からの画面構成の抽出と検索への応用. 『情報処理学会論文誌』, 40 (3), 912-920.

辻三郎(1987). 『感性の科学 −感性情報処理へのアプローチ−』, 68-72. サイエンス社.

内山道明(代表)(1984). 統合の場としての脳 知覚系−行動系の統一的理解への基礎的研究. 『昭和58 年度科学研究費補助金一般研究(A) 研究報告書』, 研究番号56410001 13-30.

横瀬善正著「形の心理学」 名古屋大学出版会 (1986)

厳壮志・八村広三郎(1993). 視覚ポテンシャルを用いる図形の最適配置. 『情報処理学会第46 回 全国大会』, 9C-8.



本ページの原典
長石道博,視覚の誘導場による感性評価,『認知科学』,Vol.10,No.2, pp.326-333 (2003)



Copyright 2019 [Michihiro Nagaishi]. All rights reserved.