序盤講座
最終更新日 2002.01.05

勝ち方の基本
ここでは、思いついた順にコラム形式で短く書いていきたいと思います。
何か役に立つことがあれば幸いです。



1. ミニ・マックスの罠 (2002.02.07)

WZebraなどの強いオセロプログラムを始め、将棋、囲碁など思考型プログラムには ほぼMin-Max法という手法が使われています。

これって、最善の見つけるにはよい方法なんだけど、人間がMin-Max法で出した評価を うのみにするのはかなり危険です。 すなわち、WZebraのbook暗記型の学習の危険について。

Min-Max法というのは、最も悲観的な評価を使って算出します。
例えば、自分があるの手を打ったときに相手は最もよい手 すなわち自分にとって最も不利になるような手を返してくると想定し(Minな手)、 自分は常に選択肢の中でもっともよい手を選べる(Maxな手)という想定です。

そのため、次のような場合が頻繁に発生します。
自分の手番にて e3 と g6 があった場合、3手先、すなわち自分―相手と打った後の場面での 評価が次のようだったとします。

    e3 3手先状況 (+1.20, -2.30, -3.48, -1.20, -5.46)
    g6 3手先状況 (+0.10, +0.86, +0.80, +0.46, +0.70, -0.50)

この場合、Min-Max法では必ず3手先で最善の手を選んでいるという想定になり、 e3 と g6 の評価は、

    e3 +1.20
    g6 +0.86

となります。
ところが人間に取ってみれば、
e3 を選択すると3手先では1手しか正解がない難解な局面ということになり、
g6 を選択すると3手先では簡明なほぼ互角な局面ということになります。

つまり、
評価のよい手を選んだ先の展開が人間にとってよい局面に見えるとは限らない
ということです。