名古屋工業大学電気情報工学科南里研究室 神谷栄治
遺伝的プログラミング
遺伝的プログラミング(以下 GP)は、遺伝的アルゴリズム(以下GA)を改良したアルゴリズムである。
GP・GAは共に、生物の進化の過程をモデルとしたものであり、計算機内に仮想生物を大量に生成し、選択・淘汰を繰り返し、世代を重ねるごとに、より解に近づくというものである。選択・淘汰とは、環境に適合した固体は多産であり、適合しない固体は子孫を残せないという意味である。GPの応用としては、関数同定、自動プログラム生成、パターン認識、人工知能などがある。
Fig. 1 GPのアルゴリズム
GPのアルゴリズムは、
- ランダムに100〜10000個の遺伝子を生成する。
- 各遺伝子の適合度を求める。
- 適合度の高い遺伝子を選択し、子供を作る(親のコピー)。
- ランダムな確立で、交叉・逆位・突然変異などの変異を起こす。
- 2.へ戻る。
である。
GPでは、遺伝子を木構造で表わす。例えば、
は、Fig. 2のように表現される。図の○はノード(端子)と呼び、子ノードを持つ*や+を非終端子、子ノードを持たない3やx、4を終端子と呼ぶ。

Fig. 2 GPの遺伝子

Fig. 3 遺伝子の変異
関数同定問題とは、入出力データから元の関数を求める問題である。例えば、「Table
1のデータから、元の関数を求める」という問題である。この場合の解は、
である。なお、この入出力データを教師データと呼ぶ。
Table 1 教師データ
| x(入力) | y(出力) |
| 1.0 | 7.0 |
| 2.0 | 10.0 |
| 3.0 | 13.0 |
| 4.0 | 16.0 |
GPの設計で重要なものとして、終端子・非終端子の設計がある。Table 1の場合、
非終端子:+、−、*、÷
終端子:
、
(
はランダムな実数)
とするのが妥当であろう。もっと複雑な問題の場合は、非終端子として三角関数・指数関数・対数関数などを追加するとよい。また、1変数入力1出力でなく、多変数入力1出力問題のときは、終端子として
を追加するとよい。
GPの設計でもう一つの重要なものとして、適合度の設計がある。関数同定問題の場合は、平均誤差や平均二乗誤差が使われる。ただし、この場合は適合度が低いほど優秀な遺伝子とみなす。
例えば、ある遺伝子が、
だったとしよう。この式を評価すると
Table 2
| x(入力) | 教師データのy | 誤差 | |
1.0 |
7.0 |
1.0 |
6.0 |
2.0 |
10.0 |
3.0 |
7.0 |
3.0 |
13.0 |
5.0 |
8.0 |
4.0 |
16.0 |
7.0 |
9.0 |
合計 |
30.0 |
||
平均誤差 |
7.5 |
||
となり、平均誤差は、7.5となり、これが適合度である。この個体が優秀であるかどうかは他の個体の適合度と比較しなければわからない。他の個体に比べて優秀であれば、この個体は多くの子孫を残し、逆に優秀でなければ淘汰される。
あとは、前述したアルゴリズムで世代を重ねれば次第に適合度の低い遺伝子が生き残り、最終的に適合度が0になれば計算は終了する。
その他に、集団の個体数、交叉の確率、突然変異の確率、初期個体の生成方法、選択方法、最大の木の大きさなどがあるが、一般にこれらのパラメータをどう設定すればよいかという理論的な方法は、みつかっていない。
次の応用問題は、「仮想ロボットに、荷物を目的地まで運ばせる」問題である。しかし、従来のようにあらかじめロボットに動作の手順(プログラム)を与えるのではなく自発的にそのプログラムを生成させようという問題である。この学習ロボットは、環境が変わってもセンサーに外乱が入っても対応できるというメリットがある。

Fig. 4 環境条件
まず計算機に、仮想ロボット・部屋・障害物・荷物・目的地を用意する。これらの環境条件に依存しないプログラムを生成させるため、部屋の大きさ、障害物の位置、荷物の位置、目的地の位置はランダムとする。また、仮想ロボットには、荷物を持ち上げるアーム、前方にある壁・障害物・荷物・目的地を認識する視覚センサー、壁・障害物・荷物にぶつかったかどうかを判定するバンプセンサーを持つ。センサーの外乱に対応するプログラムを生成させるため、一定の確率でセンサーは対象物の認識を誤るとする。
ロボットのプログラムの実行は、目的地に荷物を運ぶか、一定ステップ以上かかっても目的地に運べなかった場合に終了する。
終端子・非終端子は以下のように設計する。
Table 3 仮想ロボットの終端子・非終端子
| 非終端子 | PROC(a,b) | 順次処理。aを実行し、bを実行する。 |
| IF_EYE_SENCER(a,b,c,d,e) | 前方にある物に対する分岐処理。壁ならa、障害物ならb、荷物ならc、目的地ならd、何もなければeを実行する。 | |
| IF_BUMP_SENSER(a,b) | バンプセンサーに対する分岐処理。何かにぶつかっている場合はa、ぶつかっていなければbを実行する。 | |
| IF_GRAB(a,b) | 何かをつかんでいるときはa、つかんでいないときはbを実行する。 | |
| 終端子 | FRONT | 前進 |
| BACK | 後退 | |
| TURN_LEFT | 単位時間に15度、左回転 | |
| TURN_RIGHT | 単位時間に15度、右回転 | |
| GRAB | 前方の物をつかむ | |
| RELEASE | つかんでいる物を置く |
まず、ロボットが荷物ところまで行かなければ話にならない。そこで、ロボットが荷物を移動させたかどうかで2段階に適合度を設計する。
・荷物を移動させれなかったとき
・荷物を移動さたとき
あとは、前述のアルゴリズムで世代を重ねれば次第に適合度の高い遺伝子(プログラム)が生き残る。