北海道植物データ処理システムの開発について(その4)

日野間 彰


(前報*より続く)

(3)システム構成のイメージ設計
 データベースをシステムとして形作るためには、検討された各種のファイルを適当な記憶装置に保存するとともに、システムを構成する演算装置、入・出力装置との接続関係を整理しておく必要がある。ECPLANTでは、データファイルや出力結果の取扱いの容易性、データの保全等を勘案して、全体のシステム構成を図15に示すようなイメージで設計した。

(4)プログラムの作成
 ECPLANTには何種類かのデータ処理内容が含まれており、これらのデータ処理を円滑に実行できるようにするために、データ処理の流れを図16に示すとおり整理した。
 以下に各々のデータ処理内容毎に作成したプログラムの概要を説明する。

@植生調査票作成プログラム
 植生調査票作成プログラムのフローは図17に示すとおりである。
 a.検索
 処理条件設定で指定されている識別コードに合致する調査スタンドをフィルドデータファイルから検索するステップである。フィルドデータファイルから1個1個の調査スタンドの識別コードを読取り、検索条件に合致する調査スタンドだけを取り出して処理対象調査スタンドデータ(以下対象調査スタンドデータという)とする。
 b.照合
 植物番号に対応する植物名をセットするステップである。対象調査スタンドデータの植物番号を1個1個読取り、分類データファイルと照合して植物番号の一致する和名を探し出す。
 c.出力
 設計されたフォーマットに従って植生調査票をモニターまたはプリンターに出力するステップである。
A素表・群落組成表作成プログラム
 素表・群落組成表作成プログラムのフローは図18に示すとおりである。
 a.検索
 植生調査票作成プログラムにおける検索のステップと同じである。
 b.数値変換
 植物番号の標準化を行うステップである。対象調査スタンドデータの植物番号を1個1個読取り、分類データファイルと照合し、一致する植物番号に対応する正名の植物番号がある場合には当該の植物番号を正名の植物番号に置き換える。
 c.計算
 各調査スタンド毎の出現種数と、各階層別の植物毎の出現頻度および積算優占度を計算するステップである。
 d.並び変え
素表あるいは群落組成表における調査スタンドの並び順と出現植物の並び順を、出現種数順と階層順・出現頻度順・積算優占度順にするステップである。
 e.照合
 植物番号に対応する植物名をセットするステップである。出現するすべての植物番号を、分類データファイルと照合して植物番号の一致する和名を探し出す。
 f.出力
 設計されたフォーマットに従って素表あるいは群落組成表をモニターまたはプリンターに出力するステップである。
B出現植物目録作成プログラム
 出現植物目録作成プログラムのフローは図19に示すとおりである。

 a.検索
 調査スタンドを指定して出現植物目録を作成する場合には、植生調査票作成プログラムにおける検索のステップと同じである。
 地図番号を指定して出現植物目録を作成する場合には、処理条件設定で指定されている地図番号に合致する調査スタンドをフィルドデータファイルから検索するステップである。フィルドデータファイルから1個1個の調査スタンドの地図番号を読取った上で処理条件の指定に応じて地図番号の変換を行い、検索条件に合致する調査スタンドだけを取り出して対象調査スタンドデータとする。
 b.数値変換
 素表・群落組成表作成プログラムにおける数値変換のステップと同じである。
 c.並び変え
 すべての出現植物を植物番号順(=分類順)に並び変えるステップである。
 d.照合
 素表・群落組成表作成プログラムにおける照合のステップと同じである。
 e.出力
 設計されたフォーマットに従って出現植物目録をモニターまたはプリンターに出力するステップである。分類データファイル上の科番号を利用して門・綱・科等の上位の分類単位をも合わせて出力する。

C植物分布図作成プログラム
 植物分布図作成プログラムのフローは図20に示すとおりである。
 a.数値変換
 地図番号の変換と植物番号の標準化を行うステップであり、植物番号の標準化については素表・群落組成表作成プログラムにおける数値変換のステップと同じである。地図番号の変換は、処理条件設定で地図番号変換が指定されている場合に行う処理で、市町村コードで表示されている地図番号を当該市町村の市役所あるいは役場の所在地の属する地図番号に置き換える。
 b.検索
 分布図を作成しようとする植物の含まれている調査スタンドを探すステップである。処理条件設定で指定されている植物番号に合致した場合に、当該調査スタンドの地図番号を当該植物の分布する場所として計算機内に保存しておく。
 c.原典保存
 植物分布図作成後の原典探索を可能としておくためのステップである。分布図作成対象の植物番号を含んでいる調査スタンドの識別コードを作業ファイルに出力しておく。
 d.出力
設計されたフォーマットに従って植物分布図をモニターまたはプリンターに出力するステップである。必要に応じて原典の識別コードのリストも出力できる。

D類似度計算処理プログラム
階層的クラスターおよび非階層的クラスターの作成のための類似度計算処理プログラムのフローは図21および図22に示すとおりである。
 a.検索
 植生調査票作成プログラムにおける検索のステップと同じである。
 b.数値変換
 植物番号の標準化と優占度の変換を行うステップであり、植物番号の標準化については素表・群落組成表作成プログラムにおける数値変換のステップと同じである。優占度の変換は、類似度計算に用いる属性(変量)である優占度を数値に置き換える処理であり、処理条件設定により次の3種類の変換が可能なように設計した。
  1)ある植物種が出現する場合に当該植物種の属性を1とする変換
  2)優占度階級に応じて次のように属性を与える変換

優占度階級属性
87.5
62.5
37.5
17.5
5.0
0.1
0.1
60.0
30.0
15.0

3)優占度階級に応じて次のように属性を与える変換

優占度階級属性
5.0
4.0
3.0
2.0
1.0
1.0
1.0
4.0
3.0
2.0

 c.計算
 類似度の計算を行い、クラスターの生成に必要な演算処理を行うステップである。
 クラスター間の類似度の算出には重心法を用い、次式によって定義した。


       ただし、 :クラスター における植物 の属性
            :クラスター における植物 の属性
            :クラスター に含まれるスタンド総数
            :クラスター に含まれるスタンド総数

 非階層的クラスター計算の方法としてはK−平均法を用いた。
 d.出力
 設計されたフォーマットに従って計算結果をモニターまたはプリンターに出力するステップである。
Eデータ管理プログラム
 以上のプログラムのほか、ECPLANTではデータの保守・更新・追加に必要な次のようなプログラムを作成している。
   ・フィルドデータ入力結果のチェック
   ・フィルドデータファイルの追加・更新
   ・植物分類データファイルの追加・更新
   ・文献データファイルの追加・更新

6.テストラン
 テストランの結果については、出力形式の検討の項において例示しているので省略する。

7.おわりに
 筆者の開発した北海道植物データ処理システムについて、おおむね開発の手順に従って概説したが、データとして使用した既存の植物調査資料に関していくつか指摘しておかなければならない点がある。
 第一点は、植物調査資料として基本的に記載されていなければならない項目がしばしば欠落していることである。植物調査に限らず、フィルド調査における調査場所、調査時期、調査者の氏名等の記載はごく基本的な項目である。おそらくそれらについては調査票原票には記載があるのであろうと思われるが、レポートに記載されていない限り、その資料を見る者にとってはそれを知る方法がない。それが何時、何処で、誰によって調査されたものであるのかが不明のフィルドデータは、資料価値のない極めて乏しい資料であるといえる。このような例の多い資料として環境アセスメント関連のレポートと植物写真集等を挙げることができる。
 第二点として、データの地理的偏在について指摘しておきたい。図23はECPLANTに登録されているすべてのフィルドデータの調査地点の分布状況(1996年1月末現在)を示したものである。
 図にすめされているように、札幌を中心とした道央圏、苫小牧地方、釧路地方、知床山系等にデータが集中しておりデータのほとんどない地域が留萌地方、紋別地方、根釧原野等にみられる。このように木曾となるデータ自身の地理的な偏在が非常に大きいことから、ECPLANTによって加工処理されたものも全道に均一に評価し得ないものであることを示しておきたい。特に分布図については、概略的な目安程度にしか利用できない。
 北海道全体の植物群落の比較や種の分布の把握のためには、今後調査資料の空白を埋めていく必要がある。

 第三点として、調査資料の入手の困難性について指摘したい。これも環境アセスメント関連の調査資料に多いことであるが、資料を公開しない例がある。一般の学術誌等に発表されている論文や報告は図書館を利用したりすることによって、何とか資料を収集することができるが、それ以外の情報を入手するには非常に困難を伴うことが多い。植物に関するフィルド調査は、そこにある植物や植物群落について客観的に観察・記録したものであり、重要と思われる植物の保護の為の場合を除いて、それを秘匿する理由は無いと考える。
 ECPLANTについては今後も内容の充実に努めていつもりである。本報告の内容および今後のシステム開発に関して、広く御批判・御指導を仰げれば幸いである。
 最後に、この研究開発にあたって絶えずご指導を戴いた北海道大学名誉教授伊藤浩司博士と、主としてプログラム開発にご協力戴いたたくぎん総合研究所主任研究員三上知也氏に対して、深くお礼を申しあげる。

参考文献
1) 日野間彰 1989.北海道の林.菩多尼訶(4):16-21
2)  −   1991.北海道の植物の数値情報の紹介.菩多尼訶(6):26-29
3) 伊藤浩司 1986.北海道植物新産地報告(3).Journ.Jap.Bot.61(12):375-376
4)  −  ・春木雅寛 1985.ケショウヤナギの環境保全学的研究(T).日本林学会北海道支部論文集34:53-56
5)  −  ・日野間彰 1985.北海道高等植物目録T.たくぎん総合研究所.73pp.
6)  −  ・ −   1987.北海道高等植物目録W.たくぎん総合研究所.244pp.
7)  −  ・ −  ・中井秀樹 1990.北海道高等植物目録U.たくぎん総合研究所.288pp.
8)  −  ・ −  ・中井秀樹 1994.北海道高等植物目録V.たくぎん総合研究所.480pp.
9) 金井弘夫 1972.日本植物の分布型の研究(3)産地の表示法について.Journ.Jap.Bot.47(7):215-221
10)  −   1983.日本植物の分布型の研究(5)普通植物分布調査の問題点.Journ.Jap.Bot.59(9):257-269
11)  −   1988.植物分布の「普通さ」の目安(1).Bull.Nat.Sci.Mus.Tokyo,Ser.B,14(1):21-39
12) 環境庁・編 1986.自然環境保全調査報告書. 大蔵省印刷局.401pp.
13) 河口至商 1978.数学ライブラリー46多変量解析入門U.森北出版.163pp.
14) 国土庁計画・調整局、建設省国土地理院・編 1987.国土情報シリーズ2国土数値情報.大蔵省印刷局.130pp.
15) Pielow,E.C.1984.The interpretation of ecological data, A Wiley-Interscience publication. 263pp.
16) 我が国における保護上重要な植物種及び群落に関する研究委員会・編 1989.我が国における保護上重要な植物種の現状.(財)日本自然保護協会・(財)世界自然保護基金日本委員会.320pp.

ボタニカ12号

北海道植物友の会