インデクサー(インデックス・索引を作成する人)養成講座

■索引作成請負(株)コム・スポット
「サイトマップ」「WEBインデックス」「リンクページ」「キーワードインデックス」「書籍の巻末索引」

■目次

日本の書籍に巻末索引がない理由
インデックス・索引とは?
巻末索引の作り方
WEBインデックスの作り方
基本コンピュータスキル@
基本コンピュータスキルA VBA
インデクシング ツール@ファイル検索
インデクシング ツールA タグの検索・置換
インデックスの必要性:受信者から情報探索者へ
サイト分析:ファイルマップ作成
インデクサーのためのリンク集


日本インデクサーギルド
Phone&Fax: 0466-37-0937



はじめに
日本ではインデックス(索引)のない本が多い。
従って、インデクサー(Indexer)というプロの職業は存在しない。

だが、ホームページが増え、
そのコンテンツが日毎に増加している状況から見て、
遠からずWEBインデックスの作成者としてのインデクサーの需要が増えるのは目に見えている。

日本インデクサー協会はインデクサーを養成することを目的として創設されようとしている。

インデクサーの仕事は、本作りの工程のひとつで、知的作業。
WEBインデックスともなれば、コンピュータリテラシーが強く要求される。

このオンライン講座は、亀の歩みのごとく、ゆっくりそのスキルを提供してゆく。

期待してほしい。

日本インデクサーギルド:古野 操


日本の書籍に巻末索引がない理由
一般的に、読書の目的は

@著者・編集者との対話
A編集されたデータやコンセプトなどの情報を獲得すること

とされている。
特に、前者@の目的が良い読書姿勢として、日本社会では認知されていた。
だが、情報社会の進展とともに(インターネットの普及)、
後者Aの目的をもった読書が一般化している。情報誌の広がりもその傾向を表している。

西欧社会では、情報の獲得としての読書の手助けとして、巻末には、当然のごとくにインデックス(索引)が添付されている。目次のない本が存在しないように、ノンフィクションの書籍には、必ずといってよいくらい、巻末索引が用意されている。


インデックス・索引とは?

英国の索引規格 (BS3700:1988)によると、インデックス(索引)とは、索引項目が文書の何処にあるかをユーザーが見つけ出すために、組織的にアレンジしたもの、としている。

そして、そのインデックスを作る人をインデクサーと呼んでいる。

最近では、ホームページ上の索引を「WEBインデックス」と呼んでいる。それは、索引項目から、文書中の索引項目がある位置までジャンプできる機能(リンク)を使って、索引項目を列挙したページである。リンクページと言った方がわかりやすいだろう。


このページを文書として作成したリンクページサンプル

WEBインデックス@ A B
インデクサー@ A B C D
英国の索引規格@
索引@ A B C D
索引項目@ A B C
リンクページ@ A


巻末索引の作り方@

1)著者、編集者との打ち合わせ(索引設計:カテゴリー、索引項目順序、レイアウトなど)
2)電植データから電植コマンドを排除する
3)インデクサーによる索引項目のリストアップ
4)再度、著者・編集者との打ち合わせ(索引項目の確定)
5)索引のデザイン確定(項目数の絞込み)
6)索引作成作業
7)著者・編集者の校正(ページチェック)
8)版下作成(索引電植化)
9)2次利用(例えば、WEB掲載)


WEBインデックスの作り方

1)ページオーナー、編集者との打ち合わせ(インデックス設計:カテゴリー、インデックス項目順序、レイアウトなど)
2)HTML文書のタグ分析:リンク先の状況把握(文字列、画像、表など)
3)リンクページ作成(インデクサーによるインデックス項目:リンク元のリストアップ)
4)インデックスのスタイル確定
5)リンク付け作業(タグ挿入):A name=A href=
6)最終レイアウト版でのリンクチェック
7)2次利用(例えば、Site Map)


基本コンピュータスキル@

コンピュータ技術によって、インデックス作りは驚異的に楽になった。
殆んどのワープロに索引作成機能が入っている。
それを上手に使えばよい。

だがプロのインデクサーが楽になったかというと、そうでもない。
索引機能を使うにはかなりの前作業がいる。例えば、電植データのコマンドを外すノウハウがないと話にならない。
テキストハンドリングに習熟していることが大切になる。

ファイルやフォルダーの操作も重要である。
エキスプローラの操作にも習熟していなくてはならない。

WEBインデクサーともなれば、Windowsの基本操作に加えて、HTML文書の処理ノウハウが必修になる。
タグの変更処理が決め手である。
自由自在にタグの検索、置換えが出来なくてはならない。

要は、コンピュータスキルがインデクサーには絶対に必要というわけである。

それでは何を学べばよいかというと、下記に列記したようなものである。

ポイントは文書処理のためのプログラム言語であるが、VBAで十分である。
WordのVBAが一番よいが、はじめはExcelのVBAでもよい。

もうひとつ、文書構造の分析ツールとしてExcelのノウハウである。
ソート、フィルター、マクロなどである。

必修項目

1)ファイル・フォルダーの操作(名前変更、コピー、移動、保存、ファイル検索、連結など)
2)エキスプローラの操作
3)テキスト(txt文書)のハンドリンク:インデックス・索引項目のリストアップのため
4)HTML文書の構造分析:どんなタグが使われているかを調べるタグ分析
5)リンクページ作成方法:リンク元のページの作り方、リンク先の処理
6)TXT/HTML文書処理のために、Office VBAのノウハウ。勿論、他の言語でもよい。
7)Excelでのデータ処理(ソートなど)ノウハウ


基本コンピュータスキルA VBA

インデックス作りに道具が必要である。
その道具を作るのに「VBA(Visual Basic for Application)」というプログラム言語が適している。

VBAはマイクロソフトのOfficeに付随しているプログラム言語で、マクロ機能を通じて、簡単に習得できる。
勿論、Cとか、VBとかの言語を使っても良いが、文書処理のための道具であるから、ワープロと一緒に使えるVBA、それもWord VBAが最適である。EXCEL VBAでも良いが、表計算ソフトより、索引機能などを備えているワープロソフトであるWordの方が、圧倒的に使い勝手がよい。

例えば、インデクサーはキーワードが対象HTML文書に存在するかどうかを調べなくてはならない。
ファイルをオープンして、検索をして、また次のファイルをオープンして... そんなことを続けていては何時になったら終わることやら。
複数の対象HTML文書をフォルダーに集めて、一気にそのキーワードを持つファイルを探させる。
そんな道具をVBAで作るわけだ。キーワードの個数を知りたければ、VBAプログラムを修正して、直ちに、その個別ファイルごとの個数を書き出させる。

また、インデクサーは、気が遠くなるような回数のタグ挿入の操作を続けなくてはならない。
VBAプログラムで、一気に、キーワードの前後に開始タグと終了タグを挿入する。この道具もVBAで作ることになる。

マクロレベルでは、例えば、条件判断ができないので、一気に処理するわけには行かない。2回、3回と処理を分けて行うことになる。作成時間短縮には、どうしても、VBAでの道具つくりが必要になる。

タグの削除、変更など、自分だけの使いやすい道具を次々に作らないと、インデックス・索引作成は時間がかかる。当然、要求コストもどうしても大きくならざるを得ない。

実際に、VBAが使いこなせるには、かなりの時間がかかる。だが、当協会には、VBA講習会プログラムがある。1回3日間、3回シリーズの講習会(合計9回+1回)である。一般的なVBAクラスでは、学習期間が長くなりすぎる。インデクサー向けの専門VBA学習でないと短期習得は無理である。

当協会の講習会はインデクサー用のVBAツールの使い方を覚えるものである。プログラムの構造を知り、それを手直しできるようになる。

VBAスキルのポイントは下記のごときもの。

VBA必修項目

1)ファイル中の文字列検索
2)ファイル検索
3)タグの検索・置換
4)タグの挿入、削除、変更
5)タグの一括置換
6)文字列(インデックス項目)検索、切り出し
7)リンクページ、サイトマップの作成
8)VBAの基礎知識
9)インデクシングツール利用法


インデクシング ツール@ 検索語を含むファイルを検索する

ファイル検索のインデクサーの基本スキルである。
検索語(文字列)を含むファイルを検索することと、ファイル名検索の2つがある。

インデクサーにとって必要なファイル検索は、インデックスのキーワードが含まれているファイルを検索することである。

前回記したように、複数の対象HTML文書をフォルダーに集めて、一気にそのキーワードを含むファイルを探す。

以下は、Word VBAで記したファイル検索プログラムである。

Sub fileSearchString()

Dim i As Integer
Dim search_word As String

search_word = InputBox("検索語は?")

With Application.FileSearch

.LookIn = "C:\WINDOWS\デスクトップ\indexingTest"
.SearchSubFolders = True
.TextOrProperty = search_word
.FileType = msoFileTypeAllFiles
.Execute

For i = 1 To .foundfiles.Count

MsgBox .foundfiles(i)

Next i

End With
End Sub

使い方:
@Word VBAなので、ワード文書のVBAとして使用することが判りやすい。
Word文書を新規に作成し、このプログラムをマクロとして、登録する。
A.LookIn = "C:\WINDOWS\デスクトップ\indexingTest"
適切なフォルダー名に変更する。

VBAの基礎知識がないと意味不明だろう。
プログラムを書くことはさておき、使うことだけは、何とかできるようになってほしい。
勉強することは、「Wordマクロ」である。


インデクシング ツールA タグの検索・置換

インデクサーはワープロの検索・置換機能を十分に学んでほしい。しかし、ワープロがもつその機能では、例えば、条件判断はできない。どうしても、プログラムを書かなくてはならない。

VBAの基礎知識を学んだら、早速、プログラムを書き始めてほしい。

プログラムといっても、検索・置換機能が殆どで、あとは前回紹介したファイル検索である。

例えば、タグの変更は、削除を含めて、インデクシング作業の中では随時行われる。

通常は、タグそのものを検索し、置換する。
もし、文字列検索の後、その前後のタグ変更という場合ならば、文字列を含む前後のタグまで一気に置換すればよい。

基本的な検索プログラムと置換プログラムを紹介する。
慣れてきたら、一括置換()Global Replacement)プログラムを書くと良い。

Sub findTag()
'検索プログラム

With ActiveDocument.Content.Find
.ClearFormatting
.Text = "検索文字列"
.Forward = True
.Execute
End With

End Sub


Sub find&Replace()
'置換プログラム

With ActiveDocument.Content.Find
.ClearFormatting
.Text = "検索文字列"
With .Replacement
.ClearFormatting
.Text = "置換文字列"
End With
.Execute replace:=wdReplaceAll
End With

End Sub


インデックスの必要性:受信者から情報探索者へ

日本社会には、インデックスを必要としない仕組みがあった。情報は常にお上によってコントロールされ、そのナビゲーションもまた、お上が独占していた。国民は、それを良しとして、すっかり「お上情報」依存体質が身に着いてしまった。

ところが、インターネット時代が始まると、情報の受発信に大きな変化が出てきた。情報は自ら探すものという当たり前の考えに、あらためて気がつくようになった。情報公開の始まりである。

先ず、受信では、均一に与えられた情報を、受信者の目的に応じて、咀嚼、利用するのではなく、利用目的に沿って、受信者自身が情報を取りに行く必要が出てきた。受信者から情報探索者への変化である。

その時、多様な価値観をもつ情報探索者は、膨大な情報量の中でのナビゲーションを要求する。まさに、インデックスが必要になってきた。

例えば、新聞のテレビ番組の場合、メディア別の時系列番組情報にとどまっている。出演者インデックスというようなものはない。現行の新聞紙面では、このようなインデックスは不可能だが、インターネットのサイトでは可能になる。各メディア局がトライする価値はある。

発信についても、訪れた情報探索者へのサービスとして、サイトマップ、サイト内検索エンジン、インデックスを用意しないと、発信情報にたどり着いてもらえない。ページ内検索はブラウザーの機能で処理できるが、複数ファイルへの検索はサイト内検索エンジンがないとまず無理である。どのファイルを検索したらよいかも判らない。

海外の巨大サイトには必ずと言ってよいくらい、サイトマップがある。日本のサイトにはまだ少ない。官庁のサイトを訪れると良くわかる。例えば、首相官邸にはない。再編された省庁でサイトマップを持っているところは、総務省、法務省、農林水産省、経済産業省、国土交通省、厚生労働省。持たないところは、内閣府財務省文部科学省環境省

日本のサイトマップのレベルも低い。上記の官庁の場合も、情報の分析が不十分で、基本的に発信元別に終わっている。情報探索者の多様な検索には耐えられない。

インデクサーとしては、上記官庁へ、新設企画や改善提案を試みると良い。


サイト分析:ファイルマップ作成

クライアントからインデックス作成の依頼を受けたら、あるいは、サイトマップの提案をするには、先ず、サイト分析に取り掛からなくてはならない。

分析といっても、やることはサイトを分類すること。ファイルマップを作成することである。

タイトル、分類名、小分類名、更新日、ファイル名(URL)、情報源について、トップページから順に、Excelに入力してゆく。

ファイル名が不揃いのケースが良くある。httpのURLとファイル名が混在している。整理しながら入力をすすめる。基本的には、フォルダーとファイル名に統一する。当然、リンク先のURLはそのまま。

タイトルがなかったり、やたらに長いものがあるが、適切に処理する。

分類名は2段階で収めると良い。3段階がほしいときがあるが、できる限り避ける。
インデックスは大項目、中項目の2段階までにとどめる。

分類名の確定とは具体的にキーワード付与である。それが以外に時間がかかる。各ファイルをチェックしながら、そのファイルの分類名を確定してゆく。その際、仮の分類でもよいから、ブランクにしないことである。

この分類作業がインデクサーの腕の見せ所であるし、技量が問われる段階である。

このファイルマップが出来上がれば、後の作業としては、サイトマップならば、分析で得たワークシートから、タイトルとファイル名を取り出せばよい。タイトルインデックスならば、タイトルとファイル名を分類名によってよる並べ替えればよい。

索引やキーワードインデックスとなると、もう少し複雑な工程が必要になる。ファイルマップのほかに、索引項目、キーワードを本体(Entity)として属性分析をしなくてはならない。加えて、ラベル付与とラベルへのジャンプ(タグ挿入)である。

画像インデックス、人名インデックス、地名インデックスなど色々なインデックスが考えられるが、本体(Entity)の設定が変わるだけである。

おわり

メールでの質問大歓迎。


インデクサーのためのリンク集

The American Society of Indexers(ASI)
米国インデクサー協会

インデクサーとして、定期的にチェックするサイト。

Society of Indexers(SI)
英国インデクサー協会

Australian Society of Indexers (AusSI)
豪州インデクサー協会

Indexing and Abstracting Society of Canada / Societe Canadienne pour l'analyse de documents (IASC/SCAD)
カナダインデクサー協会

The-Indexer.com
プロのインデクサーのサイト。実務に使えるページばかり。

Nancy Mulvany Bayside Indexing Service
「Reference Books for Indexers」がインデクサーのブックマークとデスクトップ常備書を教えてくれる。


日本インデクサーギルド
Phone&Fax: 0466-37-0937