図書館員のコンピュータ基礎講座

資料デジタル化のヒント

【2014-06-22更新】

このページでは、ブックスキャナ等を用いた資料のデジタル化に関するヒントを紹介しています。資料デジタル化の方法については、まず「国立国会図書館資料デジタル化の手引2011年版外部へのリンク」をご覧になることをお勧めします。

画像サンプル

「国立国会図書館資料デジタル化の手引2011年版」の4章「画像データの品質検査」では、画像データの品質検査について記述されています。

デジタル化作業の実施業者を決定する場合にも、品質確認のために、各業者に次の画像をサンプルとして提出してもらうのが良いでしょう。

  1. 資料をスキャンした画像
  2. 試験標板をスキャンした画像

資料は、実際にスキャンする対象に近いものを用意するのが良いでしょう。しかし、複数業者にサンプル提出を求める場合は、厳密な比較のために、同じ資料を複数用意する必要があります。自館で刊行した資料があれば、複数冊用意できると思います。

資料をスキャンしたサンプルで確認すべき点の1つは、厚い資料がうまく再現できるかです。特に、ノド元の文字の再現性を確認します。ノド元の文字は斜めになった状態でスキャンされると、(縦に)細く写ることがあります。また、影や光の反射の影響で識別しづらくなることもあります。

ポイント
ブックスキャナの中には、スキャンしている部分にあわせて上部のライトが首を振る形で動き、スキャン部分のみを照らすタイプのものがあります。
このタイプのブックスキャナは、スキャンの場所によって光と紙の角度が変化するため、明るさにムラが発生することがあります。特に、ノド部分は暗く、その横(紙が曲がっている部分)は明くなる傾向があり、その部分の文字の可読性に影響を与える場合もあります。

ノド部分の明暗の状況を確認するには、厚めでノドのところまで写真が印刷されている写真集や写真雑誌(光沢紙を用いているもの)でサンプルを作成してもらうと判断しやすいと思います。

色の再現性など、それ以外の検査すべきポイントの多くは、試験標板をスキャンした画像で確認できます。

画像品質の数値化と限度見本

画像の品質には数値化可能なものと困難なものがあります。

数値化が可能なもの

  • 傾き
  • 色調
  • 明暗

数値化が可能なものの中には、計測に大きな作業量を要するものがあり、計測値の提出を求めると費用が膨大になることがあるので、注意が必要です。

数値化が困難なもの

  • 裏写り
  • ゴミ、汚れ
  • ノド元の可読性
  • 光の反射
  • ピンボケ
  • モアレ

数値化が困難なものについては、限度見本などを作成しておくと良いでしょう。
例えば、ピンボケに対する限度見本は、同じ文章を少しずつボケのレベルを変えて作成した画像を並べる方法が考えられます。
下記の限度見本の例は、この方法で作成した限度見本を、当サイトで掲載するために縮小したものです。参考程度にご覧ください。

限度見本の例

ピンボケの確認

デジタル化した資料の画像がピンボケしていないかを確認するには、資料と見比べるのが一番ですが、大量の資料をデジタル化する場合には、そうもしてられない場合があります。

古い資料は、印刷技術が十分発達していなかったため、文字がボケたり二重になって印刷されているものもあり、文字のシャープさを見て画像(スキャン)のボケ具合を確認できない場合があります。そのようなときには、資料のエッジの部分(小口、天、地の紙の端のライン)のシャープさを確認します。
その際、例えば、右上はシャープだけれども左下はボケているということもあるので、全辺のエッジを確認しましょう。

また、スキャナの被写界深度が浅いと、手前(印刷面)はシャープだけれども、奥(表紙に近い面)はボケていることもあります。その場合は、当然、印刷面のエッジを優先してシャープさを判断します。

さらに、厚い資料、ノドの開きが悪い資料、ノドの奥まで印刷されている資料は、ノド部分の文字がボケている場合もありますので、エッジに加えて、ノド部分の確認も必要です。

なお、画像上の文字の再現性を確認する際には、濁点・半濁点(特に、ルビのそれら)の再現性を見るのが有効です。

スキャナ/カメラの揺れ

ブックスキャナ(およびデジタルカメラ)には様々な方式のものがありますが、最も一般的なものは、資料を置く撮影台を含む土台に、上方向に伸びる支柱が固定されており、その支柱の先にスキャナやカメラを設置するオーバーヘッド方式または平床式と呼ばれるものでしょう。
資料デジタル化の作業には、資料を置く、ページをめくる、ガラスで抑える、スキャンボタンを押すなどの動作が伴います。これらの動作により支柱が揺れると、画像にブレが発生するため、支柱が揺れない(つまり、スキャナやカメラが揺れない)機器を採用することが重要です。

難易度の高い資料

ノド部分の撮影

グラフィカルな雑誌は、絵図や文字がノドの奥まで印刷されていることが多く(特に、見開き両ページにまたがって図版等が掲載されている場合に多い)、デジタル化時にそれらの重要な情報をすべて捕捉することが困難な場合があります。特に製本された雑誌は、製本の厚み、ノドの開き具合、製本時の背の裁断処理などにより難度が高くなります。
背を裁断し、ページを完全に切り離してデジタル化するのが望ましいですが、資料保存の観点、作業の複雑化などの理由で、課題も大きいです。

注:解体作業が必要。また、オートフィーダ機能を利用しない場合、人間がページの裏表などの順序を間違えずにデジタル化するにはかなり慎重な作業が必要となる。

裏抜け

印刷物のインクが紙の裏側まで浸透することを裏抜けと呼びます。裏移りや裏写りと呼ばれることもありますが、一般的には、裏移りは、印刷された紙のインクが乾かないうちに別の紙が重なることで発生する汚れを指し、裏写りは、表裏とも印刷した紙が薄いなどの理由で裏の文字や絵が透けて見えることを指します。
特に漫画雑誌等によく利用されている青インクは経年による裏抜けが多く発生することが知られています。裏抜けが進行すると、文字や絵が表面のものなのか裏面のものなのかを区別できなくなり、読むことが困難になることがあります。裏抜けした資料の完全な復元は困難なため、裏抜けが発生する前に撮影することが重要です。
撮影の難易度が高い資料というよりは、留意が必要な資料に関する話ではありますが、ここで紹介しておきます。

裏抜けが目立つページの画像 表面 裏抜けが目立つページの画像 裏面 裏抜けが見えなページの画像
週刊少年チャンピオン 秋田書店, 1979年10月22日 11巻45号(通号518号)より引用。左から、p.191 (「みだらな関係」マキ・万[著])、p.192 (同)、p.91 (「月とスッポン」柳沢きみお[著])
同じ号に掲載された漫画でも、使用されているインクによって裏抜けの状態が異なることがわかる。

その他

図書の場合、厚いもの(10cmを超えるもの)、大型のもの、折りこみ図・付箋などがあるもの、裏写りするもの、グロス系の(光を反射する)紙を使用しているもの、著しく劣化(酸化など)しているものなどは難易度が高いです。

横長・横開き資料

【2017-05-22更新】

ブックスキャナの多くはA3を少し越えるサイズまでに対応しています。横長・横開きで、開くとA3を越える資料は、A3対応ブックスキャナでは見開き撮影ができません。その場合、費用的な観点から1ページ1コマで撮影することが多いです(従来のマイクロ・フィルムによる撮影も同じ方法を採用していることが多い)。また、経験的に、世界的には資料のサイズ等とは無関係に1ページ1コマ方式の撮影を行っているケースの方が多いのではないかと思います。

しかし、絵本の場合、横開きのものが少なくなく、絵が左右のページにまたがって描かれているものや、左右ページを行き来してストーリーが展開するものなどがあり、見開きでないと意味をなさないものも少なくありません。絵本だけでなく、写真集や漫画などにも同じようなケースがあります。

対応策は、より大きな資料を撮影できるスキャナを採用するか、2コマの画像を並べて表示できる機能を表示用のシステムに導入することでしょう。資料の大きさではなく内容によって撮影方法を変えたり、特殊な仕様のスキャナを採用するとことは費用がかかるため、システムの機能で実現する方がコストパフォーマンスは良いです。もちろん、貴重書や特別な理由がある場合は大判資料に対応したスキャナを採用する方が良いでしょう。

スキャナとデジタルカメラ

スキャナとデジタルカメラはデジタル化の原理が異なりますが、私見では、画質に大きな差はないと思います。

デジタルカメラに関して特筆すべきと思われる点は、次のとおりです。

  • ほとんどの場合、スキャナよりも1コマあたりの撮影速度が速いです。ただし、デジタルカメラは、撮影後にRAW画像を現像するのに時間を要する場合があります。
  • カメラに装着してデジタルカメラにすることができるデジタルバックと呼ばれる機器もあります。
    プロなどが使用する中判カメラや大判カメラは、以前は、フィルムバックと呼ばれる機器を装着してフィルム撮影を行っていました。その代わりにデジタル化を行える機器を装着するようにしたものがデジタルバックです。
  • デジタルカメラがシャッターを切ることができる回数には上限があります。その上限を超えると、カメラを取り替える必要があります(途中でオーバーホールも必要)。高精細デジタルカメラの調達には日数と費用が必要なため、極めて大量のデジタル化を行う場合には、注意が必要です。
  • デジタルカメラの解像度は、スキャナのような相対解像度(例:400ppi)ではなく、縦×横のピクセル数(例:1920pixelx2560pixel)という絶対解像度で表します。デジタルカメラの相対解像度は被写体からの距離によって変化しますので、特定の相対解像度を保持することが重要な場合には(文字の可読性を担保するためには相対解像度は重要)、その解像度が得られる位置でカメラを固定する必要があります。

ポイント
ブックスキャナに搭載されている特殊な(色調、明暗、シャープネス等以外の)補正機能には次のようなものがあります。デジタル化の前に、これらの補正の採否を検討する必要があります。

  • (原稿の)歪み・傾斜補正
  • (ノド周りの)文字縮み補正
  • (ノド周りの)影除去
  • 枠消し(原稿周りの枠(背景など)を削除)
  • 指消し(紙を押さえる時に写りこんだ指を削除)
  • センタリング

貴重書のように、文字や絵などの内容のみでなく、物としての姿形や質感も重要である場合は、上記のような補正は行わない方が良いでしょう。

ポイント
多くのブックスキャナは、資料をガラスで押さえる仕組みをもっており、このガラスの下面(資料と接触する面)に撮影の焦点が合うように設計されています。
このガラスは通常、脱着可能です。ガラスの使用は、資料を破損させる危険性がありますが、品質の良い撮影を効率良く行うためには有効です。ただし、手稿や彩色資料などは、ガラスの接触がインクや顔料に影響を与えることもありえるので、資料によってガラス使用の可否を決定する必要があります。
多くのブックスキャナには、資料を置く台の中央に幅が調整できる縦の溝が設けられており、そこに本の背をはめ込んで設置することで、ガラス押さえによる資料への負担軽減を図っています。また、ブック・クレイドルと呼ばれるV字の台に資料を置き、左右のカメラでそれぞれ片ページを撮影する(後で、見開き撮影したかのように合成可能)タイプもあります。
通常、ブックスキャナの上部にはカメラやライトが配置されています。ガラスを使用する場合には、これらの機材や作業者が写り込まないよう、低反射ガラスを採用したブックスキャナが望ましいです。ガラスの下に黒い紙のみを置いてサンプル撮影を行うと、ガラスの反射性の確認に有効です。
また、ガラスには多少色が入っていることがあるため、画像の色調整が必要な場合もあります。

ちなみに、Google画像検索外部へのリンク等で「bookscanner」というキーワードで検索すると、様々な種類のブックスキャナの画像を見ることができます。

プリントアウトの文字再現性

一般的に、スキャンした資料を一般的な事務用のレーザープリンタでプリントアウトすると、文字の再現性は低下します。

下記の画像は、次の方法で作成しました。

  • 画像1: 資料を、一般的なフラットベッドスキャナで、400 ppiでスキャン
  • 画像2: 同じ資料を、一般的な事務用コピー機で等倍コピーし、それを1と同じ条件でスキャン
  • 画像3: 画像1を一般的な事務用レーザープリンタで400 dpiでプリントアウトした紙を、1と同じ条件でスキャン
画像1 画像2 画像3
「現代こよみ読み解き事典 / 岡田芳朗, 阿久根末忠編著. 柏書房, 1993.3, p.183」から引用

画像2は、画像1よりも文字の再現性が少し低いですが、その差は大きくありません。画像3は、文字の再現性がかなり低下しています。
つまり、資料をスキャンした画像とコピーした画像との品質の差は限定的だけれども、スキャンした画をプリントアウトすると品質がかなり低下することになります。

言うまでもなく、最終的な品質は各機器の性能に依存するため、一般的な機器を用いた場合にこのような結果になる傾向にあるとご理解ください。
十分な解像度でスキャンされている場合には、高性能(高解像度)なプリンタを用いたり、印刷用紙を大きくすれば、文字の再現性は向上します。また、シャープさやコントラストを補正することも有効ですが、過度な補正により階調が減少し、写真などの自然な濃淡が表現できなくなる可能性もあります。

関連ページ
ページのトップへ
CyberLibrarian : tips on computer for librarians, 1998-