Registered at Jan 10 2007

Excel孫の手−93


	

「OCRをEXCELに活かす」

 Q.今回は、少し毛色が違った難問なんです。    手間さえかければできるのですが、・・・・。  A.入力どっさりパターンですか?  Q.図星!です。さすが〜っ。  A.古いデータの整理とか、・・・。  Q.またまた、図星。凄い。    やっぱり、亀の甲より何とか・・・  A.なんか言いました?  Q.いえいえ、・・・。さて、と。    実は、昔の担当者が残した売上の記録を調べていたら、電子データの形で残って    いないものがたくさん見つかったんです。    で、それを、今後のために「電子ファイル化しろ」というんです。  A.どの位あるんですか。  Q.A4サイズの紙で、数百ページです。正確には数えてはいませんが、コピー用紙    の一束を基準としたら、五束くらいです。  A.そりゃあ、大変な枚数ですね。二千枚は下らないでしょう。    コピー用紙の一束は500枚ですから、多少ゆるめになっていたとしても、大変    な量ですよ。    でも、ですね、今は良い時代になったんですよ。OCRを使えばいいんです。  Q.OCRって、なんでしたっけ。  A.Optical Character Readerの略で、光学読み取り装置    と呼ばれています。昔のOCRは、文字通り文字だけを読みとっていました。    しかも、それは専用機で、専用のカードに読みとりやすいように印をマークして    してあげなければならない手間のかかる機械でした。    でも、今はスキャナーを購入するとOCRソフトがついてくるんですから、時代    の進み方の速さを感じてしまいます。    さて、スキャナー単体では、紙の上のいろいろな文字も絵も、全て一枚のイメー    ジでしか有りません。OCRソフトは、そのイメージの中にこれが文字だな・こ    れが線だなと言うように、自分で判断しながら、データにしていってくれるんで    す。    そして、最近の高性能なOCRソフトは、エクセルのような表そのものを読みと    ることができる上に、エクセル形式でデータを書き出してくれます。    また、スキャナーもオートフィード機能と言って、シートを纏めてセットしてお    くと、自動で連続して紙を送りながら、データを作り続けてくれるまでになって    来ています。  Q.ということは、ほとんど人手をかけずに、紙の表データがパソコンに取り込める    んですね。いやぁ、凄い時代になってきているんですね。    連続して処理する上での注意点を教えてください。  A.データの区切り毎に、パソコン上に生成されたデータも、区切って保存すること    は勿論ですが、一つの区切りが大きすぎる場合は、更にパソコンの処理能力に見    合った区切りをつけてあげましょう。    スキャナーはオートフィードが可能なタイプを選択することと、OCRソフトは    読み取り率の高いものを調査してから購入することですね。  Q.データがきっちりと取り込めたか判断する方法はありますか。  A.とても重要な質問ですね。素晴らしい着眼点です。    これは、目でチェックするしか方法がないと思いがちですが、エクセルならでは    の特性を活かして、チェックします。    手間としてはもったいないようでも、一度読みとったデータを、もう一度別のエ    リアに別データとして、再度OCR機能で取り込みます。    同じページ同士を、一つのブックにします。シート二枚のブックができます。    更に白紙のシートを挿入して、そのシートには計算式で最初のシートから次のシ    ートを引き算するようにセットします。    シート全体を引き算すれば、データが同じであれば、全部「0」になるはずです    から、チェックは容易です。  Q.わっ、作業量は膨大ですね。    でも、最初から式をセットしたシートと白紙二枚のブックを作っておいて、その    白紙のシートに、目的のシートをコピーすれば、その瞬間にチェックは完了しま    すね。  A.その通りです。これであなたの仕事量は、激減します。


Return to TOP