Excel による大量データ分析

作成日:2003/01/10


筆者はExcelは仕様上おかしなところがあったり、信頼性が低いため 普段ほとんど使わないのだが、ピボットテーブルなど一部便利に使える機能があるため捨てきれないでいる。

そのピボットテーブルだが、たとえばExcelでは行数が約65000行を超えるシートを扱えないなどで、全社的なデータを分析しようとかするとExcel単体ではすぐに破綻してしまう。 ではどうするか?

大量データを扱う場合、その個々のデータそのものには用がなく集計結果などが必要になる場合がほとんどである。 たとえばピボットテーブルを使う場合、パソコンにAccessが入っていれば、データをAccessのテーブルとしてしまう。 Accessの場合は行数にはとくに制限はなく、データベースサイズが2Gbyteまでなら扱うことができるので、大量データを分析する場合Accessのテーブルとして作成したほうが扱いが容易になる。 そうして作ったAccessのMDBファイルをエクセルから参照すればよい。 ピボットテーブルの場合はピボットテーブルを作成する途中で聞いてくる 『データのある場所』でExcelのシートを指定せずに『外部データソース』を指定し、AccessのMDBファイルを開き該当テーブルを指定する。 すると元データが大量であってもピボットテーブル化ができる。

ただし、この場合Excelの裏側でガリガリとMDBのテーブルを集計しているので、データの量が増えるに従い、結果が出るのに時間がかかってしまう。 さらに莫大なデータを扱う-たとえば数百万件-場合、SQL Serverの7以降ではOLAPサービスがあるので、あらかじめ分析するピボット(軸)でファクトテーブルを作成しておき、Excelからは外部データソースでOLAPキューブを指定すればあらかじめ集計されたデータ(キューブ)を参照するので高速に結果を照会・分析できる。

データベースソフトを個人で活用している人はほとんどいないと思われるが、大量データを扱う場合検討してみる価値のあるソフトだと思う。とりあえず何でもエクセルでしようとせずに、アクセスを使ってみてはどうだろう?


前へ| 次へ
コンピュータの部屋
トップページ