【情報はどうやって記憶するんだろう】

更新日 1997年3月28日


人間は言葉を使い、それを文字や絵で記すことができます。だから書く道具さえあれば、それを書き込んでおくだけで、自動的にそこに記憶されることになります。ところが、コンピュータには言葉などありません。単なる電気仕掛けの機械ですから。さて、記憶とは一体なんでしょう。実は、普段何気なく使っている紙と鉛筆は、立派な記憶装置なんです。じゃあコンピュータは一体どうやって記憶するんでしょうか。その原理はとっても簡単ですから、これから説明します。

今ここに単純なチェックボックス があると、チェックマークを付けるか付けないかの二通りの状態がありますから、これを利用した情報伝達を考えてみましょう。肯定する場合はチェックし、否定する場合は空白とします。

  1. 私は男性
  2. 明日は休業日
  3. 買い物は済みました
  4. 電話がありました
  5. 電話して下さい
  6. 明日は自宅にいます

どのような用途に利用したとしても、何れも肯定と否定の二つの状態しかありませんね。単純なON/OFFのスイッチと同じですね。このようにスイッチが1個あるだけで、二つの状態のどちらかを誰かに伝達することができます。つまりこのスイッチ(ここではチェックボックス)は、二つの状態の何れかであることを記憶していると言えます。これも立派な記憶装置と言えますね。

コンピュータの記憶の原理はたったこれだけのことなんです。ただ、1個のスイッチだけでは二つの何れかであることしか記憶できないので、もう少し数を増やす必要があります。今度は8個のスイッチがあることにして、8個のチェックボックスを並べてみます。

1 2 3 4 5 6 7 8

8個というのは非常に重要な意味がありますが、それについては後で説明するとして、8個全てを使い、チェックをしたり取ったりすると、一体どれだけの組み合わせができるのでしょうか。計算できない場合は試してみて下さいね。但し、途中でわからなくなってしまうかも知れませんが・・・ まず、1個だけだと二通りでしたね。2個だとどうでしょうか。それでは3個だとどうでしょうか。もうお解りですね。2×2×2×2×2×2×2×2すればいいので、2の8乗通り=256の組み合わせができます。

1個だけだとたった二通りだったのに、8個集まると256通りもの組み合わせになるんですね。これならかなりの状態と言うか、情報が記憶できます。まず、これらの組み合わせに通し番号を付けることにします。通常コンピュータの場合はゼロから数えるので、0〜255の連番を割り振ります。チェックが1個もない場合を0にして、どちらかの端から反対方向に向かって順に付けたり消したりすると、次のように表現できます。下の例ではチェックを付けたら1とし、消したら0としました。

00000000
00000001
00000010
00000011
00000100
00000101
00000110
7〜252は省略
253 11111101
254 11111110
255 11111111

さて、256通りもの組み合わせがあるから、その決まった番号に決まった文字を割り振ったらどうでしょうか。そうすればその文字を組み合わせて言葉が作れますよね。ちょっと人間的になってきましたよね。まず、コンピュータは日本で開発されたのではなくて、英語圏で開発されたからアルファベットを割り振れば良かったんです。それに、記号とか数字もあるといいですね。そうやって、特定の番号に特定の文字(アルファベット、数字、記号)が割り振られました。それがアスキーコード表と呼ばれる割り振り表で、下の図のようになっています。

 
                               
                               
 
 
~  
                               
                               
 
                               
                               

アルファベットや数字、記号を割り振っても、まだたくさん番号が余っていたから、たまたま日本の場合はそこに五十音を収めることができました。とっても有り難いことですね。ラッキー!! ところで、まだまだ空白の所がたくさんありますね。そうなんです。文字が割り振られていない番号もあるんですが、このことはとっても大事なことで、後でもう少し説明を加えます。
 

スイッチ(チェックボックス)のON/OFFを8つ組み合わせることで、256通りの番号が作れて、それに文字、数字、記号を割り当てることができたのですが、実際のコンピュータの内部では、スイッチの機能をコンデンサーの電圧が高いか低いかで実現しています。これをメモリーと呼び、これがなければコンピュータは何も記憶することができません。さらにこれらの記憶は、電源が切られると全て忘れてしまうことも覚えておいて下さいね。

それから、この記憶装置に記憶する情報量には、コンピュータ用の単位が決められていて、たった二通りしか記憶できないスイッチ1個分の情報量を[ビット]と呼びます。そのビットが8個集まった情報量を[バイト]と呼びます。つまり1バイトは、キーボードに並んでいる文字1個を記憶することができる情報量なんです。そして、コンピュータの内部には物凄い量のバイト数を持ったメモリーが搭載されており、あまりの量なので、そのまとまった量ごとに単位が決められています。

  1. 1バイトが1024個集まると、1KB(キロバイトと呼びます)
  2. 1KBがさらに1024個集まると、1MB(メガバイト = 100万バイト)
  3. 1MBがさらに1024個集まると、1GB(ギガバイト = 10億バイト)
  4. 1GBがさらに1024個集まると、1TB(テラバイト = 1兆バイト)

このように1024倍ごとに呼び方が決められていますが、これは周波数の単位と同じですね。ところで日常では、1000を1K(キロ)と呼んでいるし、1024も1000も大した違いはないので、大ざっぱに千倍ごとだと考えてもさほど支障はありません。コンピュータの最小情報単位がビット(たった二通りの情報)で、2のべき乗(2の10乗=1024)で計算されたから、そうなったようです。
 

漢字は数が多いために、256通りの番号ではとても割り振りできません。そこで、1バイトを二つ使うと256×256=65536通りの番号が作れますから、この番号を使うことにしました。ところが、漢字かそうでないかを見分ける必要があるため、最初の1バイト目は、文字も記号も数字も割り振られていない、空いている番号しか使えません。続く2バイト目は、最初の1バイト目で既に漢字かそうでないか判っているので、256通りのどれを使っても構わない訳です。

このように漢字に割り振られた番号を[2バイトコード]と呼びます。それに対して、1バイトで表現できる文字、数字、記号の番号を[1バイトコード]と呼んだり、[キャラクタコード]と呼んだりします。だから、1バイトの番号に割り振られた、何らかの文字のことを[キャラクタ]と言います。また別の表現で、2バイトコードで示す漢字のことを[全角文字]と呼んだり、1バイトコードで示す文字を[半角文字]と呼んだりします。色々な表現があって紛らわしいですね。それにもっと紛らわしいのは、全角文字を総称して[漢字]と呼んでしまうこともあることです。例えば、平仮名や片仮名やアルファベットなのに、全角文字であったがために、それらも[漢字]の仲間として扱われるのです。
 

1バイトの情報が何らかの目的で複数集合した塊のことを、[ファイル]と呼びます。そして、その塊の中身が全て文字、数字、記号、漢字だけ、つまりちゃんと読める内容だけで構成されたファイルのことを、さらに分類して[テキストファイル]と呼びます。それに対して、中には読めるテキストの部分も所々あるけれど、文字、数字、記号、漢字以外のコード(文字が割り振られていない番号)がごっちゃになって含まれているファイルのことを[バイナリファイル]と呼びます。この違いをはっきりと区別できなければ、パソコン通信やインターネットの電子メールの仕組みが理解できません。

電子メールでは、単なる読める文書(テキスト)だけの送受信だけでなく、画像情報やプログラムなどのバイナリファイルだって送受信できるんです。自由自在に両方の情報をやり取りできれば、電子メールの利用価値が、さらに大きく広がることになりますね。
 

コンピュータ本体の中にメモリーと呼ばれる記憶装置があるから、情報を記憶できることが解りましたが、この情報は、先に述べたように電源を切ると全て消えてしまいます。このメモリーのことを[主記憶装置]とか[本体メモリー]と呼びますが、この装置は超高速で書き込んだり読み出したりできます。唯一の欠点は電源を切ると消えることですね。これでもうお分かりのように、普段電源が入っていない間は、内容は空っぽなんです。じゃあ、大切な情報はどうやって保存されるんでしょう。電源を入れる度に毎回空っぽでは困ってしまうので、それを補うための、電源を切っても消えない記憶装置が必要なんです。このような記憶装置のことを[補助記憶装置]と呼びます。

補助記憶装置には非常にたくさんの種類がありますが、最もよく使われていて、今ではなくてはならない存在になったのが[ハードディスク]です。その他にも色々な補助記憶装置があるので、ご紹介しておきますが、これらは全て、電源を切っても記憶されている内容は消えません。

  1. フロッピーディスク
    現在は3.5インチが主流で、1.44MB と 1.25MB の記憶容量のものが殆どです。一般に世界中で使われているのは 1.44MB で、1.25MB は主にNECのパソコンで古くから使われています。また、その半分の容量の 720KB や 640KB のフロッピーディスクもありますが、今では主にワープロ専用機で使われるだけになっています。厳密には、フロッピーディスクにはもっともっと種類があるのですが、ここでは省略しておきます。
     
  2. CD−ROM(コンパクトディスク)
    これは音楽用のCDと外見も中身も殆ど似たようなもので、書き込むことはできません。読み取り専用だからROM(リード・オンリー・メモリー)が付きます。この記憶容量は何と約640MBもの情報が記憶できるんですよ。
     
  3. MO(光磁気ディスク)
    現在は3.5インチが主流となり、外見はフロッピーディスクとそっくりでちょっと厚いだけですが、その記憶容量は何とフロッピーディスク数百枚分に相当します。128MB、230MB、540MB、640MBなどがありますが、読み書きの速度は、フロッピーディスクより遙かに速く、ハードディスクよりちょっと遅いですね。今後はもっともっと大容量で高速な読み書きが可能になるでしょうね。
     
  4. リムーバブル・ハードディスク
    差し替え可能なハードディスクで、記憶容量はメーカーによりまちまちですが、本体に内蔵されているハードディスクと同等程度の読み書き速度が期待できます。その上、差し替えることができるので、同じコンピュータ本体を使いながらも、目的別やOS別にコンピュータを使い分けることもできます。差し替えるハードディスクの容量は、そのドライブによってほぼ一定です。
     
  5. PCMCIAカード型ハードディスク
    ノート型コンピュータなどのカードスロットに差し込んで使えるハードディスクで、リムーバブル・ハードディスクのように差し替えが可能ですが、超小型ハードディスクのため、読み書きの速度は普通の内蔵型ハードディスクほど期待できません。また、記憶容量も多くは望めません。
     
  6. ZIP
    フロッピーディスクとよく似ており、MOとも似ていると言えますが、フロッピーディスクよりもかなり高速に読み書きできます。1枚の記憶容量が100MBのものが一般的ですが、ドライブが低価格のために、手軽な増設機器として人気があるようです。
     
  7. CD−R(書き込み可能なコンパクトディスク)
    外見はCD−ROMと殆ど同じですが、CD−ROMの記録面が銀色に対し、CD−Rの記録面は金色です。CD−ROMのように大量生産は必要ないけど、CD−ROMドライブで読めるメディアを、小枚数作成したい場合に重宝されています。現在の市販パソコンの殆どがCD−ROMドライブを内蔵していることを考えると、最も互換性が高い書き込み可能なメディアといえるでしょう。
     
  8. DVD−ROM
    外見はCD−ROMと殆ど同じですが、その記憶容量は4.7GBもあり、CD−ROMの約7倍もあります。将来はCD−ROMに取って代わると考えられますが、もう少し先のことになるようですね。現在既に製品化されて販売されていますが、まだまだ普及には至っていません。近い将来は書き込みができるものが登場し、ビデオ代わりに使えるようになるでしょうね。
     
  9. PD
    外見はCD−ROMと殆ど同じですが、CD−ROMの記録面が銀色に対し、PDの記録面は金色です。この装置で記録された内容は、残念ながら通常のCD−ROMドライブで読み込むことができません。同じPDのドライブで読む必要があります。CD−ROMと同等の640MBもの情報を記録できますが、書き込み速度はハードディスクやMOよりかなりより遅く、フロッピーディスクよりは速いですね。互換性の問題もあり、あまり普及していません。
     
  10. 磁気テープ
    ドライブそのものは以外と低価格なんですが、その読み書き速度が遅いのと、部分的な読み書きに向かないため、もっぱらハードディスク全体のバックアップ装置として使われることが多いようです。これもパソコン利用者にはあまり人気がありませんね。

ざっと拾い出しただけでもこんなにも種類がありますが、これらに記録された内容は、電源を供給していない状態でも消えることはありません。このような補助記憶装置がなければ、コンピュータもあまり役に立たないかも知れませんね。それぞれに、価格面や読み書き速度、取り扱い易さ、他のコンピュータとの互換性など、様々な要素を考え、目的にあった装置を適材適所に使う必要があります。


電気仕掛けの機械であるコンピュータが、一体どうやって情報を記憶するのか、その単純な原理はお分かりいただけましたでしょうか? 要点としては、電源を切ったら全て消えてしまうけど、超高速で読み書き可能な[主記憶装置]と、電源なんか無くてもずーっと記憶しててくれる[補助記憶装置]があり、その両方があるからこそ、両者が互いの欠点をカバーしながら動いていることです。