理大の栞理大50周年



その1[情報の量]  解説

 

日本語1文字を表現するためには2バイトを必要とします。50GBのG(ギガ)は10の9乗(ゼロが9個ならぶこと)を意味します。したがって、「坊ちゃん」1冊の文字数を約88,000とすると、
 50,000,000,000÷(88,000×2)≒284,091
となります。
1冊の本の厚さを1.5cmと考えてこれを積み上げると、なんと4,261mにもなります。これは富士山(3,776 m)よりも高いことになります。
一方で、1枚の情報量が1MBのデジタルカメラ写真をブルーレイディスクに保存する場合を考えると、約50,000枚を収めることが可能となります。写真5万枚を積み上げても富士山には遠く及びません。このように、文字情報に比べて画像情報の量がいかに膨大であるかがわかります。

コンピュータの中では、情報を0(ゼロ)と1の組み合わせで表現します。これら0と1の2通りの表現が可能となるような、情報量の最小の単位をビット(bit)とよびます。この単位を用いると、2ビットでは0あるいは1の2通りの情報がさらにもう1つ加わり、合計4種類(2の2乗)、さらに3ビットでは8種類(2の3乗)というように、値が大きくなるにつれて扱うことができる情報量も増えてゆきます。
そして、8ビットになると、別の呼び方で表し、1バイト(Byte)といいます。
これは256種類(2の8乗)の情報を表すことができますので、英数字や通常用いる記号だけであれば、1バイトで十分です。しかしながら日本語は、漢字を含めると数千以上の文字があります。
したがって、日本語を表現するためには少なくとも2バイト(2の16乗=65,53通り)を必要とします。すなわち、400字詰め原稿用紙であれば、これ1枚に記録できる日本語の情報量は800バイトということになります。1枚が1,000,000バイトの通常のデジカメ写真と比較すると、文字情報がいかにコンパクトであるかがわかります。

 

ページTOP

岡山理科大学 kouhou(atmark)ous.ac.jp 086-256-8412
Copyright (C) Okayama University of Science.