主なファイルフォーマット

Last update 96/11/30



はじめに

 インターネットで使われる主なファイルフォーマット(ファイル形式)の一覧です。拡張子のアルファベット順に並んでいます。筆者にあまり馴染みのないもの、最近すたれてしまったもの、パソコンでの扱いが不明なものも、一応参考のために載せています。

 どのソフトで作られるファイルか、どういうファイルであるかを示すとともに、どのOSでよく使われているかも併記しました。DOS/WindowsとなっているファイルフォーマットでもMacintoshでも使われていたり、逆にMacintoshとなっていてもDOS/Windowsで使われている場合もあります。

 ファイルがバイナリかテキストかの区別も併記しました。FTPでファイル転送をするときの参考にしてください。テキストファイルはテキストモードでもバイナリモードでも転送することができます(改行コードがおかしくなることがありますが)。しかし、バイナリファイルは、バイナリモードにして転送しなければなりません。テキスト/バイナリという表記は、どちらの場合もあることを示します。このときはバイナリモードで転送したほうが無難でしょう。

 FTPサイトに登録されている実際のファイルの拡張子は、大文字の場合もあります。

 対応ソフトは、一覧に挙げた以外にもあります。画像・サウンド・動画については、商品のソフトを含めれば多くのソフトで表示/再生が行えます。

 対応ソフトがどこにあるかはご自分でお探しください。付録CD-ROMにも一部は収録しましたが、これらのソフトはバージョンアップも頻繁に行われますし、所在もさまざまですからここには載せていません。

 各パソコン通信のライブラリを探せばあるでしょうが、せっかくインターネットにつながっているのですから、archieで探してみてはどうでしょう。ソフト名のうしろの括弧内に、archieで探す際のキーワードも載せました。部分文字列一致で大文字小文字の区別をしない設定を想定したキーワードです。ソフト名のうしろに括弧がないのは商品ソフトか、オンラインで入手が困難な、あるいは適当なキーワードをなかったものと思ってください。

 ここに掲げたソフトの中にはシェアウェアも含まれます。使って役に立ったら(きっと役に立つはずです)、作者に送金しましょう。

 付録CD-ROMに収録したものより新しいバージョンのものをオンラインで探すのが面倒な人は、「インターネットマガジン」のように、付録CD-ROMにこれらのソフトを収録している雑誌を購入するのも早道です。ただし、オンラインよりはどうしても遅れることは、承知しておいてください。


アーカイブ(書庫)/圧縮/符号化ファイル

 複数のファイルをひとつにまとめたものをアーカイブ(書庫)ファイルといいます。これを作るためのソフトがアーカイバ(書庫管理ソフト)です。多くのアーカイバは圧縮機能ももっています。

 よく使われるアーカイバ(カッコ内は拡張子)は、MacintoshではStuffIt(.sit)かCompactPro(.cpt)です。DOS/WindowsではPKZIP(.zip), UNIXではtar(.tar)です。日本のパソコン通信ではLHA(.lzh)がメジャーですから、その影響で日本のインターネット、中でもDOS/WindowsではLHA(.lzh)もよく使われています。

 プログラムや各種ビジネスソフトのデータファイル、画像、動画、サウンドファイルなどは、一般にバイナリファイルに分類されます。これらは印字不可能なデータ(バイナリデータ)を含むファイルだからです。対照的なのがテキストファイルです。これは印字可能な文字データ(と若干の制御コード)だけを含むファイルです。

 メールやNetNewsでは、バイナリファイルはテキストファイルに符号化(encode)して送ります。バイナリファイルは8bitデータを含むために、インターネットの通信路で送れないことがあるからです(メールやNetNewsの通信路は7bitデータなら大丈夫です)。FTPサイトにも符号化したファイルが置いてあります。符号化されたファイルはテキストファイルですが、エディタなどでみると文字化けしたようにみえるので、驚かないでください。

 インターネットはUNIXとともに発展してきた経緯があるので、UNIXで長く使われてきたuuencode方式の符号化がポピュラーです。DOS/Windowsのバイナリファイルを符号化するときはuuencode方式(.uuや.uue)がよく使われます。MacintoshではBinHexによる符号化(.hqx)がよく使われます。日本のパソコン通信ではISHによる符号化(.ish)がよく使われています。その影響で日本のインターネットでも使われることがあります。


復元/展開

 ファイルを入手したら、拡張子を一覧から探して対応するソフトで復元/展開を行ってください。

 .sit.hqxのように拡張子が複数ついていることがあります。この場合は右から順に処理していけば、元のファイルを復元できます。すなわち、まずBinHexの符号化を元に戻し、できた.sitファイルを展開するという手順になります。.tar.Zも同様にcompressによる圧縮を元に戻し、tarによるアーカイブ(書庫)をばらして取り出すという手順になります。.tar.gzはgzipによる圧縮を元に戻し、tarによるアーカイブをばらすことになります。

 .tar.Zは.taz、.tar.gzは.tgzとする慣習もあります。DOS/Windowsではファイル名に使える文字数が少ないので、.tar.Zや.tar.gzという拡張子をつけるのは困難です。これらの拡張子がついたファイルをDOS/Windowsのパソコンにファイル転送するときには、.tazや.tgzにする慣習にしたがったほうがいいでしょう。

Macintoshの場合

 StuffIt ExpanderとDropStuff with Expander Enhancer(以下ではStuffIt Expander with EEと表記)があれば、ほとんどのファイルの復元/展開が可能です。使用頻度を考えればこれで十分ですが、日本ではLHAとISHのペアも使われることがあるので、MacLHAとMacIshもあったほうがいいかもしれません。ほかはtar用にsuntarがあれば十分でしょう。

DOS/Windowsの場合

 これひとつというものはないので、それぞれ揃えなければなりません。しかし、使用頻度から考えると、pkunzipかunzip, gzip, uudx, LHA, ishがあれば十分でしょう。Windowsでは、WinZipが多くのフォーマットに対応しています。


uuencodeされたファイルの扱い

 uuencodeされたファイルは、いくつかに分割されてNetNewsに投稿されたり、メールで送られてくることがあります。もし複数に分割されている場合には、はじめに

	BEGIN---cut here---
	END-----cut here--- 
で囲まれている部分を切り出し、3分割されているなら1/3、2/3、3/3などとなっているのでエディタなどを使って、正しい順序で連結してください。こうして
	begin ??? filename
	end
で囲まれたひとつのファイルにまとめます。拡張子には.uuあるいは.uueを付けるのが慣習になっています。あとはこのファイルをuudecodeで復元するのがオーソドックスな方法です。でも、MacintoshならStuffIt Expander with EE、DOS/Windowsならuudxを使うと、BEGINとENDの間を切り出す手間が要らず便利です。


アーカイブの作成とバイナリファイルの符号化

 複数のファイルを送るときには、ひとつにまとめたほうが便利です。バイナリファイルなら符号化も必要です。以下の方法を参考にしてください。

Macintoshの場合

アーカイブの作成

バイナリファイルの符号化

DOS/Windowsの場合

アーカイブの作成

バイナリファイルの符号化


ファイルフォーマット一覧

.arc
 種別		PKARC, PKPAK, ARCによる圧縮ファイル(バイナリ)
 OS		DOS/Windows
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)
		DOS/Windows	pkxarc(pkxarc)
				pkunpak(pkunpak)

.arj
 種別		ARJによる圧縮ファイル(バイナリ)
 OS		DOS/Windows
 対応ソフト	Macintosh	DeArj(dearj)
				UNARJ(unarj)
		DOS/Windows	UNARJ(unarj)
.au
 種別		サウンドファイル(バイナリ)
 OS		UNIX
 対応ソフト	Macintosh	SoundMachine(soundmachine)
		Windows		WHAM(wham)

.avi
 種別		動画ファイル(バイナリ)
 OS		Windows
 対応ソフト	Macintosh	AVI->QuickTime(aviquicktime)
		DOS/Windows	メディアプレイヤー

.bin
 種別		MacBinaryファイル(バイナリ)
 OS		Macintosh
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)

.bmp
 種別		Windows, OS/2の画像ファイル(バイナリ)
 OS		Windows, OS/2
 対応ソフト	DOS/Windows	GV
		そのほか多くのグラフィックソフトで利用可能

.cpt
 種別		Compact Proによる圧縮ファイル(バイナリ)
 OS		Macintosh
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)

.doc
 種別		テキストファイル(テキスト)
 OS		どのOSでも
		ただし、OSによって改行コードが異なる
		この拡張子はMicrosoft Wordのファイルの場合もあるので注意

.eps
 種別		PostScriptによる画像ファイル(テキスト/バイナリ)
 OS		どのOSでも
 対応ソフト	多くのグラフィックソフトで利用可能

.exe
 種別		自己解凍(展開)型ファイル(バイナリ)
 OS		DOS/Windows

.gif
 種別		GIF画像ファイル(バイナリ)
 OS		どのOSでも
 対応ソフト	多くのグラフィックソフトで表示可能
		Macintosh	JPEGView(jpegview)
		DOS/Windows	GV

.gz
 種別		GNU Zipによる圧縮ファイル(バイナリ)
 OS		UNIX
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)
				MacGZip(macgzip)
		DOS/Windows	gzip(gzip)

.hqx
 種別		BinHexによる符号化ファイル(テキストファイル)
 OS		Macintosh
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)
		DOS/Windows	hqx(hqx.lzh)
				BinHex

.ish
 種別		ISHによる符号化ファイル(テキストファイル
 OS		DOS/Windows
 対応ソフト	Macintosh	MacIsh(macish)
		DOS/Windows	ish(ish)

.jpg
.jpeg
 種別		JPEG画像ファイル(バイナリ)
 OS		どのOSでも
 対応ソフト	Macintosh	JPEGView(jpegview)
				PixelCat++(pixelcat)
		DOS/Windows	GV
				lView(lview)

.lzh
 種別		LHAによる圧縮ファイル(バイナリ)
 OS		DOS/Windows, Macintosh
 対応ソフト	Macintosh	MacLHA(maclha)
		DOS/Windows	LHA(lha)

.mov
.moov
 種別		QuickTime動画ファイル(バイナリ)
 OS		Macintosh
 対応ソフト	Macintosh	SimplePlayer

.mpg
.mpeg
 種別		MPEG動画ファイル(バイナリ)
 OS		どのOSでも
 対応ソフト	Macintosh	Sparkle(sparkle)
		DOS/Windows	MPEG Player(mpegwin)

.pak
 種別		PAKによる圧縮ファイル(バイナリ)
 OS		DOS/Windows

.pdf
 種別		Acrobatによるファイル(バイナリ)
 OS		どのOSでも
 対応ソフト	Adobe Acrobat Viewer(Macintosh版、Windows版があります)

.pkg
 種別		AppleLinkパッケージファイル(バイナリ)
 OS		Macintosh
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)

.ps
 種別		PostScriptファイル(テキスト/バイナリ)
 OS		どのOSでも

.qt
 種別		QuickTimeによる動画ファイル(バイナリ)
 OS		Macintosh
 対応ソフト	Macintosh	SimplePlayer

.rs
 種別		Sunラスターファイル(バイナリ)
 OS		UNIX

.sea
 種別		自己解凍(展開)型ファイル(バイナリ)
 OS		Macintosh

.shar
 種別		UNIXのシェルアーカイブファイル(テキスト)
 OS		UNIX
 対応ソフト	Macintosh	unshar
		DOS/Windows	unshar

.sit
 種別		StuffItによる圧縮ファイル(バイナリ)
 OS		Macintosh
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)

.snd
 種別		サウンドファイル(バイナリ)
 OS		UNIX
 対応ソフト	Macintosh	SoundMachine(soundmachine)

.tar
 種別		tarによる書庫ファイル(バイナリ)
 OS		UNIX
 対応ソフト	Macintosh	suntar(suntar)
		DOS/Windows	kmtar(kmtar)

.tif
.tiff
 種別		TIFF画像ファイル(バイナリ)
 OS		どのOSでも
 対応ソフト	多くのグラフィックソフトで表示可能
		Macintosh	JPEGView(jpegview)
		DOS/Windows	GV

.txt
 種別		テキストファイル(テキスト)
 OS		どのOSでも
		ただし、OSによって改行コードが異なる
 対応ソフト	ほとんどのエディタ、ワープロソフト

.uu
.uue
 種別		uuencodeによる符号化ファイル(テキスト)
 OS		UNIX
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)
				uuUndo(uuundo)
				UULite(uulite)
		DOS/Windows	uudx(uudx) uuendoceするときはuuexを使う。

.voc
 種別		SoundBlasterサウンドファイル(バイナリ)
 OS		DOS/Windows
 対応ソフト	Windows		WHAM(wham)

.wav
 種別		Windowsサウンドファイル(バイナリ)
 OS		DOS/Windows
 対応ソフト	Windows		WHAM(wham)

.xbm
 種別		X-Windowビットマップファイル(バイナリ)
 OS		UNIXで使用
 対応ソフト	DOS/Windows	GV

.zip
 種別		PKZIPによる圧縮ファイル(バイナリ)
 OS		DOS/Windows
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)
		DOS/Windows	UnZip
				pkunzip(pkunzip)

.zoo
 種別		zooによる圧縮ファイル(バイナリ)
 OS		DOS/Windowsで使用
 対応ソフト	DOS/Windows	zoo(zoo)

.Z
 種別		compressによる圧縮ファイル(バイナリ)
 OS		UNIX
 対応ソフト	Macintosh	StuffIt Expander with EE(stuffit)
				MacGZip(macgzip)
		DOS/Windows	gzip(gzip)

文字と改行コードの変換

 テキストファイルは互換性の高いファイルフォーマットですが、UNIX, DOS/Windows, Macintoshの各OSで改行コードの扱いが違います。DOS/Windowsでは各行はCR(キャリッジリターン、Carrige Return, 16進数で0D)とLF(ラインフィード、Line Feed, 16進数で0A)の組で区切られます。UNIXではLFのみで区切られます。MacintoshではCRのみで区切られます。

 改行コードの扱いが違うとテキストファイルがうまく表示できない場合があります。違うOSのテキストファイルを読むときには、下記のソフトを使って改行コードの変換をしてから読むといいでしょう。このほかにも前述のuuencode/uudecodeやtar関連のソフトで、改行コードの変換までやってくれるものもあります。

 DOS/WindowsのCRLFと名の付くソフトはいくつもあり、中にはNECの98シリーズでは(少なくともぼくの98noteでは)動かないものもありました。98でも動いたのは、CRLF.ZIPの名前でftp.iij.ad.jpにあったものです(機能的にはシンプルですが、作業用ファイルが必要なことなど少し面倒な部分もあります)。

改行コード変換ソフト

	DOS/Windows	CRLF(crlf)
	Macintosh	CRLF(crlf)

 日本のインターネットでは歴史的経緯により、JIS, EUC, シフトJIS(MS漢字)の3種類の漢字コードがファイルに使われています。パソコンの場合はほとんどのソフトがシフトJISしか扱えません。したがって、漢字コードの変換をしてシフトJISコードにしてから読む必要があります。nkf、JCONV-DD以外にも漢字コード変換ソフトは多く存在しますから、自分が気に入ったものを使ってください。

漢字コード変換ソフト

	DOS/Windows	nkf(nkf)
	Macintosh	JCONV-DD(jconv)


ホットコーナーのトップページへ