ファイルの圧縮と解凍: 原理、種類など

UB3/informatics/basics/archive

このページの最終更新日: 2023/02/14

  1. ファイルの圧縮

広告

このページは米村貴裕様 [博士 (工学)] に執筆頂いた依頼記事です。

ファイル圧縮

インターネットを閲覧していれば、「圧縮」技術の恩恵をまず「100%」受けている。とくに画像や動画、音楽を楽しんでいたら、画像ならJpeg形式、Png形式、動画ならMp4形式やWMV形式、DVD/Blu-ray/レコーダーでも使われているMpeg2/4形式、音楽は未だちょっと古い形式のMp3形式で「圧縮」されていることが、ほとんどだ。

こんな圧縮とは、そのままの意味で、普通なら大きなサイズになる情報(データ)を、ふとん圧縮袋のようにサイズを小さくし、すばやく、かつ扱いやすくするものである。データのサイズが小さければ、インターネットを使ったデータの送受信も速くなる。 そして圧縮の反対は「解凍」と呼び、小さなサイズに圧縮したデータを、普通に使えるよう元に戻すことを示す。

圧縮の考え方は、たとえばFAXが使う「ランレングス法」だと、「AAAAABBBAAAA」というな、文字の列(データ)があったとしよう。通常なら1文字1バイトのサイズなので、12バイトの容量が必要になる。 しかし「A5B3A4」(Aが5文字、Bが3文字、Aが4文字という意味)との処理をしてやり取りすれば、データのサイズは6バイトで済み半減させられる。圧縮率50%。

ただ、圧縮されたデータは特殊なので、そのままではソフトウェア等で使えない。そのため「解凍」作業で、Aが5文字……と、いう具合に元の状態や並び方へ戻す。さらに重要な点は、圧縮には2つの形式があること。可逆圧縮形式と不可逆圧縮形式だ。 情報を圧縮しても、完ぺきに元の状態へ戻せる形式が前者で、いったん圧縮したら元の状態には戻せないのが、後者となる。

コンピュータプログラムやソフトウェア、作成した文書データなど、1文字でも違うものに変わってしまうと大変なデータは、必ず可逆圧縮形式のLHA形式か、ZIP形式(主流となりつつある)の圧縮形式を使う。

では、完全には元にもどせない、不可逆圧縮形式の利点とは何か?

それはひと言、高い圧縮率に尽きるだろう。音楽データでは元のデータサイズの15%程度にまで圧縮しても、元のデータとの差異は、ほぼ感じられない。人間の目や耳は、細かく変化する=高周波部分は、変化に気づきにくいから不完全でも、ごまかせるのだ。 さらに動画になってくると、30FPS(1秒間に30回画面が変わる)が一般的だが1つ前の画面と1つ先の画面との「差」は小さいことが、ほとんどだ。よって動きの小さい(少ない)画面(フレーム)同士を比較し、あいまいに保存したり、動きのほとんどない部分を機械的に「カット」したりして、動画データのサイズを小さく圧縮するのだ。

アーティストの一部は「生」のデータではないと、怒ったものの、ユーザが認めて現在へ至っている。その他、データの未来予測など圧縮技術向上がストリーミング(音楽・動画のインターネット配信)を可能にした。インターネット閲覧用のブラウザは、送られてくる圧縮されたデータを、ひたすらに「解凍」し、表示画面を作っている。

なお、画像や手描きイラストを高解像度で使う場合は、可逆圧縮形式だとノイズや、にじみが出るときがあるため、あえて使わないこともある。


広告

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。

References