ハール変換と画像処理

【数学科】藤田 景子

この原稿の依頼を受けたときに画像処理に関係するハール変換の話を書こうと考えていた。 画像処理の話といっても筆者は画像処理の専門家ではない。 それで、先日も 書類(下図左)にサインをしてスキャナーでPDFファイルに変換しようとしたところ 書類のマークが消えその原因が分からず困った。 他の方のPDFファイルを見ると ちゃんとマークが残っていたので、どのようにしてPDFファイルに変換したか尋ねたところ グレースケールでスキャンしたとのことであった。 筆者のスキャナーの設定を確認したら 白黒とカラーの自動識別の設定になっていた。かなり古いスキャナーなので性能が悪いためか マークの色が白と認識されスキャナーが白黒画像と判定して スキャンされたためマークが消えたようである(下図中央)。自動識別を カラーモードに変更してスキャンしたら色が薄くなったがちゃんとマークが残った(下図右)。

図

 なぜマークが消えたのか?

白黒のデジタル画像

 まず白に 1 を対応させ黒に 0 を対応させる。 上述のマークが消えたのはマークの色を 1 とみなしスキャナーが白 (1) か黒 (0) かの2値画像として PDFファイル化したからである。もしマークの色を 0 と見なしていたらマークの部分が黒となり下の文字が読めなくなっていたことであろう。一般に 白黒写真などでは白と黒だけでなく灰色も使われている。 灰色はその明るさの強度によって 0 から 1 の間の値に対応する。従って、スキャナーに自動識別させずにグレースケールやカラーモードを指定してスキャンすればマークの色に 0 と 1 の間の数値が振り当てられマークが消えずに残ったのである。 白黒といえば、日常生活では白黒写真のように灰色も含んだものを指すことが多いと思うが、 画像では 2値(白黒)と多値(グレースケール,カラー)に分類され、 2値画像とはその名の通り値が2つしかない画像 (0 と 1 の白黒)で、 多値といえば2つ以上の値をもつ画像のことで モノクロ(灰色を含む)かカラー画像を指す。 以下モノクロ画像について考える。 モノクロのデジタル画像は 0 から 1 までの値の実数を順序も考えて長方形の形に並べたものといえる。 人間が認識できる色の変化はたかだか 2 8 =256 段階(階調)以下のようなので、 コンピューターでは一般的に8ビットのグレースケールが使われる。そのため 0 から 255 の整数値を並べる場合もある (0 が黒で 255 が白)。 デジタル画像では色情報(上記の実数)を持つ最小単位を 画素 または ピクセル と呼ぶ。

図

ハール変換と逆ハール変換

図

ハール変換の意味

対応

図
図1: 左図:データを平均と変化への分解  右図:平均と変化からデータを再構成

行列に対するハール変換

行方向(または列方向) に数ベクトルに対するハール変換を適用した後、列方向 (または行方向)に数ベクトルに対するハール変換を適用したものが 2×2 行列に対するハール変換である。

図

ハール変換の画像への適用

与えられた画像(図2 左下) の画素の強度を数値化して得られた行列(図2 左 上) を2 × 2 行列に分割し、それぞれの2 × 2 行列にハール変換を適用する。得られる結果は2 × 2 行列で あり、それぞれの2×2 行列から左上、右上、左下、右下を取り出して、左上の数だけからなる行列、右上 の数だけからなる行列、左下の数だけからなる行列、右下の数だけからなる行列を作る(図2 右上)。そう して得られた画像が図2 の右下である。これがレベル1の分解であり、それぞれの左上の数だけからなる行 列、右上の数だけからなる行列、左下の数だけからなる行列、右下の数だけからなる行列に並べられた画素 数は元の画像の画素数の4分の1になっている。図2 右下の4 つの画像の左上の画像が元の画像の平均に、 残りの画像が変化に対応している。

図
図2: ハール変換の画像への適用例

同様に、図2 右下の平均の画像にハール変換を適応すれば、 レベル2の平均と3つのレベル2の変化が得られる。 このような操作を繰り返して高レベルの平均と変化が得られる。

応用

ハール変換の逆変換が存在するので何回ハール変換を行っても 逆変換で元に戻すことができる。 一方、分解して得られた変化の情報に何らかの変更を加えて逆変換を行うと 当然元の画像とは一致しないことは明らかである。しかし、平均の情報を変えていないので 逆変換を行って得られた画像は元の画像と類似している。 電子透かしなどはこの原理を利用している。 例えば、元の画像に名前を書く代わりに高レベルの変化に名前を書いて逆変換を行えば 再構成された画像では名前がはっきりとは分からないようにすることができる。 しかし、その再構成された画像を分解すれば名前が現れるので所有権を主張できる。 また、元画像のような鮮明な画像が必要でない場合には分解した後の平均画像を利用すれば必要なメモリを減らすことができ、メールなどで画像を送信する時に早く 送ることができる。画像を受け取った相手が平均画像だけでは不十分な場合には残りの変化の画像を送ってもらい再構成をすればより詳細な画像を得ることができる。 例えば、防犯カメラなどで撮影された画像はそのまま監視室等 に送られるのではなく、 画像は適当なレベルの平均と変化に分解されて保存され分解された平均画像のみ が監視室等のモニターに映し出されている。そして鮮明な画像が必要となれば、 保存されている変化のデータを用いて再構成すればよい。 ハール変換はウェーブレット変換の一つであるが当然 実用化されているもの全てにハール変換が使われているのではない。しかし 別のウェーブレット変換でも原理は同じである。 舞鶴高専の芦澤恵太准教授の話では、彼らのハール変換を用いたアルゴリズムが 遊技機(パチンコ・パチスロ)の画像に活用されているとのことである。 もっと身近な機器にハール変換が利用されているかもしれない。 以上は画像処理に関連する理論のさわりにすぎないので、詳しい理論については ウェーブレット解析の書籍をご覧頂きたい。

【参考文献】
今回原稿を作成するにあたって大阪教育大学芦野隆一教授の附属池田高校での講演(中止)原稿(2003年) http://www.osaka-kyoiku.ac.jp/~ashino/pdf/Ikeda_lecture.pdfを参考にした。上記URLの原稿は高校生でも分かるように易しく書かれていたが、 新課程(2014年の高校3年生より)では数学Cが廃止されたため高校ではこれまでのように行列を学ばなくなったので “高校生でも分かる” とは言い難くなった。 また本原稿で引用した画像の一部は上記URLのものである。
 最後に、上記URLの引用を承諾頂いた芦野教授他、日本応用数理学会ウェーブレット研究部会メンバーの芦澤准教授、大阪教育大の守本晃准教授には LaTeX(文書処理システム)での原稿作成にあたって画像の挿入方法を教わった。 また、芦澤准教授と東海大の藤ノ木健介講師には原稿を読んで頂きコメントを頂いた。 ご協力頂いた皆さんに感謝の意を表する。

TOP