このコーナーでは、最新のICT(情報通信技術)のキーワードをQ&A形式でわかりやすく解説していきます。
ブロードバンド時代の急速な進展を背景に、通信と放送の融合が注目され、本格的な画像コミュニケーション時代が到来しています。このような時代の要請に対応して、新しい「H.264/AVC」という画像圧縮技術が標準化され、国際的な注目を集めています。今回は、圧縮技術の基本的な要素について解説します。
Q11:圧縮技術の基本的な要素は?
H.264/AVCという最新の圧縮技術をいきなり理解するのは難しそうなので、H.264/AVCを読む前に、必要となる圧縮技術の基本的な要素にはどのような技術があるのか、どのような仕組みなのか、その概念をつかみやすいように解説して欲しいのですが?
圧縮技術の基本につきましては、その要点を「Q&Aで学ぶH.264/AVC(3):「圧縮」と「符号化」、「圧縮符号化」の違いは?」で記述しましたが、H.264/AVCを含め、最近の動画像圧縮符号化は、主として次の5つの技術を基本要素としています。
【基本要素1】予測:2つの予測技術
【基本要素2】動き補償フレーム間予測
【基本要素3】双方向動き補償フレーム間予測
【基本要素4】変換:DCT(離散コサイン変換)
【基本要素5】可変長符号化方式の特徴
今回は、「【基本要素1】予測:2つの予測技術」「【基本要素2】動き補償フレーム間予測」「【基本要素3】双方向動き補償フレーム間予測」を説明します。
【基本要素1】予測:2つの予測技術
ここで予測とは、身近には野球のバッターがこれまでのデータから次に来るボールの球種とコースを読んで打撃に備える例にみられるように、過去の画面から次にどのような画面がくるかを的確に予測する技術のことです(野球の場合も符号化の場合も、予測が当たると良い結果が得られる)。
テレビ画面の画像は1秒間に30枚のフレーム(駒あるいは画面)で構成されますが、あるフレーム(画面)と隣り合ったフレーム(画面)は、その差が小さいため、人間の目にはわからないほど似通っています。このため、1秒間に30枚の画面を流すと人間の目には映画やテレビ画面が連続しているように見えるのです。このような現象は、人間の「錯視」(あるいは仮現運動)と言われることがあります。動画像を圧縮する場合は、このような隣り合った画面が似通っている仕組み(すなわち予測できる仕組み)を利用します(Q&Aで学ぶH.264/AVC(8):「ハイブリッド符号化」とは?の図1-10参照)。
このように、画面Aと次にくる画面Bの画面が似通っていれば、画面Aを構成している既知の画素値(「輝度情報」など)から、次の画面Bの画素値を予測することができます。これを画面間(フレーム間)予測と言います。このため、画面Aの次には、予測される画面Bをすべて(全画面)送るのではなく、画面Aと画面Bの2つの画面間の誤差(差分)だけ(図1-10の場合、例えば新幹線の移動分だけ)を相手に送ることによって、大幅な圧縮を実現できるようになります。
ここでは、前の画面Aから次の画面Bを予測する場合を説明しましたが、これは、「画面間(フレーム間、時間的)予測」と呼ばれます。また、1枚の閉じた画面Aの中で画素信号の相関関係から次の画素を予測し、その予測誤差を送信する場合もありますが、この場合は「画面内(フレーム内)予測」あるいは、画面という空間で予測するので「空間的予測」とも言われます(図1-10参照)。