≪1≫H.264/SVC標準の新しい発想
〔1〕映像データの「ミルフィーユ」化
前編でも説明したように、従来のH.264/AVCまでの規格では、例えば、CIF@30fpsで送信すると決めた場合、配信側は受信側が100%そのデータを受信・再生するものとして(固定的に)データを符号化して、送信します。データは、どれが欠けても代替できないオンリーワンの状態で配信されていました(図1)。このため、受信側には、受信開始以降のデータ取捨選択権がなかったのです。
しかし、拡張標準H.264/SVCでは、映像データの構造を変えました。今までの「オンリーワン」の状態から、図2に示すように、お菓子のミルフィーユのような多層的データ構造になりました。
〔2〕H.264/SVCのデータ構造
H.264/SVCのデータ構造は、大きく「ベース・レイヤ」と「拡張レイヤ」の2つに分けられます。
「ベース・レイヤ」は、必要最低限の動画要素で構成されます。
これは「高信頼性チャネル」といわれる、必須のデータ・ストリームなので、FEC(Forward Error Correction、前方誤り訂正)などの冗長化によって、守られます。
「拡張レイヤ」は、「ベース・レイヤ」に加えることで映像品質を上げることができる要素で構成されます。この部分が、受信端末で取捨選択されるデータです。拡張レイヤの優先度は、ベース・レイヤよりも劣位にあります。この理由は、「存在すれば、より高画質な動画再生が可能であるが、なくてもよい」というものだからです。
〔3〕映像品質を上げる」要素
それでは、「映像品質を上げる」要素とは、何でしょうか?
「拡張レイヤ」では、次の3つが定義されています。
(1)Spatial:空間レイヤ(画像の高精細化に寄与します)
(2)Temporal:時間レイヤ(動画のフレーム・レート向上に寄与します)
(3)Signal/Noise:S/N比レイヤ(画像のS/N比向上に寄与します)
エンコーダ(符号器)では、さらに、どのレイヤをどれだけの階層に分割してエンコードするかを決めることができます。
どのレイヤまでをどのように組み合わせて再生するかは、デコーダ(復号器)のある受信端末側で決めることができます。例えば、「ベース・レイヤ+空間レイヤ」のみを採用すると、低フレーム・レートながら高精細な動画を再生することができます。
ベース・レイヤと、拡張レイヤの各階層データとは、相互に参照できるように関連付けられています。受信側はこれらのデータをうまく組み合わせることで、多様な品質の再生映像をつくることが可能です。