≪2≫H.264/SVCのメリットの具体例
〔1〕例1:シンプルな接続構成
H.264/SVCでは、ネットワーク上で映像のシンプルな配信構成をとることができるメリットがあります。
従来のH.264/AVCまでの映像配信の場合、そのデータ規格は、通信の開始時に受信端末とマッチングさせて(整合性を取って)固定されます。このため、多様な機器との接続をするとなると、それだけ多様な配信サーバが必要になります。
例えば、「CIF@15fps」「CIF@30fps」「HD720p@15fps」「HD720p@30fps」という4種類のストリームが必要であれば、配信サーバは図1のように4種類を用意する必要があります〔CIF@15fps:15フレーム/秒でCommon Intermediate Format(共通中間フォーマット:288ライン×352画素)。HD720p@15fps:15フレーム/秒でHigh Definition 720 progressive(高精細720 ライン×1280画素プログレッシブ)フォーマット〕。
このように符号化の要求仕様がバラエティに富めば富むほど、配信サーバもそれだけ増やさざるを得ません。これは配信構成の複雑化を招き、高価なものになります。
しかし、新しいH.264/SVC規格の場合は、図2に示すように配信サーバは1つだけあれば大丈夫です。配信される映像のうちどの映像仕様を選択するかは、受信・再生端末側が決めることだからです。
〔2〕例2:ネットワークの品質変動に対する耐性
H.264/SVCは、ネットワークの品質のゆらぎ(変動)に対する耐性が高いというメリットがあります。
一般に、品質が保証されるが高価な専用線を使用する場合は、一度接続してしまえば帯域や通信品質は、変わることはありません。しかし、IPに代表されるベストエフォート型のネットワークでは、パケット・ロス、ジッター(パケットの到着時間のばらつき)、遅延やその結果としての利用可能帯域など、品質が常時変化しています。
(1)H.264/AVCまでの場合
高遅延が許容される映像配信の環境では、受信端末側においてデータをバッファリング(蓄積)することによって対応できます。そこでここでは、低遅延を前提にして考えられた映像配信構成で、大量のパケット・ロスが発生した場合を考えてみましょう。
例えば、このパケット・ロスの原因が、「当初、映像帯域を768kbpsで通信することを前提にしていたが、実際には384kbpsしか利用できない状態になっていたため」としましょう。
パケット・ロスは、映像を再構成するときに必要なデータがネットワーク上で欠落(ロス)していることを意味しています。これによって、ブロック・ノイズ、フレーム・レートの低下、収斂されているべき映像が残像として画面に表示されたままになる、などの映像不具合が見えてしまいます。この例の場合では、50%の映像データが消失(384kbpsは768kbpsの半分の伝送速度のため)してしまうことになります。
この問題を解消するには、一つの方法として、映像帯域を768kbpsではなく最大384kbpsに再設定する必要があります。しかし、旧来の映像符号化仕様では、少なくとも映像セッションを(場合によっては通信そのものを)、一度切断してからつなぎ直す(再接続)という方法しか、再設定の手立てがありません。このように、ネットワークの輻輳(混雑)が生じるたびに、セッションの切断・再接続を繰り返していたのでは、配信映像をスムーズに受信・再生し続けることができなくなってしまいます。
(2)拡張標準H.264/SVCの場合
拡張標準H.264/SVCでは、受信側(端末側)に映像データ・ストリームの選択権がありますから、ネットワークの輻輳が起きた場合は、受信者側がどのデータを選択するかを決めて再生することができます。つまり、あらかじめデータ・ストリームに欠落があった場合のアルゴリズム(処理手順)を組み込んでおくことによって、利用者に画像劣化を感じさせずに再生することが可能になるのです。
例えば、HD720p@30fpsという高精細・高フレーム・レートの映像を受け取っていたときにパケット・ロスが発生した場合、CIF@15fpsという低精細・低フレーム・レートの再生にまでスムースに移行することができます。また、ネットワークの輻輳が解消されれば、セッションの切断・再接続をせずに、もとのHD720p@30fpsにもどすこともできます。
〔3〕例3:画像精細度の変化に対する動的な対応
新しいH.264/SVCでは、受信端末側で画質を選択できるので、表示する画像の大きさによって、それに伴う受取再生の解像度を、受信中に任意に変化させることが可能です。
例えば、図3のように、AとBという2カ所からH.264/SVCでの映像配信を同時に受けているとしましょう。この場合、Aからの映像を主に受けているときは、AをHD720p@30fpsで大きく表示し、BをCIF@15fpsで小さく表示させておくことができます。
また、AとBを同程度の大きさに表示させたい場合は、図4に示すように、AとBの両方を同時にHD720p@15fpsで表示させることができます。このとき、配信サーバはAもBも、配信に関するデータ仕様を変えることはありません。これは、再生するときに利用する映像データの取捨選択権が受信側にあるためです。
このように、再生画質を受信側が動的にコントロールすることができる、という点がSVCの大きな特長なのです。
それでは、符号化の仕様をどのように変えることによって、H.264/SVCは今までのH.264/AVC映像符号化とは異なった特性を実現することができるようになったのでしょうか? 次回(後編)で、このことを説明しましょう。
――つづく――
参考文献
(1)大久保榮監修『改訂三版H.264/AVC教科書』(インプレスR&D)
(2)ITU-Tにおける映像・音声符号化の標準化動向
http://www.ntt.co.jp/journal/0801/files/jn200801080.html
(3)Tutorial: The H.264 Scalable Video Codec (SVC)
http://www.dspdesignline.com/howto/206902266
プロフィール
仲田 智彦(なかだ ともひこ)
VTVジャパン株式会社 技術部 リーダー。テレビ会議開発メーカーより2004年にVTVジャパンへ入社し、現在技術部リーダーとして活躍中。
栢野 正典(かやの まさのり)
VTVジャパン株式会社 代表取締役。1996年VTVジャパン代表取締役に就任し、日本初のビジュアルコミュンケーション専門会社として、VTVジャパンを立ち上げる。
大久保 榮(おおくぼ さかえ)
NTT、アスキー、TAO(通信・放送機構)を経て1999年から早稲田大学国際情報通信研究センター・客員教授、2006年からVTVジャパン株式会社顧問。映像符号化、テレビ会議システムの研究とその国際標準化に従事。