≪1≫IEEE 802.1 DCB方式の概要と背景
インターネットや広域イーサネット・サービス、NGN(Next Generation Network、次世代ネットワーク)の普及に伴って、企業におけるデータ・センターの活用が広がっている。
データ・センターとは、これまで部署や部門ごとに運用していたサーバ(ファイル・サーバやデータ・ベースサーバ、Webホスティング・サーバなど)を一箇所に集めて運用し、運用やメンテナンスのためのコスト削減、セキュリティ向上などを実現しようとするものである。
データ・センターは「サーバ・ファーム(サーバ農場)」とも呼ばれ、非常に多くのサーバが一箇所に集められ、整然とラックに収められて運用が行われている。これらのサーバは、「トップ・オブ・ラック・スイッチ」と称される、ラックの最上段に設置されたイーサネット・スイッチに接続し、これらのスイッチ経由でサーバ間の通信を行ったり、さらに広域網やインターネットを通ってクライアント(サーバを利用する端末)との通信を行っている。
サーバとトップ・オブ・ラック・スイッチとの接続は、現在は「より対線」のギガビット・イーサネット(1000BASE-T)が主流であるが、サーバの高性能化や、仮想マシン(Virtual Machine、※1)の普及から、さらに高速な10ギガビット・イーサネット 〔8対シールド・ケーブルを使用する10GBASE-CX4や2対シールド・ケーブルを使用するSFP+(Small Form Factor Pluggable Plus、10G対応の小型着脱式光トランシーバ)のDirect Attach Cable(10GSFP+CU)など〕が使われるようになってきている。イーサネット制御LSIの大手であるインテル社、ブロードコム(BroadCom)社の予測によると、2012年までにはサーバ接続の主流が1Gbps接続から10Gbps接続に移行すると考えられている(図1)。
※1 Virtual Machine:1台のコンピュータを仮想化して複数台のコンピュータとして動作させる技術。1台のコンピュータを同時に異なる用途に利用して、計算処理能力を融通し合うことができるため、近年活用が広まっている。
DCB(データ・センター・ブリッジング)は、このようなサーバ接続の1Gbps⇒10Gbpsへの高速化の流れをとらえ、データ・センター内のイーサネット・スイッチに新たな付加機能を追加して、サーバのI/O(Input/Output、コンピュータと外部装置の入出力を行うためのインタフェース)をイーサネットに統合する「サーバI/O統合」を実現しようとするものである。
このI/O統合によって、次のような利点が得られる。
(1)ストレージ専用のI/O(ホスト・バス・アダプタ)を不要化して、サーバの大幅なコスト削減と消費電力・サイズ低減。
(2)サーバ・ファーム内の配線を減らして、配線コストの低減と保守性の向上。(図2)
≪2≫DCB(データ・センター・ブリッジング)規格の構成
〔1〕3つで構成されるDCB規格
DCBは、IEEE802.1WG内のDCB TG(Task Group)において標準化が進められている。DCB TGにおいて審議されているDCB規格は次の3つであり、その構成を図3に示す。
(1)802.1Qaz Enhanced Transmission Selection(ETS):帯域保証付き優先キューイングおよびDCBXプロトコル
(2)802.1Qbb Priority-based Flow Control(PFC):優先キューごとのフロー制御
(3)802.1Qau Congestion Notification(CN):フローベース輻輳通知
これらの802.1 DCB規格で規定される機能を組み合わせてイーサネット・スイッチを拡張することによって、ストレージI/Oを統合するために必要な「イーサネットのロスレス化」を実現しようとするものである。
イーサネットのロスレス化とは、輻輳時も含めて、フレーム中継時のフレーム破棄を限りなくゼロにすることである。ある程度のフレーム・ロス(紛失)を前提として設計されているLAN系のデータ通信アプリケーションと異なり、ファイバ・チャンネル(FC:Fibre Channel)などのストレージI/Oではフレーム・ロスがアプリケーションの性能に与える影響は絶大であり、0.1~0.5%のフレーム・ロスによって、システムがシャット・ダウンに追い込まれる場合もある、というレポートが出されている〔文献3〕。
このようなフレーム・ロスに敏感なストレージI/Oアプリケーションと、ロスが許容されるLAN系のデータ通信アプリケーションなどを同一のイーサネット・スイッチ網に収容して利用できるようにすることがDCB規格の最大の目的である。
〔2〕INCITSのT11ではFCoEを審議
一方、IEEE802.1WGにおける標準化と並行して、高速ストレージI/OのFibre Channelを審議するINCITS(InterNational Committee for Information Technology Standards)のT11技術委員会(Technical Committee)において、イーサネット上でFibre Channelをやりとりするための方式であるFCoE(Fibre Channel over Ethernet)の審議が進められている。DCBの用途はFCoEに限定されるものではないが、FCoEを有力なターゲット・アプリケーションの一つと想定して802.1 DCB規格の標準化が進められている。
≪3≫802.1 DCB コンポーネント規格の概要
〔1〕IEEE802.1Qaz ETS: 帯域保証付き優先キューイングとDCBX
IEEE802.1Qaz ETSの英文タイトルは「Enhanced Transmission Selection for Bandwidth Sharing Between Traffic Classes」。直訳すると「トラフィック・クラス間の帯域共有のための拡張送信選択」である。すなわち、LANやSAN(Storage Area Network)、 プロセス間通信(IPC:Inter Process Communication)など、異なるアプリケーションの異なる通信要件をもったトラフィックを、それぞれの最低帯域を確保しながら中継するための「帯域保証付き優先キューイング(待ち行列)方式」を規定する。
これまで、IEEE802.1において規定された優先キューイングは、優先度の高いトラフィックを常に優先して中継する「絶対優先(Strict Priority)キューイング」だけであった。絶対優先キューイングでは、どんなに低優先のトラフィック・クラスが輻輳していても、一つでも上のクラスの優先トラフィックがくると、そちらのトラフィックが中継される。このため、ネットワークに輻輳が発生した場合には、高優先と低優先のトラフィック・クラス間で、100:0のような極端な帯域の分布が発生するため、絶対優先キューイングだけではアプリケーションを同一スイッチ網に共存させることは難しい(図4)。
802.1Qazでは、Priority(優先度)の他にPriority Group(優先度グループ)という概念を導入した。Priority Groupごとに、通信帯域の最低何パーセントまでを確保できるかを指定できるように規定した。
指定された最低帯域までは、低優先であっても使用することができる。このような「Priority Group単位の帯域保証」を実現する仕組みがETSである(図5)。
802.1Qazでは、ETSの他に、ETSが正しく機能するために隣接ノード間でPriorityやPriority Groupの設定情報をやり取りするための情報交換プロトコル「DCB Capability Exchange Protocol(DCBX)」を規定する。
DCBXは802.1ABにおいて規定されているLLDP(Link Layer Discovery Protocol、リンク・レイヤ発見プロトコル)をベースとして、DCBに関する設定情報を交換したり、設定を折衝したりするための機能を追加したプロトコルである。
〔2〕IEEE802.1Qbb PFC:優先フロー制御
802.1Qaz ETSによってPriority Groupごとの帯域保証は規定されたが、これだけではイーサネットのロスレス化は実現できない。スイッチにおいて輻輳が発生してバッファ溢れが発生しそうになったときに、これを救うための仕組みが必要である。このために、必要なフロー制御の仕組みを規定するのが802.1Qbb PFC(Priority-based Flow Control)である。
802.1Qbb PFCは、802.3 Ethernet(802.3-2008 Annex 31B MAC Control PAUSE operation)において規定されているPAUSE(ポーズ)を拡張したものである。
802.3において規定されるPAUSE動作では、スイッチのポートに輻輳が発生すると、そのポートの対向ノード(スイッチまたは端末)に対してPAUSEフレームを送信し、該当ポートに対する送信トラフィックを一旦停止(PAUSE)するように指示を出す。
この一旦停止指示には低優先トラフィック、高優先トラフィックの区別はない。このため、低優先トラフィックの輻輳によって、遅延の許されない高優先トラフィックまでが送信停止となるなど、通信全体に与える影響が大きいため、802.3が規定するPAUSEはあまり利用されてこなかった。
このPAUSEのやりとりを、トラフィックの優先度ごとに別々に実施できるように拡張したのが802.1Qbb PFCである。802.1Qbb PFCでは、802.3で規定されるPAUSEフレームに、優先度別の一旦停止(PAUSE)時間を含められるように拡張している。802.1Qbb PFCの働きによって、他の優先度のトラフィックに影響を与えることなく、特定優先度トラフィックの一時的な帯域超過によるバッファ溢れを防ぐことが可能となる(図6)。
〔3〕IEEE802.1Qau CN:輻輳通知
802.1Qbb PFCは、スイッチにおいて発生する一時的な帯域超過発生時に、隣接ノードに対して(特定優先トラフィックの)一時的な送信停止を指示することでフレーム・ロスを避ける、いわば緊急措置的な対応を実施する。しかし、一時的なオーバーフローは救えても、そのままトラフィックが減少しなければ、最終的にはバッファ溢れによるフレーム・ロスが発生してしまう。
これに対して802.1Qauが規定するCN(輻輳通知)は、輻輳の発生をトラフィックの送信元に伝えることで、ネットワークの輻輳を、輻輳の発生元から緩和しようとするものである。
802.1Qau CNでは、ブリッジにおいて輻輳を検知した際には、輻輳の原因となったトラフィックを特定して、該当トラフィックの送信元端末(End station)に対して、輻輳を知らせるためのメッセージ(輻輳通知)を送信する。この輻輳通知を受け取った端末は、送信を抑制して、ネットワークの輻輳を緩和させる(図7)。
このように、802.1 DCBでは、隣接ノード間のやりとりでバッファ溢れに因るフレーム・ロスを防ぐ仕組み(802.1Qbb PFC)と、スイッチと端末間のやり取りで、ネットワーク全体の輻輳を緩和する仕組み(802.1Qau CN)を規定して、これら2つの仕組みを補完的に機能させることにより、イーサネット網のロスレス化を実現しようとしている。
≪4≫802.1 DCBの標準化状況
IEEE802.1 DCBは、2004年にCall for Interest(標準化検討のための賛同者を募る会合)が開かれ、以降、輻輳制御方式を中心に検討が進められてきた。いろいろな輻輳制御の方式を検討した後、2006年から、具体的な規格の審議が開始された。現在のIEEE802.1 DCB規格のドラフトは表1の通りである。
規格名称 | ドラフト | ドラフト発行日 |
---|---|---|
IEEE802.1Qau Congestion Notification | 2.00 | 2009/03/24 |
IEEE802.1Qaz Enhanced Transmission Selection | 0.20 | 2008/11/24 |
IEEE802.1Qbb Priority Flow Control | 1.00 | 2009/02/09 |
IEEE802.1 DCB TG(Task Group)は、イーサネットLSIメーカー大手、ブロードコム社のパット・テーラー(Pat Thaler)氏 (元802.3WG議長)が議長を務める。その他、Fibre Channelスイッチ大手のブロケード(Brocade)社やシスコシステムズ社などが参加して、標準化が推進されている。
参考文献
1)“Data Center Ethernet Call for Interest”, Jonathan Thatcher, 2004/3/16, http://www.ieee802.org/3/cfi/0304_1/Thatcher_1_0304.pdf
2)“Data Center Bridging IEEE 802 Tutorial”, Pat Thaler(BroadCom), et.al, 2007/11/12, http://www.ieee802.org/802_tutorials/07-November/Data-Center-Bridging-Tutorial-Nov-2007-v2.pdf
3)「IPネットワークによるストレージデバイスおよびアプリケーションへの影響の分析」, 2002, Empirix社, http://www.empirix.co.jp/resources/pdf/ip_network_st.pdf
4)“An Overview: The Next Generation of Ethernet”, John D’Ambrosia(Force10 Networks), 2007/11, http://www.ieee802.org/802_tutorials/07-November/HSSG_Tutorial_1107.zip