≪1≫ノンストップ・サービス実現に向けての5つのステップ
■ノンストップのサービスを実現するために、どのようなステップがあるのでしょうか?
田中 アルカテル・ルーセントは、図4に示すように、システム障害時に発生する、分単位のストップ(システム・ダウン)をミリ秒単位に短縮するまでのパスを、5段階(5ステップ)に分けて考えています。
第1段階:最低段階の分単位のストップは「プロトコル単位の収束」ですが、これはルーティング・ネットワークにおける標準的な運用の場合です。
第2段階:図4のすぐ上の第2段階がノンストップ・フォワーディング(NSF:Non Stop Forwarding)で、ルータが障害からの回復中でもトラフィックを引き続いて転送できるレベルです。
第3段階:そして、世の中の多くのインターネット・アクセス製品が実現しているのがグレースフル・リスタート(GR:Graceful Restart)です。GRは、障害からの回復の助けに隣接ノード(ルータ)を利用します。しかし、GRは弊社のレベルからみると第3段階にすぎません。通常、メーカーからはここまでのサービスが提供されています。
第4段階:アルカテル・ルーセントは、すでに2003年からその上の第4段階である先進的なノンストップ・ルーティング(NSR:Non Stop Routing)を実現しています。NSRは、ルータを自動的に復帰させることによって、データの転送を止めない機能のことです。
■そして最高の第5段階が、ノンストップ・サービスなのですね。
田中 そうです。弊社が最近強くアピールしているのが、最高段階(第5段階)のノンストップ・サービス(NSS:Non Stop Service)です。NSSは、NSRのVPNサービスへの拡張機能ですが、具体的にはキャリアにおけるHA(ハイ・アベイラビリティ)を意味しています。現在、キャリアの場合、何かのサービスを提供する場合に1つだけのルーティング・プロトコルを使っていることはありません。
インターネット・サービスの場合には、複数のプロトコルを使用しない場合がありますが、キャリアの場合はそうではありません。例えば、IP-VPN(IP Virtual Private Network、IPによる仮想専用網)では、通常、最も重要なBGP-4に加えてMPLS、LDP、RSVP、OSPF(※1)などのプロトコルが同時に使用されています。
※1 用語解説
BGP-4:Border Gateway Protocol Version 4、境界ゲートウェイ・プロトコル第4版。ISP(プロバイダ)間で使用される標準的なルーティング(経路制御)プロトコル。
MPLS:Multi-Protocol Label Switching、マルチプロトコル対応のレイヤ2で動作するラベル・スイッチ技術。
LDP:Label Distribution Protocol、LSR(ラベル・スイッチ・ルータ)におけるラベル配布プロトコル。
LSR:Label Switching Router、ラベル・スイッチ技術を採用したルータ。
IPアドレスを使用してパケットを転送するだけでなく、レイヤ2のラベル情報(IPパケットに付加されたデータリンク層の短い固定長のアドレス情報)に基づいてパケットの転送も行えるようにした高速ルータ。
RSVP:Resource Reservation Protocol、ネットワーク資源(帯域)予約プロトコル。
OSPF:Open Shortest Path First、大規模ネットワーク用のルーティング・プロトコル。
このようなことから、IP-VPNというサービスを止めないためには、複数のプロトコルをすべてノンストップで動作させる必要があるわけです。また、仮にキャリアから、よりレベルの低い第3段階のGR(グレースフル・リスタート)のサービスが提供されていても、ユーザーのCPE(Customer Premises Equipment、顧客の構内設備)が対応していなければ、GRのサービスを受けることはできないのです。
これに対して、弊社のNSS技術を使えば、ユーザー側に高価な特別なCPEがなくてもサービスを受けられるようになっています。また、ユーザー側はキャリア側がNSS(ノンストップ・サービス)なので、トラブルが起こったかどうかすらわからないようにできるわけです。さらに、隣接ノード(ルータ)にも影響を与えることなく、サービスを提供できるようにもなっています。また、レイヤ2において求められるMACアドレス学習(※2)についても、NSSで対応できるようになっています。最近では、第4段階のNSRを発表しているメーカーが登場してきていますが、現在のところ、NSS段階のサービスを提供しているのはアルカテル・ルーセントの製品だけなのです。
※2 用語解説
MACアドレス学習:LANスイッチが、あるポート(パソコンなどの接続口)から受け取ったMACフレームの送信元MACアドレスを「MACアドレス・テーブル」に登録(学習)しておき、 その後、受信したMACフレームを必要のない他のポートには転送しない(ブロードキャストしない)ようにする仕組み。
■先ほど、お話がありましたが、NSSは、単体の機器ではなくシステム全体の稼働率を高めているのですね。
田中 そのとおりです。99.999%(ファイブ・ナイン)の稼働率を、例えばルータ単体で達成するのはわかりやすく比較的容易なことですが、ネットワーク・システム全体として99.999%の稼働率を実現することは非常に複雑です。さらに、稼働率・故障率の元となるMTBF(機器やシステムが故障するまでの平均的な時間間隔)に比べて、MTTR(平均修理時間※3)の削減にはむずかしい面があります。このため、ネットワークのMTTR、つまり、数千のサービスが稼働している中で、障害から再度オペレーション可能な状態に戻るまでの修理の時間は、NSSを実現する上で最も重要なポイントとなります。
※3 用語解説
MTBF:Mean Time Between Failures)、機器やシステムなどが故障するまでの平均的な時間間隔。
MTTR:Mean Time To Repair、機器やシステムの修理に要する平均的な時間。
このように、MTTRの削減に役立つハードウェアとソフトウェアの冗長化(二重化)、さらにネットワークの設計方法を加味したうえで、稼働率99.999%を達成するということは、ルータ単体で実現する稼働率とは大きく異なるのです。しかし、弊社にはNSSの技術がありますので、ハードウェアとソフトウェアの冗長化(二重化)を効率的に行い、これに加えてVPLS(仮想プライベートLANサービス ※4)などのキーとなる技術を用いることによって、障害から早期に復帰しやすいネットワークを実現することができるのです。
最近では、放送品質を実現するには、前述したファイブ・ナイン(99.999%)ではなく、その1レベル上のシックス・ナイン(99.9999%)が求められるようになってきています。
※4 用語解説
VPLS :Virutail Private LAN Service、MPLS上のマルチポイント型イーサネット・サービス。ネットワーク構成の自由度の高さや、MPLSのもつ各プロテクション(保護)技術が利用できる利点がある。
≪2≫ノンストップ・ルーティングを実現する仕組み
■それでは、具体的にどのように故障回復(ノンストップ・ルーティング)が実現されているのか、その動作の仕組みを教えてください。
田中 図5を見ながら故障回復(ノンストップ・ルーティング)を簡単に説明しましょう。
まず、重要なのは、図5に示す、サービス・ルータ内に実装されているコントロール・カードの、
(1)RIB(ルーティング・インフォメーション・ベース)部
(2)FIB(フォワーディング・インフォメーション・ベース)部
の2つです。ネットワークを流れるトラフィック(ユーザー情報)について、コントロール・カード内のコントロール・プレーン(トラフィックの制御機能部)がRIB(ルーティング情報)を蓄積し、データ・プレーン(トラフィック転送機能部)がFIB(転送情報)を蓄えていきます。RIBからFIBへは、たえず情報が更新される仕組みになっているため、トラフィックは、常に最新のFIBで転送されることになります。この動作をいかに、状態を管理しながら(ステートフルに)、スイッチ・オーバー(切り替える)するかが重要となります。
このとき、ルータ内の2つのコントロール・カードがRIBやその他の情報を常に同じ状態に保ち、現在稼動中のコントロール・カードに障害が発生した場合に、状態遷移を含めたすべてのステート(状態)を待機中のコントロール・カードに瞬時に切り替えることで、FIB(転送情報)にまったくダメージを与えずにトラフィックのコントールを引き継ぐことができます。このような仕組みを用いることによって、フォワーディング(情報の転送)には影響を与えないようにできるため、稼働率の高いシステムとすることが可能になるのです。
■実際に、GR(グレースフル・リスタート)とNSR(ノンストップ・ルーティング)とでは、障害発生から復旧までにどれくらいの差がでるのでしょうか?
田中 ここで、市場に出ているA社のGR対応のルータと弊社のNSR対応のルータで、まったく同様にコントロール・カードを引き抜きした場合の比較(実際はコマンド操作によるデモですが)をしてみましょう。この場合のルートの学習スピードの違いを、図6にグラフ化してみました。
図6に示すように、NSRでは、他のノードに影響を与えずに迅速に自分で再学習が完了します。これに対して、GRの場合は、隣接ノードに対し、自分がリスタートをしている間は、経路を変更しないでくれというお願いをします。この間、経路の学習が停まってしまい、古い情報、あるいは十分な経路情報をもたない状態での転送(ヘッドレス・フォワーディング)を行うしかありません。インターネットの経路は、極めて早い頻度で更新されています。例えば、過去の統計では3秒ごとに更新されますので、このことは、もちろん企業で動作しているいろいろなアプリケーションに影響します。
写真1に、ネットワーク・インテグレータとして最大手の1社であるネットワンシステムズ社のテクニカルセンター(東京・品川)において行われ、見学していただいたデモの状況を示します。このデモでは、弊社のNSR 対応の7450ESSと他社のGR対応の製品が使用され、マルチキャスト配信サーバから端末(パソコン)に映像を流す場合の実験です。この実験では、各ルータに内蔵しているアクティブなマネージメント・モジュールが故障した場合に、エンドユーザー(パソコン)の画面に映る映像への影響を実験しました。このデモで使用された弊社のNSR対応の7450ESS(写真2)は、約3μ秒間の停止であったため、ほとんど映像配信が停止していることに気づきませんでした。一方他社のGR対応の製品では、障害の回復に約30秒間(1000万倍)も時間がかかってしまったため、写真には表現されていませんが、しばらく映像が中断している状態となりました。 GR対応のルータとNSR対応のルータではそれほど大きい差が出てしまうのです。
■なるほど。デモではたしかにそのように違うことがわかりました。ところで、アルカテル・ルーセントの製品には多くのHA機能が搭載されていますが、最も注目される機能はどれでしょうか?
田中 当社ではHA機能に関する、ハードウェア、ソフトウェア、リンク・レイヤ・プロトコルなどの各コンポーネントの評価を行っていますが、この中で特にインサービス・ソフトウェア・アップグレード(ISSU:In-Service Software Upgrade)という機能が注目される機能となっています。このISSUは、システムが稼働中にソフトのアップグレード(更新)を行うことを可能とする機能で、この機能はキャリアが必要とする重要な機能と考えています。
ISSUは、ルータのように比較的頻繁にソフトウェアの更新が行われ、しかもコスト的に従来の交換機に比べ、安価に実現しなければならないハードウェアで実現するには、極めて困難が伴います。アルカテル・ルーセントとしても、それはまったく変わりませんが、不具合を改善するためのメインテナンス・リリース(一般的にはパッチ・バージョンと言われることが多い)に関しては、現在ISSUに対応可能になりました。
■今後、HA(ハイ・アベイラビリティ)の拡張としてはどのような機能が検討されていますか?
田中 具体的には、表1のようなHA(ハイ・アベイラビリティ)の拡張機能が考えられています。まず、RSVPのNSR(ノンストップ・ルーティング)、そしてIGMPスヌーピングのNSRがあります。後者では、スイッチ・オーバーしている時でも、コントール・プレーン(制御機能)によって、マルチキャスト転送情報のFIBを維持できるようになります。また、弊社は他社と同様にIPv6への対応を進めていますので、IPv6用のOSPFv3のNSRをサポートしています。これらは、世界的にみて、弊社だけが提供している機能ではないでしょうか。
■ RSVP-TEのためのノンストップ・ルーティング |
---|
RSVP-TE ステート(インタフェース、隣接ノード、セッション情報)を維持したまま、コントロール・プレーン(制御機能部)のスイッチ・オーバー(切り替え)に対応。 (注)RSVP-TE:RSVP Traffic Engineering、RSVPトラフィック・エンジニアリング。RSVP環境で、トラフィック(通信量)が特定の通信回線にだけ集中し、負荷がかからないようにする技術。ファスト・リルート等の拘束迂回技術を使用する場合に、必須となります。 |
■ ノンストップ・ルーティングIGMPスヌーピング |
IGMPステートおよびマルチキャスト転送情報(FIB)をコントロール・プレーンのスイッチ・オーバー時も維持 (注)IGMP:Internet Group Management Protocol、インターネット・グループ管理プロトコル。ルータとホストの間で使用されるプロトコルで、ホストがマルチキャスト・グループへの参加や脱退を、ルータに通知したりするために使用される。 IGMPスヌーピング(のぞき見):レイヤ2スイッチで接続されたパソコン(端末)に対して、IPマルチキャスト・トラフィックを選択的に中継する機能。 |
■ IPv6対応のノンストップ・ルーティングOSPFv3 |
SONET/SDHチャネライズド・ポート上のすべてのチャネル、およびIMAバンドルを保護。 チャネライズドとは、SONET/SDHの各ハイアラキー(速度の階層構成)。例えば、DS0(64kbps)⇒DS1(DS0×24)⇒DS3(DS1×28)⇒OC-3(DS3×3)といった形に、内部を階層化可能なインタフェースのこと。IMA(Inverse Mux ATM、ATM逆多重)とは、具体的には、T1(1.544Mbps)、あるいはE1(2.048Mbps)を複数本束ねて帯域を増大する技術。 (注)APS:Automatic Protection System、自動保護システム MDA:Media Dependent Adapter、メディア依存のアダプタ Any Service Any Port:SONET/SDHの各チャネル単位で、各種のプロトコルを同時に対応可能。具体的にはフレーム・リレー、ATM、HDLC、PPP等 |
■ LDPとT-LDPにおけるグレースフル・リスタート・ヘルパー・モード |
LDP、T-LDPプロトコルのGRが作動したときに、サード・パーティ・ルータのコントロール・プレーンの障害からの復帰を補助。 (注)LDP:Label Distribution Protocol、LSR(ラベル・スイッチ・ルータ)におけるラベル配布プロトコル T-LDP:Targeted LDP、両端のエッジ‐エッジ間で行われるLDPセッション。 |
表1 HA(ハイ・アベイラビリティ)に追加される拡張機能
≪3≫HA(ハイ・アベイラビリティ)の評価と世界市場での導入事例
■このようなアルカテル・ルーセントのHA(ハイ・アベイラビリティ)をキャリア(通信事業者)はどのように評価しているのでしょうか?
田中 例えば、すでにNGNの商用サービスを開始している英国最大手の通信事業者であるBTには、このような通信機器の評価機関である子会社としてBT Exact社があります。弊社はこのBT Exactに、Alcatel 7750SR(サービス・ルータ)やAlcatel 7450 ESS(イーサネット・サービス・スイッチ)を持ち込みまして、試験をしてもらいましたが、その結果においても、99.999%のネットワーク稼働率が証明されています。
■HAを実装した製品を具体的に導入している企業などの実績を紹介していただけますか?
田中 具体的に発表できる事例として、図7に、AT&Tにおけるトリプル・プレイのネットワーク・モデルを紹介しましょう。AT&Tの場合、どのような場面でHAが活用されているかというと、まず、レイヤ2のアグリゲーションで、イーサネット・サービス・スイッチである7450ESSでNSSを実現しています。図7でBSA(※5)として示されています。このNSSに欠かせないのが前述したVPLSです。それは、レイヤ2の代表的なプロトコルであるスパニング・ツリー(※6)では、ノンストップなサービスが不可能だからです。また、リンクの部分については、FRR(ファスト・リルーティング、高速な障害回復機能)を実現しています。加えてIGMPスヌーピング(IPマルチキャスト・トラフィックを、端末を選択して中継する機能)も行っています。
※5 用語解説
BSA:Broadband Service Aggregator、DSLAM(Digital Subscriber Line Access Multiplexer、局側に設置されるADSLモデム装置)やPON(Passive Optical Network)等のアクセス装置を集約しつつ、加入者単位でのQoSやセキュリティ管理等を行う装置(アルカテル・ルーセント独自用語)
BSR:Broadband Service Router、トリプル・プレイ用のエッジ・ルータ、ユニキャスト、マルチキャストをルーティングし、BSAへ転送する。
MC-LAG:Multi Chassis LAG、2台のシャーシにてLAG(Link Aggregation Group)を構成し、リンクおよびノードの冗長性を高める技術
※6 用語解説
スパニング・ツリー(Spanning Tree):ネットワーク内にループ(閉回路)が構成され、データ(パケット)などの出口がなくなり、通信できなくなるようなループ現象を防止する技術。
そして、BSRであるサービス・ルータ「7750SR」においては、1台1台がノンストップであることだけではなく、ネットワークのノンストップを実現するための二重化を行い、マルチキャスト・ルーティングも行うNSS(ノンストップ・サービス)を現実のものにしています。冗長編成(二重構成)にした2台のサービス・ルータをVRRP(※7)で接続し、稼働中の7750SRに異常が発生した場合には、待機中の7750SRに処理が移り、1秒以内の断時間でビデオ配信を継続します。標準のVRRPの場合は処理が速くありません。そこで、弊社でVRRPに独自の改良を加え、1秒以内のスイッチ・オーバーを実現しています。
加えて、このネットワーク全体をサービス・アウェア・マネージャ5620SAMで監視しています。このデータベースも二重化しています。つまり、ネットワークのすべてを二重化しているわけです。
BSAやBSRというのは、アルカテル・ルーセント独自の用語ですが、通常のL2(レイヤ2)スイッチやマルチキャスト・ルータとは異なるということで、あえてこのような表現をとっています。また、このネットワーク構成ですが、加入者管理や、ネットワーク監視装置、BSA、BSRなどを含めて、弊社ではTPSDA(Triple Play Service Delivery Architecture、トリプル・プレイ・サービス配信アーキテクチャ)とし、一つの体系化されたアーキテクチャとして他社との差別化を行っています。
※7 用語解説
VRRP:Virtual Router Redundancy Protocol、仮想ルータ冗長プロトコル。ルータに障害が発生した場合に,同じイーサネット上に接続されている別ルータを経由して、ユーザー端末の通信経路を確保できるようにした機能。この動作をVRRPでは、ホット・スタンバイ(動作中に切り替え可能)にできる。
■AT&TがそこまでHA(ハイ・アベイラビリティ)にこだわるのはどういう理由からでしょうか?
田中 それは、現在、AT&Tの通信ビジネスにおける収入源は、以前は音声(電話)サービスが中心でしたが、今ではビデオ(映像)・サービスが中心に移行してきているからです。このようなことから、ビデオのQoE(体感品質)を守ることが非常に大事なことになってきつつあります。
■AT&T以外には、どのようなカスタマーで稼働実績がありますか。
田中 日本市場では、すでに公表している顧客としては、(株)NTT PCミュニケーションズのほか、数社に導入されています。また、世界的には55か国で130社の顧客に導入されています。例えば、弊社の大手顧客としては、既に名前の出ているアメリカのAT&T、イギリスBTのほかに、直近では、南米ベネズエラの大手電話会社「CANTV」(カン・テー・ベー)がありますが、CANTVではケーブル・テレビのようなサービスをIP上で行っています。ほかに、ベルギーのベルガコム(Belgacom)、インドネシアのインドサット(PT Indosat)、スペインのボーダフォン(Vodafone)、ニュージーランドのトランスパワー(Transpower)などでも実績があります。興味深いのは、これらの顧客のすべてが弊社にHA技術があったからこそ採用されたという事実です。
■日本における具体的な稼働率実績についてお話いただけますか。
田中 日本のある大手のキャリア(通信事業者)から提供されている、広域イーサネット・サービスへの導入事例を紹介しましょう。このキャリアでは、弊社のイーサネット・サービス・スイッチ「7450ESS」が約30台導入されています。同社では、2006年3月に、このスイッチで構成した新ネットワークによってサービスの提供を行っていますが、それ以来毎月、ネットワークの月間稼動率を発表していますが、すべて100%であり、完全にハイ・アベイラビリティ(HA)を実現しています。つまり、現在まで、ネットワークが停まるような事態は一度も起こっていませんので、まだNSSの出番がないほどです。これは、アルカテル・ルーセント製品の元々の品質の高さを示している数字だと思います。
≪4≫今後の展開:絶対に止めてはならない
■今後の展開について一言お願いします。
田中 ここまでお話したように、アルカテル・ルーセントでは、ルータやスイッチなどの各種の通信関連機器にHAの機能をふんだんに盛り込んで通信事業者が安定したサービスを提供できるように支援してきています。これによって、通信事業者は、IPの上で安定したQoEの高いビデオ(映像)や音声サービスが提供できるようになり、また企業に対してもセキュアで安定したミッション・クリティカル(基幹業務)なサービスを提供できるようになってきています。
前述しましたように、企業においてITを駆使し、いろいろなアプリケーションを走らせている現状のビジネス環境において、システムがダウンすることは、通信事業者にも、企業ユーザーにも莫大な損失を与えますので、これらは絶対に止めてはならないのです。NGN時代をさらに発展させるために、弊社は、今後もHA(ハイ・アベイラビリティ:高稼働率)の機能の強化と拡充を続けてまいりたいと思います。
■ご多忙のところありがとうございました。
プロフィール
田中 厚
1989年 ネットワーク専業メーカー アンガマン・バス株式会社に入社、TCP/IP関連ソ フトウェア開発業務を担当、後に製品担当マーケティングに転属
1999年 日本アルカテルに入社。IP系製品のプリセールスエンジニアを担当、現在に至る