─編集部 AI for RAN とOpen RANとの違いはどの点にありますか。
湧川 Open RANはオープンインタフェース仕様に基づいて構築するRAN(無線アクセスネットワーク)で、O-RANアライアンス注7で標準化が進められています。O-RANアライアンスが切り拓いた無線機のソフトウェア化という世界観を、AIでさらに高度化するというところに、この「AI for RAN」の特徴があると私は考えています。
また、仮想化技術注8によってvRANの活用も進められていますが、この汎用サーバ上でvRANを実装する方法は、従来の無線機専用のハードウェアに比べるとどうしても性能が落ちるという傾向がありました。
実はソフトバンクは、日本で一番多くのトラフィック(無線通信量)を取り扱っているキャリアなのですが、そのトラフィックは主にTDD(時分割方式複信)方式の基地局で処理されています。TDD方式の基地局はFDD(周波数分割複信)方式のそれよりも周波数幅が広く、Massive MIMO注9に代表される空間多重技術も多く使用されており、多くのユーザーの同時通信が可能になります。
しかし、このTDD方式の特徴はvRAN化にあたっては大きな課題となりました。基地局セル数×帯域幅×多重数に比例して増大する信号量が、汎用サーバ上のvRANソフトウェアで処理できる限界を超えてしまうのです。数多くのTDD方式の基地局数をもつソフトバンクにとって、お客様の通信を処理できなくなる、もしくは同じ基地局を展開するための汎用サーバへの投資がより大きくなるという懸念がありました。しかし、AI-RANによってネットワークの性能を一段と向上させることで、これらの懸念を一掃できる可能性があるのであれば、これはぜひ挑戦すべきだろうと考えています。
新たな収益源を生み出し、テレコムの事業転換を促す「AI and RAN」
─編集部 テーマの2つ目、「AI and RAN」についてお聞かせください。
湧川 携帯電話事業は社会の重要インフラであるため、非常に高い信頼性が求められます。そのため、携帯電話設備は想定されるピークトラフィックにさらに安全係数を掛けた通信量に常に耐えられるように設計されています。そのため、深夜帯はもちろんのこと、ピークを除くほとんどの時間でRAN装置のリソース(コンピューティング能力)には余裕があります。その余剰リソースをRAN以外のアプリケーションに活用しようというのが、この「AI and RAN」のコンセプトです(図6)。
AI-RANの実装方法の1つに、サーバのアクセラレータ(アプリケーション処理を加速化する技術)として、前述したGPU(画像処理装置)を使うものがあります。これはTD-LTEのような広帯域な周波数のvRAN化に特に有効とされており、従来のOpen RANの開発ではあまり主流ではなかったアイデアです。
そして、RANとして導入したGPU搭載サーバの平時は使用していないリソースを、例えばAI推論(AIが新しいデータから結論を導き出すために使用する計算処理)などに活用できれば、同じGPUにAIサービスという2つ目の収入源をもたせることができるようになるわけです。。
そうなれば、無線ネットワークの維持・管理コストをAIサービスの売り上げだけで相殺できる、うまくいけば利益を生み出せるかもしれません。テレコム企業にとってこれは大きな事業転換となります。AIは現在急成長している領域で、マーケットはこれから10倍、100倍と膨らんでも不思議ではありません。またAIに限らず、GPUを使うアプリケーションはこれからさまざまに開発されるので、幅広い将来性も見込めます。ソフトバンクのような移動通信事業者にとっては、まさに一大チャンスといえます。
図6 「AI and RAN」とAIの設備共通化
出所 ソフトバンク先端技術研究所、「AI-RANアライアンスに関するご説明」より一部日本語化して掲載
20msecの超高速伝送サービス基盤「AI on RAN」
─編集部 テーマの3つ目、「AI on RAN」についてはいかがでしょうか。
湧川 「AI on RAN」は、RANのエッジ(クラウドやデータセンターではなく、基地局に代表されるようなユーザー端末に物理的に近い場所)でAIを稼働させようというものです。5G化によって無線の通信速度はそれまでの50〜70msec(msec:ミリセック、1000分の1秒)から10〜20msecへと、約3分の1に高速化されました。しかし、ユーザーが最終的に利用するサービスは基本的にクラウドにあり、そこでのネットワーク速度は早くても200msecです。無線がせっかく高速化しても、クラウドの通信速度を含めるとエンド・ツー・エンドで(端末から端末まで)220msec(200msec+10msec+10msec)もかかっているのが現状です(図7上部)。
そこでソフトバンクではクラウドを利用するのではなく、図7下部に示すように、RANのエッジ側に各種アプリケーションやサービスを置くことを考えたのです。AI-RANサーバ(vRAN+AI推論)上でAI推論を走らせれば、エンド・ツー・エンドで20msecという驚異的な性能を出すことができます。
図7 5Gを活かすインフラ構造
BBU:Base Band Unit
出所 ソフトバンク先端技術研究所、「AI-RANアライアンスに関するご説明」
─編集部 クラウドを使用しないでエッジ側で処理すると、20msecまで低遅延化できるのですね。
湧川 そうなんです。AI推論を使用して今後、例えば自律型ロボットと自然言語で会話することを目指したとき、現在の通信速度では遅くて会話が成立しません。ロボット内にGPUを組み込んで高速処理することも考えられますが、それでは消費電力が大きすぎてバッテリーなどの問題が出てくるため、やはりAI-RANのようなエッジサーバ上で処理するほうが現実的となるでしょう。
また、AI推論は、監視カメラの運用にも適しています。映像をAI解析して瞬時に犯罪被疑者を特定する、しかもそれを高解像度の4K映像で実行するといったとき、ネットワークの遅延や帯域の問題がどうしても出てきます。その場合も低遅延で広帯域のvRANとAIサーバがセットになっているAI-RANであれば対応することが可能です。
さらに、RANはクローズドネットワークですから、このことはセキュリティの確保にも有効です。今、企業で大規模言語モデル(LLM:Large Language Models、生成AIを広く普及させた言語モデル)の構築を進めていますが、それを社内ネットワーク上に構築した場合、ハッキングによって企業の機密情報が外部に容易に漏えいしかねません。そういうシステムはやはりクローズドネットワーク上に構築すべきですし、それに対応したネットワークとコンピューティングを同時に提供できるのは、私達(ソフトバンク)のような移動通信事業者だと思っています。
注7:O-RAN アライアンス:Open Radio Access Network Alliance。Open RAN(オープン化された無線アクセスネットワーク)のインテリジェント化やオープンインタフェース仕様の策定などを目的に、世界の通信事業者が2018年2月に設立した業界団体。
注8:仮想化技術:物理的なハードウェアの機能をソフトウェア(論理)によって統合・分割する技術。これによって、1台のサーバなどの物理リソースが複数あるかのように利用可能となる。
注9:Massive MIMO:大量のアンテナ素子を使用したMIMO(Multiple Input Multiple Output)。