AITRASに秘められたソフトバンクの“こだわり”
〔1〕低消費電力のArm Neoverse V2プロセッサ
「我々ソフトバンクは、以前からArm注13のプロセッサにこだわっています。その理由はプロセッサにおけるコア数が多い割に、低消費電力であること、すなわち地球温暖化対策としても優れたプロセッサであることです。それが奇しくもNVIDIAのGH200に搭載されており、実際に低消費電力を実現しています」と湧川氏。
GH200の定格消費電力は1,500Wだが、ソフトバンクの計測によれば、実際の消費電力は1基地局あたり25W程度、1機のGH200で20本のアンテナを駆動するため、合計で500W(=25W×20本)程度でしかない。これには、Arm Neoverse V2プロセッサが大きく貢献している。同社で消費電力量を計測したところ、Armは他社CPUに比べて約半分程度でしかなったという測定結果が出ている(図11)。
このArmプロセッサ上に仮想化基盤を構築することもAITRAS開発の大きなチャレンジであったが、ソフトバンクではオープンソフトウェアソリューション企業である米Red Hat とともに機能開発を進めてきた。
図11 AITRAS vRANの消費電力
vRAN:Virtual RAN、仮想RANのこと
出所 ソフトバンク株式会社提供資料「ソフトバンクのAI-RANの実装と新プロダクトについて」
〔2〕過干渉を排除するソフトウェア基地局間の制御
AITRASはすべての信号処理をソフトウェアで行っており、信号はすべて親局にあるGH200で一元処理している。これはアンテナ同士の過干渉を徹底的に抑えることが目的だ。
これまで信号は分散的な処理を行っていたが、そうするとアンテナ密度が高くなった際に、高度な基地局間協調制御やMassive MIMOのコントロールが難しくなる。ソフトバンクではそれを避けるために、信号処理はすべて親局で行い、さらにAIによって制御の強化も行っている。
〔3〕稼動率100%を目指すAIオーケストレーター
AI-RANには、ピーク時以外の深夜などに余っているデータセンターのデータ処理能力をAIに振り分けるというコンセプト(AI and RAN)がある。これにより通信インフラの常時100%の稼動を目指している。そのカギとしてソフトバンクで新たに開発しているのが、AIオーケストレーターだ(図12)。
図12 AITRASにおけるAIオーケストレーターの役割
出所 ソフトバンク株式会社提供資料「ソフトバンクのAI-RANの実装と新プロダクトについて」
RANとAI処理、それぞれの稼動状況を常にモニタリングし、要求に応じてCPUやメモリなどの調整を行う。夜間などRANの稼動が減少したらAI処理を増やすほか、AI処理の内容や遅延の要求レベル、必要帯域などに応じて、適切に全国の各データセンターへの振り分けを行う。
AIオーケストレーターでは、NVIDIAのMIG(Multi Instance GPU)が活用されている。MIGは、1つのGPUサーバをロジカルに分割して利用できるようにする機能で、AIの処理容量に応じてパフォーマンスを最適化する(図13)。
図13 NVIDIA MIGによるAI処理容量に応じたパフォーマンス最適化のデモ(例)
※上図は、GPU使用状況のグラフで、AI、RANそれぞれの利用率が時系列で確認できる。またGPUはいくつかのコアに分かれており、CUDAコアはRAN、TensorコアはAIの処理を行っている。
MIG:Multi Instance GPU
Tensorコア:NVIDIAが開発した技術の1つで、AIや大量データに対して複雑な演算処理を高速に行う演算回路
出所 ソフトバンク株式会社提供資料「ソフトバンクのAI RAN の実装と新プロダクトについて」
注13:Arm:プロセッサIPのリーディングテクノロジープロバイダ。英国ケンブリッジに本社があり、ソフトバンクグループ傘下の半導体設計の大手企業。CPU(Central Processing Unit、一般的なコンピューティング用に設計されたプロセッサ)およびNPU(Neural Network Processing Unit、人間の神経系を模倣するプロセッサを通じてAIアプリケーションを加速するために設計されたプロセッサ)などを提供している。