実用化段階に入ったAI-RAN統合ソリューション「AITRAS」!
2026年2月13日 (金曜) 16:18
AI-RANの統合ソリューション「AITRAS」(アイトラス)は、ソフトバンクが2024年11月に発表し、現在開発を本格化させている次世代インフラ基盤だ。同社は2026年度をターゲットに自社商用ネットワークへの導入に加えて、国内外への展開を目指している。
AITRASは、無線通信のパフォーマンスを最大化させるだけでなく、通信事業者は既存のRANインフラへの投資を継続しながらAIインフラの構築ができ、効率的なネットワーク運用が期待できる。
本稿では、「AITRAS」の概要とともに、実用化に向けた基盤実装の進捗や、具体的なユースケースについてレポートする。
「AITRAS」とは?
AITRASは、RAN(無線アクセスネットワーク)とAI(人工知能)を同一のコンピュータプラットフォーム上で動作可能にする統合ソリューションである。大容量、高性能、高品質なRANをキャリアグレード注1で提供するほか、同時に生成AIなどのAIアプリケーションの効率的な処理と運用を目標に開発が進められている。これによって、通信サービスのほかにAIを活用した各種通信サービスやAI処理単独のサービスの提供などを目指す。
AITRASのシステム構成は図1の通り。大規模AIを視野に新設計されたNVIDIAのGPU注2であるGH200 Grace Hopperプロセッサ上に並行処理のためのMPS(MultiProcess Service)、MIG(Multi Instance GPU、後述)による仮想化基盤を構築し、その上にL1からL3の無線信号の処理ソフトと、AIサービス用のEdge AI(エッジAI)を配置している。無線通信とAIサービスはオーケストレーター(自動的に管理・運用するソフト)によって管理・制御される(後述)。
図1の紺色部分を主にソフトバンクが開発し、その他はパートナー企業とのコラボレーションによって共同開発されている。
図1 AITRASのシステム構成と、各パートナーとのアライアンスの状況
出所 ソフトバンク先端技術研究所
評価環境を大学キャンパス内に設置、RANによる通信を開始
AITRASのデモ環境は、慶應義塾大学湘南藤沢キャンパス(以下、SFC。神奈川県)に構築され、ソフトバンク竹芝本社(東京都)のリソースとあわせて運用している(図2、図3)。ここでは4.8-4.9GHz、最大100MHzの帯域幅の実験用ローカル5Gを構築し、最大4レイヤのSingle User MIMO注3、4T(送信:4Tranceiver)4R(受信:4Receiver)のアンテナ20本を1台のNVIDIAのGH200サーバで駆動している。ただし、RANのL2、L3注4レイヤのプロトコルは並行処理となるため、RAN用のGH200は2機設置されている。
図3のように、SFCでは都市部を想定して意図的にアンテナを高干渉となるように設置しているが、この環境下で100台のスマートフォンを使って同時アクセスを行い、トラフィックの状況や消費電力などを確認している。この「RANパート」と以降で述べる「EdgeAIパート」は、I-UPF(Intermediary User Plane Function、データ転送レイヤ。図2参照)で直結され、通信とAIそれぞれの要求に応じた機能やパフォーマンスを提供する。
図2 AITRASシステムアーキテクチャの概要
CU:Control Unit、コントロール・ユニット。CPUの動作を制御
DU:Data Unit、データユニット。データの算術演算や論理演算を行う
YOLO:You Only Look Once。画像中の物体を検出するための画像認識アルゴリズム
LoRa:ディープラーニングモデルで、画像生成AIの調整に使用する手法
Llama3:米Meta社が開発したオープンソース大規模言語モデル
NIM:NVIDIA Inference Microservice。AIモデルの推論環境を本番環境で利用可能にするためのサービス
NVIDIA Riva:多言語スピーチ/翻訳AIを構築するためのサービス
出所 ソフトバンク先端技術研究所
図3 都市部を模擬したSFCでのAITRAS評価環境
TDD:Time Division Duplex、時分割複信
Single User MIMO:MIMO(Multiple Input Multiple Output)の通信方式の1つで、送信側と受信側は常に1:1の関係となる方式
4T4R:4T(送信:4Tranceiver)/4R(受信:4Receiver)
EIRP:Equivalent Isotropic Radiation Power、等価等方放射電力(あるいはEffective Isotropically Radiated Power、実効等方放射電力)
dBm:デシベルミリワット。電波強度を表す単位
出所 ソフトバンク先端技術研究所提供資料をもとに編集部で作成
AI処理はEdge AIが担当
AIサービス用のGH200は、評価環境においてはSFCの4機に加えてソフトバンク竹芝本社にある5機があてられている。
ここでAI処理を担当するEdge AIは、NVIDIA AI Enterpriseに対応している(図4)。このNVIDIA AI Enterpriseは、現在、AI処理の標準的なフレームワークとなっているもので、これはLLM(大規模言語モデル)の複雑な開発などをサポートする機能群である。
さらに、GPUの処理能力を要求に応じて割り当てる機能であるNVIDIA Serverless APIも搭載されている。これを活用しGPUリソースをコンテナ化注5しAIサービスへ提供することによって、各企業からのスポット的(単発的)なAIニーズにも対応する。
図4 AITRASの要素技術:Edge AI
出所 ソフトバンク先端技術研究所
注1:キャリアグレード:通信事業者が通信網の構築や運用に使うことができると判断した高い水準。
注2:GPU:Graphics Processing Unit、ジーピーユー。3Dグラフィックス(3次元画像)や映像の処理を行うプロセッサ。
注3:Single User MIMO:MIMOの通信方式の1つで、送信側と受信側は常に1:1の関係となる方式。
注4:L1/L2/L3:L1:vRAN(仮想RAN)ソフトウェア構造におけるOSI参照モデルで、L1は物理層(Layer1、第1層)、L2はデータリンク層(Layer2、第2層)、L3はネットワーク層(Layer3、第3層)。OSI(Open Systems Interconnection)は、開放型システム間相互接続の意。
注5:コンテナ化:サーバ内を整理してアプリケーション処理等を効率的に行えるようにする仮想化技術。



