[特別レポート]

AI-RAN統合ソリューション「AITRAS」、開発とそのロードマップ

― 2026年度にソフトバンク商用網でサービスを展開 ―
2025/03/12
(水)
インプレスSmartGridニューズレター編集部

評価環境を大学キャンパス内に設置、RANによる通信を開始

 AITRASのデモ環境は、慶應義塾大学湘南藤沢キャンパス(以下、SFC。神奈川県)に構築され、ソフトバンク竹芝本社(東京都)のリソースとあわせて運用している(図4、図5)。ここでは4.8〜4.9GHz、最大100MHzの帯域幅の実験用ローカル5Gを構築し、最大4レイヤのSingle User MIMO注5、4T(送信:4Tranceiver)4R(受信:4Receiver)のアンテナ20本を1台のNVIDIAのGH200サーバで駆動している。ただし、RANのL2、L3注6レイヤのプロトコルは並行処理となるため、RAN用のGH200は2機設置されている。
 図5のように、SFCでは都市部を想定して意図的にアンテナを高干渉となるように設置しているが、この環境下で100台のスマートフォンを使って同時アクセスを行い、トラフィックの状況や消費電力などを確認している。
「安定性、通信容量、消費電力、すべてに我々が求めるキャリアグレードを目指し、極限までの調整を進めています」と湧川氏は現在の開発状況について語る。
 この「RANパート」と以降で述べる「Edge AIパート」は、I-UPF(Intermediary User Plane Function、データ転送レイヤ。図4参照)で直結され、通信とAIそれぞれの要求に応じた機能やパフォーマンスを提供する。

図4 AITRASシステムアーキテクチャの概要

CU:Control Unit、コントロール・ユニット。CPUの動作を制御
DU:Data Unit、データユニット。データの算術演算や論理演算を行う
YOLO:You Only Look Once。画像中の物体を検出するための画像認識アルゴリズム
LoRa:ディープラーニングモデルで、画像生成AIの調整に使用する手法
Llama3:米Meta社が開発したオープンソース大規模言語モデル
NIM:NVIDIA Inference Microservice。AIモデルの推論環境を本番環境で利用可能にするためのサービス
NVIDIA Riva:多言語スピーチ/翻訳AIを構築するためのサービス
出所 ソフトバンク株式会社提供資料「ソフトバンクのAI-RANの実装と新プロダクトについて」

図5 都市部を模擬したSFCでのAITRAS評価環境

出所 ソフトバンク株式会社提供資料をもとに編集部で作成

Edge AIがAI処理を担当

 AIサービス用のGH200は、評価環境においてはSFCの4機に加えてソフトバンク竹芝本社にある5機があてられている。
 ここでAI処理を担当するEdge AIは、NVIDIA AI Enterpriseに対応している(図6)。このNVIDIA AI Enterpriseは、現在、AI処理の標準的なフレームワークとなっているもので、これはLLM注7(大規模言語モデル)の複雑な開発などをサポートする機能群である。
 さらに、GPUの処理能力を要求に応じて割り当てる機能であるNVIDIA Serverless APIも搭載されている。これを活用してGPUリソースをコンテナ化注8しAIサービスへ提供することによって、各企業からのスポット的(単発的)なAIニーズにも対応する。

図6 AITRASの要素技術:Edge AI

出所 ソフトバンク株式会社提供資料「ソフトバンクのAI-RANの実装と新プロダクトについて」


注5:Single User MIMO:MIMOの通信方式の1つで、送信側と受信側は常に1:1の関係となる方式。
注6:L1/L2/L3:L1:vRAN(仮想RAN)ソフトウェア構造におけるOSI参照モデルで、L1は物理層(Layer1、第1層)、L2はデータリンク層(Layer2、第2層)、L3はネットワーク層(Layer3、第3層)。OSI(Open Systems Interconnection)は、開放型システム間相互接続の意。異機種コンピュータ間で通信を行う際に必要とされる機能を階層ごとに整理した7階層の参照モデルのこと。
注7:LLM:Large Language Models、大規模言語モデル。「言語モデル」の一種で、コンピュータによる「計算量」、学習に使用される「データ量」、モデルの複雑さを示す「パラメータ数」の3要素を大規模化したもの。「言語モデル」は日常生活の中で使っている言語(自然言語)をコンピュータが理解するために数値化するモデル。大規模言語モデルでは、大規模化によって従来の言語モデルとは比較にならない高い性能を発揮している。
注8:コンテナ化:サーバ内を整理してアプリケーション処理等を効率的に行えるようにする仮想化技術。

関連記事
新刊情報
5G NR(新無線方式)と5Gコアを徹底解説! 本書は2018年9月に出版された『5G教科書』の続編です。5G NR(新無線方式)や5GC(コア・ネットワーク)などの5G技術とネットワークの進化、5...
攻撃者視点によるハッキング体験! 本書は、IoT機器の開発者や品質保証の担当者が、攻撃者の視点に立ってセキュリティ検証を実践するための手法を、事例とともに詳細に解説したものです。実際のサンプル機器に...
本書は、ブロックチェーン技術の電力・エネルギー分野での応用に焦点を当て、その基本的な概念から、世界と日本の応用事例(実証も含む)、法規制や標準化、ビジネスモデルまで、他書では解説されていないアプリケー...