Infrinia が拓く新たなニーズ

〔1〕利用形態に応じたGPUクラウドサービスを容易に実現

　Infriniaは、GPU管理の基礎OS的な部分をデータセンターにインストールするソフトウェアとして提供することが想定されている（図7および図8、青の部分）。

図7　Infrinia は事業者自身のインフラ資産を活用して顧客向けGPUクラウドサービスを提供可能

図8　Infrinia のシステム構成と機能の提供範囲

　基本的な構成は、ポータル、課金、ユーザーデータベースなどはGPUクラウドの提供事業者側のシステムと連携できるようAPIを用意し、GPUなどのハードウェアも、事業者自身のリソースを使う（図8）。
　これによって、独自のGPUアセットをもつ事業者による、自社ブランドGPUクラウドを立ち上げることが容易に可能となる。NVIDIAのGB200 NVL72アーキテクチャを採用している事業者であれば、Infriniaのソフトウェア一式をそのまま導入でき、GPUクラウドなどのサービスも短期間で立ち上げることができる。
　Infriniaを利用する事業者の第一弾として、ソフトバンクがこのソフトウェアを活用した新たなGPUクラウドサービスを日本国内で展開する予定である。

〔2〕AI開発への柔軟に適応

　現在、AI開発でGPUを必要とするユーザーの目的は大きく3つのタイプに分けられる。各利用形態は大きく異なるが、Infriniaはそれぞれに適応した機能をもつ。

　（1）タイプ1：学習
　大規模なモデル学習を行うためには、長期間にわたって大量のGPUをフル稼働させる必要がある。これまでは主にハイパースケーラーが対応してきた領域であり、それはInfriniaでも対応可能となる。

　（2）タイプ2：ファインチューニング^注7
　既存のAIモデルのカスタマイズや調整を行う、ユーザー向けの機能。使用時間が短いため、サーバをまるごと借りると高コストになりがちだが、Infriniaが提供するKubernetes環境によって、柔軟で効率的なGPUの利用が可能になる。

　（3）タイプ3：推論
　Infriniaでは推論APIを提供しており、これによって利用可能だ。この計算は極めて短時間での処理が多い。Infriniaに実装されているInf-aaS機能などによって、AIモデルをアップロードするだけでサービスの提供が可能となる。

〔3〕ソブリンクラウドやデジタル貿易赤字対策にも寄与

　データの主権を自国や自社内で維持する「ソブリンクラウド」（Sovereign Cloud）へのニーズは、安全保障の観点から各国でも急速に高まっている。ハイパースケーラーからソフトウェアだけを借りることは困難であり、自社での開発運用も高スキルな技術者の確保と高コストの問題がある。Infriniaであればソフトウェア単体での提供が可能であるため、政府機関や重要インフラ事業者などが自前で運用するAIクラウドとしても適性をもつ。

Infrinia から「次世代のAI基盤」が拡がる

　Infriniaは、2026年2月12日、主に開発者向けのプロダクトプレビューをした。そして、まずはソフトバンクの日本国内向けのGPUクラウドサービスとしての実装を予定しており、その後、ソフトウェアの販売も予定している。
　AI時代のインフラ整備は、GPUがカギを握っている。GPU基盤を自前でもつことは、デジタル主権とビジネス競争力の両面で重要な意味をもつ。Infriniaは、これまでハイパースケーラーの独占状態だった高度なGPUクラウド機能を開放することで、次世代AI基盤化を推進する。このことは、今後のAI市場に新たな地殻変動を引き起こすことだろう。

※本記事で掲載した図はすべてソフトバンク先端技術研究所資料より。

注7：ファインチューニング：既に学習済みのAIモデルに追加学習させて精度や専門性を微調整する手法。