「Infrinia AI Cloud OS」とは? ―次のAI時代を拓く、日本発のGPUクラウド基盤ソフトウェアが誕生!―[3ページ目]

〔3〕推論サービスのためのAPI提供とKubernetes隠ぺい

 推論用途としては、Kubernetesすら触ることなく、純粋な推論サービスをGPUクラウドとして望むユーザーも存在する。具体的には、ユーザーがLLMのモデルを選択する、またはもち寄るだけで、GPUやKubernetesを意識することなく、推論サービス用のAPI(Application Programming Interface)を利用する形だ。
 Infriniaは、これらの機能も併せもつ。
 Kubernetes上に推論サービスとAPIを搭載することができるので、Kubernetesの運用をGPUクラウド事業者自身が行うことで、ユーザーにはLLMモデルの選択とAPIのみを提供するというサービスを行うことができる。つまり、Inf-aaSが実現できるというわけだ。加えて同APIは、一般的なOpenAIの仕様と同じなので、ユーザーは接続先を変えるだけで、自己の推論基盤を簡単に乗り換えることができる(図5)。
 もちろんユーザー自身のKubernetesクラスタ上に推論APIを提供することも可能なので、ユーザーがGPUの利用規模を含めて自身で運用する形態もとることができ、GPUクラウド事業者は高い柔軟性をもったサービスを提供することができる。

図5 KaaSプラットフォーム上で最適化されているInf-aaS機能(推論環境)

図はKaaSを基盤とし、その付加機能としてInf-aaSが実装されている構造を示している。
一般に、推論環境(Inf-aaS)を効率的に運用するには、コンテナ管理やリソースの柔軟な割り当てを担う仕組みが不可欠である。Infriniaにおいてはその役割をKaaSが担っている。そのためInf-aaSは単体で存在するのではなく、KaaSという土台の上で動作する「付加機能」(Function)として定義されている。したがって、推論環境(Inf-aaS)のみを利用する場合であっても、リソース管理やオーケストレーションを司る基盤として、KaaSの導入は必須となる。

〔4〕NVIDIA GB200シリーズを初期ターゲットに開発

 Infriniaは、NVIDIAの最新アーキテクチャ(構造)である「GB200 NVL72」を初期のターゲットとしている。この世代は、GPUを4基搭載した「トレー」を18枚搭載しており、合計72基のGPUがNVLinkというGPU間の高速ネットワークによって直接接続され、巨大なワークロードを高速に処理することができる。Infriniaには、この性能を最大限発揮するための設計も加えられている。
 Infriniaは、GPUを仮想化せずにベアメタル(仮想化されていない)状態でKubernetesに接続することでパフォーマンスを発揮する構造となっているが、これに加えてNVLink接続を最大限利用するための自動設定なども行われている。そのため、「トレーを複数枚利用したい」ユーザーは、必要な枚数を(柔軟に)確保できる。
 また、GB200 NVL72のラック内で、各トレーはNVLinkで高速に接続されているため、同一のラック内でトレーを確保すれば、性能は最大限発揮できる。そのため、例えばAIモデル学習に利用する際には、ユーザーはできる限り同一のラック内でトレーを確保したいと考えるだろう。
 しかし逆に、ユーザーがAI推論に利用する際には、個々の処理は1つのトレー内で完結できるほど短時間で終わるものの、大量のリクエストに対して並列に処理を行う場面も発生し得る。このためユーザーは、耐障害性を高めるために別ラックのトレーを確保したくなることも考えるだろう。
 Infriniaは、空いているGPUリソースを割り当てる際、AIモデル学習、AI推論のどちらのケースにも対応が可能であり、ユーザーニーズに柔軟にフィットするサービスを提供できる(図6)。

図6 InfriniaはAIモデル学習(性能重視)、AI推論(耐障害性重視)の両ユーザーに柔軟に対応

[ラック構成例:NVIDIA GB200 NVL72(各18トレーを格納)]
■水色エリア(ラックA):AIモデル学習の最適化
同一ラック内のリソースをNVLinkで高速連結し、演算性能を最大化。AIモデル学習に求められる圧倒的な処理能力を実現する。
■緑色エリア(ラックA、Bに分散):AI推論の最適化
2つのラックにまたがる並列構成を採用。片方のラック障害時もサービスを継続できる可用性を備え、信頼性重視の推論フェーズに対応する。

この記事のキーワード

人気記事トップ10

人気記事ランキングをもっと見る
インプレスSmartGridニューズレター

定期購読は終了いたしました