ページの先頭です

ページ内を移動するためのリンク
本文へ (c)

ここから本文です。

VMware環境でのNVIDIA GPUを利用したAIの学習と推論

ライター:荒牧 大樹
2007年ネットワンシステムズ入社し、コラボレーション・クラウド製品の担当を経て現在はAI・データ分析製品と技術の推進に従事。最近では次世代の計算環境であるGPU・FPGA・量子コンピュータに注目している。

目次

はじめに

NVIDIAはVMwareとの戦略的な提携を発表し、NVIDIA AI Enterpriseを発表しました。今回はその基礎となっている、VMwareの仮想化環境でのNVIDIAのGPU利用について解説します。
今後、企業内でAIの開発や利用が益々浸透すると考えられています。AIの開発や利用ではGPUの利用はキーとなりますが、現在のようにGPU専用機を用意してユーザ間で共有する方式は、企業内でのGPU利用の柔軟性に問題が出てきます。これを解決する為に、企業で標準的に利用されているVMwareの仮想化技術とNVIDIA GPUの仮想化対応の仕組みを組み合わせる事により、GPUの取り回しが容易となり、より気軽にGPUを使ったAIの開発や利用が可能となります。

仮想化環境でのGPU利用

仮想化環境でのGPU利用は、VDI等でDesktop向けにグラフィックを提供する為に利用されてきました。最近では機械学習等の演算目的でもGPUが利用されており、仮想マシンにGPUを添付しての演算も利用例として出てきました。機械学習の中で、特にDeep Learningの学習や推論を行う場合にGPUを利用すると、劇的に計算時間を短縮する事が可能となっています。
今回は一般的に企業内の仮想化環境で利用される、VMware環境の仮想マシンにNVIDIAGPUを添付して利用する場合について説明します。

仮想化環境でのNVIDIA GPUの利用

仮想化環境でGPUを利用する場合は、PCIデバイスとしてGPUを仮想マシンに対して添付します。この構成を行う場合、NVIDIAのライセンスが必要となります。GPUの仮想化ライセンスは用途別に分かれており、今回の用途ではNVIDIAではvCSと呼ばれるライセンスが必要となります。仮想マシンをライセンスサーバに登録すると、ライセンスが適用されます。ライセンスを正しく適用しない場合は、起動時間に応じて様々なGPUの機能制限を受ける事となります。制限について、詳細は以下のサイトが参考になります。

Software Enforcement of NVIDIA vGPU Software Licensing

VMware環境でのGPU利用

VMware環境でGPUを利用する場合は、PCI-PassthroughvGPUMIG3つの利用形態があります。PCI-PassthroughGPUPCIデバイスとして直接仮想マシンに添付します。その為、GPU1つの仮想マシンにしか添付出来ません。vGPUはメモリの分割と、コアの時間分割を行って1つのGPUを複数のGPUに仮想的に分割して、仮想マシンに添付します。MIGは最新のGPUからサポートされた機能で、vGPUとほぼ同等ですが、コアを時間分割で無く、物理的に分割して仮想マシンに添付します。その為MIGを利用すれば、同一GPUで動作している他の仮想マシンのワークロードの影響を受けにくくなります。いずれの利用形態でもNVIDIAのvCSのライセンスが必要です。

実際の構成

VMware環境でGPUを仮想的に利用する場合は、以下の手順が必要となります。

1. Licenseサーバをインストール

2. ESXi環境にドライバーをインストール(PassThrough時には必要無い)

3. vCenter側でホストのGraphic Typeの設定を行う

4. 仮想マシンを作成してGPUを添付する

5. 仮想マシンにNVIDIA Driverのインストール

6. ライセンスサーバに仮想マシンを登録

以下はvGPUの例ですが、正しく設定を行えばvCenterで仮想マシン作成時に以下のようにGPUを添付する事が可能となります。

まとめ

ここまで、VMwareの仮想化環境とNVIDIAGPUについて解説しました。今後ネットワンでは仮想化環境でのGPU活用の検証を更に進め、今後正式にリリースされるNVIDIA AI Enterprise等への対応を考えています。

※本記事の内容は執筆者個人の見解であり、所属する組織の見解を代表するものではありません。

RECOMMEND