2020/05/27
TECH Report は HPC テックスタッフからの情報発信です。
Quadro RTX 8000 にはアクティブタイプとパッシブタイプがあります。実際に構成するにはどちらが良いのか、大きな違いはなく単純な冷却タイプの違いだけなのかどうか調べました。
今回は性能評価に N体問題で浮動小数点を測る nbody、HPC 系で使われる NAMD 及び gromacs、Deep learningでよく使われる pytorch の 4つを使いました。
検証環境1 | 検証環境2 | |
GPU | Quadro RTX8000 active (GPU MEM 48601MiB ) |
Quadro RTX8000 passive (GPU MEM 45556MiB) |
サーバ | HPCT WR26gs | |
CPU | Intel Xeon Processor Platinum 8270 x2 | |
メモリ | DDR4-2933 Total 768GB | |
SSD | 480GB |
アクティブタイプの方が 3%程度高速になっています。
検証環境1 | 検証環境2 | |
nbody N=1280000 | 10788.5325 | 10462.004 |
単位 gflops___
NAMD の公式に置いてあるインプットでは 1%ない程度の差になっています。
NAMD-1GPU 16para | 検証環境1 | 検証環境2 |
apoa1 | 31.775007 | 31.806198 |
f1atpase | 45.309689 | 44.983135 |
Stmv | 72.148338 | 72.775688 |
単位 sec___
測定誤差もあるとは思いますがおおむね大きな差は無く 1%程度です。
ただ 20k-atoms で 3%程度の差が出ているので、ある程度バラつきがあると考えています。
gromacs-1 プロセス | 検証環境1 | 検証環境2 |
20k-atoms | 244.2357 | 236.8296 |
61k-atoms | 73.8019 | 73.0124 |
465k-atoms | 2.6701 | 2.6746 |
1400k-atoms | 1.7772 | 1.7745 |
3000k-atoms | 0.6478 | 0.6479 |
単位 ns/day___
今回試した中では顕著に差があり、アクティブタイプがパッシブタイプに対して 10%程度高速でした。
検証環境1 | 検証環境2 | |
pytorch-cifar10 | 2894.346 | 3167.254 |
単位 sec___
Quadro RTX 8000 はアクティブタイプの方が若干高性能だという結果がでました。
今回のテストを見る限りでは HPC 利用での性能差は小さめなので致命的な差はなさそうですが、Deep Learning 利用では 10%近く差がついています。またパッシブタイプは搭載されている GPU メモリが少なく、映像出力もついていないため、ただの冷却タイプの違いではなくまったくの別ものとして考えた方が良いでしょう。
エアフローに無理がないのであればアクティブタイプがおすすめです。
HPC TECH Laboratory Staff