2016/07/11
NVIDIA 社より最新のアーキテクチャ “ Pascal ” を採用した GeForce GTX 1080 が発売されました。性能、消費電力ともに 前モデル GeForce GTX TITAN X よりも上回るスペックが公表され、Deep Learning 分野で研究をされている方々に大変注目されている製品です。
弊社製品 ディープラーニング専用ワークステーション HPCT W214gs-DL に搭載し Deep Learning 分野での適正検査と GTX TITAN X との比較をしました。
▶ NVIDIA GeForce GTX NTITAN X (12 GB GDDR5)
▶ NVIDIA GeForce GTX 1080 Founders Edition (8 GB GDDR5X)
NVIDIA DIGITS で Caffe を用い、それぞれの GPU に LeNet, AlexNet, GoogLeNet で
学習させ、完了までの時間を測定し、その結果から性能を比較しました。また一部の実験では
GeForce GTX 1080 の大きな特徴の一つである低消費電力を観察するために簡単に温度と
消費電力も測定しました。GeForce GTX 1080 のサポートのため CUDA は最新の 8.0RC 版を
用い、それに合わせて cuDNN も 8.0-v5.0 にし、DIGITS、Caffe は git レポジトリからソース
を取得し、ビルドと検証を行いました。
▶ CPU:Intel Xeon E5-2697v4 x2
▶ RAM:DDR4-2133 ECC REG 128GB(16GB x8)
▶ SSD:250GB SATA 6Gb/s 2.5″
▶ HDD:1TB 7200 rpm 128MB Cache SATA 6.0Gb/s 3.5″
Operating System | CentOS Linux 7.2 |
NVIDIA Driver | 367.27 |
cuda | 8.0rc |
cudnn | 8.0-v5.0 |
python | 2.7.11 |
digits | 3.3.0 |
caffe | 0.14.5 |
以下は学習時間の測定結果です。
GoogLeNet/Cifer 100(Fine) の測定では時間の短縮のため epoch を30から10にして2回目、
3回目の測定を行いましたが同じ比率で時間が短縮されていますので、結果は正しいと
みなします。
学 習 時 間 | |||
GeForce GTX 1080 |
GeForce GTX TITAN X |
TESLA K40 | |
LeNet/mnist 1st | 0:00:57 | 0:01:11 | ― |
LeNet/mnist 2nd | 0:00:57 | 0:01:10 | ― |
LeNet/mnist 3rd | 0:00:56 | 0:01:09 | ― |
AlexNet/Cifer100F 1st | 1:04:39 | 1:04:43 | ― |
AlexNet/Cifer100F 2nd | 1:04:35 | 1:04:38 | ― |
GoogLeNet/Cifer100F 1st |
1:37:35 | 2:08:39 | ― |
GoogLeNet/Cifer100F 2nd (epoch10) |
0:33:53 | 0:43:09 | 1:47:34 |
GoogLeNet/Cifer100F 3rd (epoch10) | 0:34:12 | 0:43:06 | ― |
※無記は epoch30
LeNet/mnist の組み合わせでは GTX 1080 が GTX TITAN X に比べて約28%の速度向上、
GoogLeNet/Cifer 100(Fine) では約27%の向上が見られましたが、AlexNet/Cifer 100
(Fine) の組み合わせでは測定結果にほとんど差異がみられませんでした。これは他の検証
環境でも2機種の学習時間がほとんど同じであったため、この組み合わせにおいて偶然
GTX 1080 と TITAN X で同じ性能を示すことになったものであり、測定ミスではないと
考えられます。
GoogLeNet では比較のために Tesla K40 での測定も行い、上記のような結果となりました。
これをグラフにすると以下のようになります。単精度計算における GeForce 系の有利さを
端的に示しています。
次に AlexNet/Cifer 100(Fine) の組み合わせにおける温度と消費電力の測定結果を示します。
測定は簡易的に60秒間隔で行ったため正確を期した値ではありませんが、もともと nvidia-
smi ツールによる簡易測定ですのでこの程度で問題ないと考えます。
学習時間に差が見られなかったこのデータセットにおいても消費電力と実行時の温度は
かなり大きな差が見られます。特に負荷が低いと思われる瞬間に GTX 1080 では消費電力が
しっかり落ちているのが特徴です。従いまして GTX 1080 の 消費電力性能はかなり向上
しているといって良いと思われます。
GeForce GTX 1080 |
GeForce GTX TITAN X |
||||
温度 | 消費電力 | 温度 | 消費電力 | ||
AlexNet/Cifer100 1st | 最大 | 70°C | 197W | 83°C | 200W |
最少 | ― | 48W | ― | 97W |
Caffe を用いた学習時間性能比較において LeNet/mnist と GoogLeNet/Cifer100(Fine)の
組み合わせでは GeForce GTX 1080が TITAN Xに比べて約25から30%程度速度が向上
していることがわかりました。また AlexNet/Cifer 100(Fine) の組み合わせのように
ほとんど速度に差が現れない場合があることも確認できました。
消費電力性能でも GTX 1080 が確かに向上していることを確認しました。
なお今回の測定では CUDA 8.0 がまだRC版であり、また cuDNN 5.1RC 版もリリースされて
いることから、今後のアップデートで結果が変わってくることは予想されます。
▶ カタログ:Deep Learning Entry Workstation & Professional Server(PDF)
お問い合わせはこちらから
・電話:03-5643-2681(代)