NVIDIA TESLA P100 は、前例のない最先端のデータセンターアクセラレータです。新たに開発された NVIDIA Pascal GPU アーキテクチャにより、汎用ノード数百台分を超える性能を持つ世界最速の計算ノードが誕生しました。少ない台数で高い性能をもたらす超高速ノードにより、データセンターではスループットを大幅に向上させる一方で、コストを削減できます。
▲クリックすると拡大します。
▲クリックすると拡大します。
TESLA P100 は半導体からソフトウェアまで新しい発想で構成され、随所に革新的な技術を使用しています。それぞれの先駆的テクノロジがパフォーマンスの劇的な飛躍をもたらし、世界最速の計算ノード開発を推進しています。
新しい NVIDIA Pascal アーキテクチャの導入により、TESLA P100 は HPC やハイパースケールワークロードに対する最高水準の性能を獲得しました。21 テラフロップスを超える FP16 パフォーマンスを備えた Pascal は、ディープラーニングの刺激的な可能性を切り拓くのに最適なアーキテクチャです。 |
TESLA P100 は HBM2 テクノロジを実装した CoWoS (Chip on Wafer on Substrate) を組み込んで、コンピューティングとデータを同一パッケージに統合し、前世代の3倍を超えるメモリ性能を実現しています。 |
GPU 相互接続は往々にしてパフォーマンスを低下させます。革命的な NVIDIA NVLink 高速相互接続は、現存するクラス最高のテクノロジに比べて5倍のパフォーマンスを発揮し、複数の GPU にまたがるアプリケーションの展開を支えます。 注: PCIe 向けの TESLA P100 では利用できません。 |
ページマイグレーションエンジンのおかげで、開発者はデータの動きを管理することに気をとられず、コンピューティング性能のチューニングに集中できます。GPU の物理メモリサイズを超えて、最大 2 テラバイトまでアプリケーションを展開できるようになりました。 |
TESLA P100 と NVIDIA NVLink テクノロジを搭載した超高速ノードでは、ストロングスケールアプリケーションの処理を加速し、より短時間で解決に導くことができます。NVLink により、1 台のサーバノードにつき最大 8 つの TESLA P100 を相互接続でき、帯域幅は PCIe の 5 倍になります。HPC やディープラーニングにおける膨大な計算を必要とする世界の最重要課題の解決を支援します。
PCIe 向けの TESLA P100 を利用すると、混合ワークロード HPC データセンターでスループットを大幅に向上させる一方で、コストを削減できます。たとえば、PCIe で相互接続した 4 つの TESLA P100 が駆動する 1 台の GPU アクセラレーションノードで、さまざまなアプリケーションに利用できる 32 台の汎用 CPU ノードを置き換えることができます。はるかに少ない台数の強力なノードですべてのジョブを完了できるため、お客様はデータセンターのコスト全体を最大 70% 削減できます。
P100 for |
P100 for |
|
Double-Precision Performance | 4.7 TFLOPS | 5.3 TFLOPS |
Single-Precision Performance | 9.3 TFLOPS | 10.6 TFLOPS |
Half-Precision Performance | 18.7 TFLOPS | 21.2 TFLOPS |
NVIDIA NVLink Interconnect Bandwidth | - | 160 GB/s |
PCIe x16 Interconnect Bandwidth | 32 GB/s | 32 GB/s |
CoWoS HBM2 Stacked Memory Capacity |
16 GB 12 GB |
16 GB |
CoWoS HBM2 Stacked Memory Bandwidth | 720 GB/s 540 GB/s |
720 GB/s |
Enhanced Programmability with Page Migration Engine | ||
ECC Protection for Reliability | ||
Server-Optimized for Data Center Deployment |