TESLA P40 は、ディープラーニング向けに最大のスループットを発揮するように設計されました。
推論性能は 47 TOPS(Tera-Operations Per Second)を有し、8 基の TESLA P40 を搭載した1台のサーバは、140個以上の CPU を搭載したサーバの性能に匹敵します。また、モデルが正確さや複雑さを増す中で、もはや CPU だけでは、インタラクティブユーザーエクスペリエンスを実現できません。TESLA P40 は、最も複雑なモデルであっても、リアルタイムな応答性を、CPU よりも、30倍以上も低いレイテンシで実現します。
▲クリックすると拡大します。
・NVIDIA Pascal アーキテクチャ
・3840 個の NVIDIA CUDA コア
・整数演算性能[INT8] は 47TOPS (最大ブースト)
・単精度演算性能は 12TFLOPS (最大ブースト)
・24GB メモリ搭載
・毎秒 346 GB のメモリ帯域幅
搭載GPU | NVIDIA TESLA P40 | |
---|---|---|
GPU数 | 1 (GP102) | |
CUDAコアプロセッサ数 | 3840 コア | |
ベースクロック | 1303MHz | |
ブーストクロック | 1531MHz | |
メモリ | 24GB GDDR5 SDRAM 搭載 | |
半精度整数演算性能 | 47TOPS | |
単精度浮動小数点演算性能 | 11.76TFLOPS | |
倍精度浮動小数点演算性能 | 0.36TFLOPS | |
メモリインターフェース | 384bit | |
メモリ帯域幅 | 346GB/s | |
バス | PCI-Express 3.0 x16 | |
TDP | 250W | |
その他搭載機能 | ECC機能サポート | |
対応OS | Windows Server 2012 R2 (64bit) Windows Server 2008 R2 (64bit) Windows 8.1 (64bit) Windows 7 (64bit) Linux 64bit |