NVIDIA® A40 は NVIDIA Ampere アーキテクチャを採用し、最新のRTコア、Tensorコア、および CUDA コアと 48GB のグラフィックスメモリを搭載したデータセンター向けラックマウントサーバ用 GPU です。レイトレーシングレンダリング、シミュレーション、仮想プロダクションなど最先端の機能を提供します。
単精度浮動小数点 (FP32) 操作の処理速度が 2 倍になり、電力効率が改善されたことで、複雑な 3D CAD (コンピューター支援デザイン) や CAE (コンピューター支援エンジニアリング) など、グラフィックスやシミュレーションのワークフローのパフォーマンスが大幅に向上します。
前世代に比べて 2 倍のスループットと、シェーディングやノイズ除去機能と共にレイ トレーシングを並行して実行する能力を備えた第 2 世代 RT コアにより、動画コンテンツの写真のようにリアルなレンダリング、建築デザインの評価、製品デザインの仮想プロトタイプなどのワークロードのための大幅な高速化を実現します。このテクノロジは、より優れた視覚的正確さでより速い結果をもたらすためのレイ トレーシングによるモーション ブラーのレンダリングも高速化します。
新しい Tensor Float 32 (TF32) 演算により、前世代に比べて 5 倍のトレーニング スループットを提供するため、コードを変更する必要なく、AI およびデータ サイエンスのモデル トレーニングを高速化します。構造化スパース性に対応するハードウェアにより、推論スループットを 2 倍にします。 Tensor コアはまた、DLSS、AI ノイズ除去、特定のアプリケーション向けの拡張編集などの機能を備えたグラフィックスにも AI をもたらします。
向上した GPU 間の相互接続の帯域幅は、単一のスケーラブルなメモリを提供し、グラフィックスおよび計算処理のワークロードを高速化してより大規模なデータセットへの取り組みを可能にします。
NVLink を利用して最大 96 GB まで拡張可能な超高速の GDDR6 メモリは、データ サイエンティスト、エンジニア、クリエイティブなプロフェッショナル向けに、データ サイエンスやシミュレーションなどの膨大なデータセットやワークロードを使用する作業に必要な大容量メモリを提供します。
NVIDIA 仮想 GPU (vGPU) ソフトウェアを活用した次世代の改善により、リモート ユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。
PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。
デュアル スロットの省エネ設計を特長とする RTX A6000 は、前世代に比べて 2 倍の電力効率を備え、世界中の OEM ベンダーの幅広いワークステーションに装着できるように開発されています。
NVIDIA 仮想 GPU(vGPU)テクノロジでは、NVIDIA GPU と NVIDIA 仮想 GPU ソフトウェアのパワーを利用し、AI から仮想デスクトップインフラストラクチャ (VDI) まで、あらゆる仮想ワークロードを高速化します。すべての仮想マシン(VM)に対して GPU 性能を可能にする vGPU テクノロジにより、ユーザーはより効率的かつ生産的に作業を行うことができるようになります。
NVIDIA vGPU の仕組み
・NVIDIA 仮想 GPU を搭載する VDI 環境では、NVIDIA 仮想 GPU ソフトウェアの NVIDIA vGPU Manager をハイパーバイザーのレイヤーにインストール。
・NVIDIA 仮想 GPU ソフトウェアは物理サーバーに搭載されている GPU メモリを分割して仮想 GPU を作成。
複数台の仮想マシン (VM) で物理 GPU コアを共有利用したり、複数の GPU を単一の VM に割り当て利用することも可能。
A PRODUCT FOR EVERY WORKLOAD
NVIDIA 仮想 GPU ソフトウェアは、さまざまな仮想環境での利用ニーズを満たす、4つのエディションをご用意
マルチディスプレイ テクノロジ
複数の 8K モニター、ベゼル補正機能を備えた NVIDIA Mosaic、NVIDIA の Warp and Blend SDK のサポートを活用して、大規模な Cave Automatic Virtual Environment (CAVE)、ビデオ ウォール、ロケーションベースのエンターテイメントの構築を推進します。
Quadro Sync
複数の NVIDIA RTX A600 GPUs グラフィックス カードをディスプレイやプロジェクターと同期して、NVIDIA Quadro Sync で大規模なビジュアライゼーションを実現します。
NVLink をプロフェッショナル アプリケーションに利用すれば、マルチGPU 構成でメモリとパフォーマンスを簡単に拡張できます。さまざまなシステムに組み込めるロー プロファイル設計により NVIDIA NVLink ブリッジは、2 基の RTX A6000 を接続することができます。これにより、最大 112 GB/秒の帯域幅と合計 96 GB の GDDR6 メモリを提供でき、最もメモリ負荷の高いワークロードにも取り組めます。
A40 / A100 / V100 仕様比較
A40 | A100 | V100s | |
Architecture | Ampere | Ampere | Volta |
GPU | GA102 | GA100 | GV100 |
Tensor Cores | 336 | 432 | 336 |
RT Cores | 84 | - | - |
FP32 |
37.4 TFLOPS |
19.5 TFLOPS | 16.4 TFLOPS |
FP16 Tensor Core | 149.7/299.4* Tensor FLOPS |
312/624* Tensor FLOPS |
130 Tensor FLOPS |
TF32 Tensor Core | 74.8/149.6* TFLOPS |
156/312* TFLOPS |
- |
BF16 Tensor Core | 149.7/299.4* Tensor FLOPS |
312/624* Tensor FLOPS |
- |
INT8 Tensor Core | 299.3/598.6* TOPS |
624/1248* TOPS |
- |
INT4 Tensor Core | 598.7/1197.4* TOPS |
1248/2496* TOPS |
- |
VRAM | 48GB GDDR6 | 40GB HBM2 | 32GB HBM2 |
Memory Boost Clock | 1740 MHz | 1410 MHz | 1597 MHz |
Memory Band Width | Up to 696 GB/s | Up to 1555GB/s | Up to 1134 GB/s |
Memory Bus Width | 384 bit | 5120 bit | 4096 bit |
NVLink | NVLink3 112.5GB/s |
NVLink3 600GB/s |
- |
Display Connectors | DP 1.4 x3 | - | - |
TDP | 300W | 250W | 250W |
* 新しいスパース性機能を使用した場合の TFLOPS/TOPS 実効値