株式会社HPCテック

GPU Solution：NVIDIA Quadro SERIES

Ampere アーキテクチャ採用プロフェッショナル用ハイエンドグラフィックスボード

NVIDIA A40

製品仕様
お問い合わせ

NVIDIA Quadro SERIES

NVIDIA^® A40 は NVIDIA Ampere アーキテクチャを採用し、最新のRTコア、Tensorコア、および CUDA コアと 48GB のグラフィックスメモリを搭載したデータセンター向けラックマウントサーバ用 GPU です。レイトレーシングレンダリング、シミュレーション、仮想プロダクションなど最先端の機能を提供します。

― NVIDIA Ampere アーキテクチャ CUDAコア

単精度浮動小数点 (FP32) 操作の処理速度が 2 倍になり、電力効率が改善されたことで、複雑な 3D CAD (コンピューター支援デザイン) や CAE (コンピューター支援エンジニアリング) など、グラフィックスやシミュレーションのワークフローのパフォーマンスが大幅に向上します。

― 第2世代 RTコア

前世代に比べて 2 倍のスループットと、シェーディングやノイズ除去機能と共にレイトレーシングを並行して実行する能力を備えた第 2 世代 RT コアにより、動画コンテンツの写真のようにリアルなレンダリング、建築デザインの評価、製品デザインの仮想プロトタイプなどのワークロードのための大幅な高速化を実現します。このテクノロジは、より優れた視覚的正確さでより速い結果をもたらすためのレイトレーシングによるモーションブラーのレンダリングも高速化します。

― 第3世代 Tensorコア

新しい Tensor Float 32 (TF32) 演算により、前世代に比べて 5 倍のトレーニングスループットを提供するため、コードを変更する必要なく、AI およびデータサイエンスのモデルトレーニングを高速化します。構造化スパース性に対応するハードウェアにより、推論スループットを 2 倍にします。 Tensor コアはまた、DLSS、AI ノイズ除去、特定のアプリケーション向けの拡張編集などの機能を備えたグラフィックスにも AI をもたらします。

― 第3世代 NVIDIA NVLink

向上した GPU 間の相互接続の帯域幅は、単一のスケーラブルなメモリを提供し、グラフィックスおよび計算処理のワークロードを高速化してより大規模なデータセットへの取り組みを可能にします。

― 48GB GPU メモリ

NVLink を利用して最大 96 GB まで拡張可能な超高速の GDDR6 メモリは、データサイエンティスト、エンジニア、クリエイティブなプロフェッショナル向けに、データサイエンスやシミュレーションなどの膨大なデータセットやワークロードを使用する作業に必要な大容量メモリを提供します。

― 仮想化対応

NVIDIA 仮想 GPU (vGPU) ソフトウェアを活用した次世代の改善により、リモートユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。

― PCI Express Gen 4

PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。

― 電力効率

デュアルスロットの省エネ設計を特長とする RTX A6000 は、前世代に比べて 2 倍の電力効率を備え、世界中の OEM ベンダーの幅広いワークステーションに装着できるように開発されています。

GPU でパフォーマンスを加速

NVIDIA 仮想 GPU（vGPU）テクノロジでは、NVIDIA GPU と NVIDIA 仮想 GPU ソフトウェアのパワーを利用し、AI から仮想デスクトップインフラストラクチャ (VDI) まで、あらゆる仮想ワークロードを高速化します。すべての仮想マシン（VM）に対して GPU 性能を可能にする vGPU テクノロジにより、ユーザーはより効率的かつ生産的に作業を行うことができるようになります。

NVIDIA vGPU の仕組み

・NVIDIA 仮想 GPU を搭載する VDI 環境では、NVIDIA 仮想 GPU ソフトウェアの NVIDIA vGPU Manager をハイパーバイザーのレイヤーにインストール。
・NVIDIA 仮想 GPU ソフトウェアは物理サーバーに搭載されている GPU メモリを分割して仮想 GPU を作成。
　複数台の仮想マシン (VM) で物理 GPU コアを共有利用したり、複数の GPU を単一の VM に割り当て利用することも可能。

A PRODUCT FOR EVERY WORKLOAD

NVIDIA 仮想 GPU ソフトウェアは、さまざまな仮想環境での利用ニーズを満たす、４つのエディションをご用意

	NVIDIA Virtual Compute Server (vCS: 仮想コンピュートサーバ) AI、ディープラーニング、データサイエンスのワークロード用。 NVIDIA コンピュートドライバ。
NVIDIA Quadro DWS (Quadro 仮想 DC ワークステーション) プロフェッショナルグラフィックス/コンピューティング用。 NVIDIA Quadro ドライバ。
	NVIDIA GRID Virtual PC (GRID vPC：GRID 仮想 PC) 標準 PC が利用するのオフィスアプリケーション、ブラウザ、Web 会議、動画、PDF などの仮想デスクトップ用。
NVIDIA GRID Virtual Applications (GRID vApps: GRID 仮想アプリケーション) Citrix XenApp やVMware Horizon Apps、SBC や RDSH などの共有デスクトップやアプリケーション配信用。

プロフェッショナル向け機能

マルチディスプレイテクノロジ

複数の 8K モニター、ベゼル補正機能を備えた NVIDIA Mosaic、NVIDIA の Warp and Blend SDK のサポートを活用して、大規模な Cave Automatic Virtual Environment (CAVE)、ビデオウォール、ロケーションベースのエンターテイメントの構築を推進します。

Quadro Sync

複数の NVIDIA RTX A600 GPUs グラフィックスカードをディスプレイやプロジェクターと同期して、NVIDIA Quadro Sync で大規模なビジュアライゼーションを実現します。

マルチ GPU の拡張性 - NVIDIA NVLink ブリッジ

NVLink をプロフェッショナルアプリケーションに利用すれば、マルチGPU 構成でメモリとパフォーマンスを簡単に拡張できます。さまざまなシステムに組み込めるロープロファイル設計により NVIDIA NVLink ブリッジは、2 基の RTX A6000 を接続することができます。これにより、最大 112 GB/秒の帯域幅と合計 96 GB の GDDR6 メモリを提供でき、最もメモリ負荷の高いワークロードにも取り組めます。

― NVIDIA A40 データシート

― NVIDIA A40 GPU Accelerator - Product Brief

製品仕様

A40 / A100 / V100 仕様比較

	A40	A100	V100s
Architecture	Ampere	Ampere	Volta
GPU	GA102	GA100	GV100
Tensor Cores	336	432	336
RT Cores	84	-	-
FP32	37.4 TFLOPS	19.5 TFLOPS	16.4 TFLOPS
FP16 Tensor Core	149.7/299.4* Tensor FLOPS	312/624* Tensor FLOPS	130 Tensor FLOPS
TF32 Tensor Core	74.8/149.6* TFLOPS	156/312* TFLOPS	-
BF16 Tensor Core	149.7/299.4* Tensor FLOPS	312/624* Tensor FLOPS	-
INT8 Tensor Core	299.3/598.6* TOPS	624/1248* TOPS	-
INT4 Tensor Core	598.7/1197.4* TOPS	1248/2496* TOPS	-
VRAM	48GB GDDR6	40GB HBM2	32GB HBM2
Memory Boost Clock	1740 MHz	1410 MHz	1597 MHz
Memory Band Width	Up to 696 GB/s	Up to 1555GB/s	Up to 1134 GB/s
Memory Bus Width	384 bit	5120 bit	4096 bit
NVLink	NVLink3 112.5GB/s	NVLink3 600GB/s	-
Display Connectors	DP 1.4 x3	-	-
TDP	300W	250W	250W