高度計算機はHPCテックにお任せください。

03-5643-2681
お問い合わせ
English

GPU Solution:NVIDIA Quadro SERIES

Ampere アーキテクチャ採用プロフェッショナル用ハイエンドグラフィックスボード

NVIDIA® A40 は NVIDIA Ampere アーキテクチャを採用し、最新のRTコア、Tensorコア、および CUDA コアと 48GB のグラフィックスメモリを搭載したデータセンター向けラックマウントサーバ用 GPU です。レイトレーシングレンダリング、シミュレーション、仮想プロダクションなど最先端の機能を提供します。

 

 

 

 

― NVIDIA Ampere アーキテクチャ CUDAコア

単精度浮動小数点 (FP32) 操作の処理速度が 2 倍になり、電力効率が改善されたことで、複雑な 3D CAD (コンピューター支援デザイン) や CAE (コンピューター支援エンジニアリング) など、グラフィックスやシミュレーションのワークフローのパフォーマンスが大幅に向上します。

 

― 第2世代 RTコア

前世代に比べて 2 倍のスループットと、シェーディングやノイズ除去機能と共にレイ トレーシングを並行して実行する能力を備えた第 2 世代 RT コアにより、動画コンテンツの写真のようにリアルなレンダリング、建築デザインの評価、製品デザインの仮想プロトタイプなどのワークロードのための大幅な高速化を実現します。このテクノロジは、より優れた視覚的正確さでより速い結果をもたらすためのレイ トレーシングによるモーション ブラーのレンダリングも高速化します。

 

― 第3世代 Tensorコア

新しい Tensor Float 32 (TF32) 演算により、前世代に比べて 5 倍のトレーニング スループットを提供するため、コードを変更する必要なく、AI およびデータ サイエンスのモデル トレーニングを高速化します。構造化スパース性に対応するハードウェアにより、推論スループットを 2 倍にします。 Tensor コアはまた、DLSS、AI ノイズ除去、特定のアプリケーション向けの拡張編集などの機能を備えたグラフィックスにも AI をもたらします。

 

― 第3世代 NVIDIA NVLink

向上した GPU 間の相互接続の帯域幅は、単一のスケーラブルなメモリを提供し、グラフィックスおよび計算処理のワークロードを高速化してより大規模なデータセットへの取り組みを可能にします。

 

― 48GB GPU メモリ

NVLink を利用して最大 96 GB まで拡張可能な超高速の GDDR6 メモリは、データ サイエンティスト、エンジニア、クリエイティブなプロフェッショナル向けに、データ サイエンスやシミュレーションなどの膨大なデータセットやワークロードを使用する作業に必要な大容量メモリを提供します。

 

― 仮想化対応

NVIDIA 仮想 GPU (vGPU) ソフトウェアを活用した次世代の改善により、リモート ユーザーがより大規模かつパワフルな仮想ワークステーションのインスタンスを使用できるようになり、高度なデザイン、AI、計算処理におけるより大規模なワークフローが可能になります。

 

― PCI Express Gen 4

PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。

 

― 電力効率

デュアル スロットの省エネ設計を特長とする RTX A6000 は、前世代に比べて 2 倍の電力効率を備え、世界中の OEM ベンダーの幅広いワークステーションに装着できるように開発されています。

 

 

 

GPU でパフォーマンスを加速

NVIDIA 仮想 GPU(vGPU)テクノロジでは、NVIDIA GPU と NVIDIA 仮想 GPU ソフトウェアのパワーを利用し、AI から仮想デスクトップインフラストラクチャ (VDI) まで、あらゆる仮想ワークロードを高速化します。すべての仮想マシン(VM)に対して GPU 性能を可能にする vGPU テクノロジにより、ユーザーはより効率的かつ生産的に作業を行うことができるようになります。

 

NVIDIA vGPU の仕組み

・NVIDIA 仮想 GPU を搭載する VDI 環境では、NVIDIA 仮想 GPU ソフトウェアの NVIDIA vGPU Manager をハイパーバイザーのレイヤーにインストール。
・NVIDIA 仮想 GPU ソフトウェアは物理サーバーに搭載されている GPU メモリを分割して仮想 GPU を作成。
 複数台の仮想マシン (VM) で物理 GPU コアを共有利用したり、複数の GPU を単一の VM に割り当て利用することも可能。

 

 

 

A PRODUCT FOR EVERY WORKLOAD

NVIDIA 仮想 GPU ソフトウェアは、さまざまな仮想環境での利用ニーズを満たす、4つのエディションをご用意

 

NVIDIA Virtual Compute Server
(vCS: 仮想コンピュート サーバ)

AI、ディープラーニング、データ サイエンスのワークロード用。 NVIDIA コンピュート ドライバ。

NVIDIA Quadro DWS
(Quadro 仮想 DC ワークステーション)

プロフェッショナル グラフィックス/コンピューティング用。
NVIDIA Quadro ドライバ。

NVIDIA GRID Virtual PC
(GRID vPC:GRID 仮想 PC)

標準 PC が利用するのオフィスアプリケーション、ブラウザ、Web 会議、動画、PDF などの仮想デスクトップ用。

NVIDIA GRID Virtual Applications

(GRID vApps: GRID 仮想 アプリケーション)

Citrix XenApp やVMware Horizon Apps、SBC や RDSH などの共有デスクトップやアプリケーション配信用。

 

 

 

プロフェッショナル向け機能

マルチディスプレイ テクノロジ

複数の 8K モニター、ベゼル補正機能を備えた NVIDIA Mosaic、NVIDIA の Warp and Blend SDK のサポートを活用して、大規模な Cave Automatic Virtual Environment (CAVE)、ビデオ ウォール、ロケーションベースのエンターテイメントの構築を推進します。

Quadro Sync

複数の NVIDIA RTX A600 GPUs グラフィックス カードをディスプレイやプロジェクターと同期して、NVIDIA Quadro Sync で大規模なビジュアライゼーションを実現します。

マルチ GPU の拡張性 - NVIDIA NVLink ブリッジ

NVLink をプロフェッショナル アプリケーションに利用すれば、マルチGPU 構成でメモリとパフォーマンスを簡単に拡張できます。さまざまなシステムに組み込めるロー プロファイル設計により NVIDIA NVLink ブリッジは、2 基の RTX A6000 を接続することができます。これにより、最大 112 GB/秒の帯域幅と合計 96 GB の GDDR6 メモリを提供でき、最もメモリ負荷の高いワークロードにも取り組めます。

 

― NVIDIA A40 データシート

 

 

 

― NVIDIA A40 GPU Accelerator - Product Brief

 

 

 

 

 

製品仕様

A40 / A100 / V100 仕様比較

A40 A100 V100s
Architecture Ampere Ampere Volta
GPU GA102 GA100 GV100
Tensor Cores 336 432 336
RT Cores 84 - -
FP32

37.4 TFLOPS

19.5 TFLOPS 16.4 TFLOPS
FP16 Tensor Core 149.7/299.4*
Tensor FLOPS
312/624*
Tensor FLOPS
130
Tensor FLOPS
TF32 Tensor Core 74.8/149.6*
TFLOPS
156/312*
TFLOPS
-
BF16 Tensor Core 149.7/299.4*
Tensor FLOPS
312/624*
Tensor FLOPS
-
INT8 Tensor Core 299.3/598.6*
TOPS
624/1248*
TOPS
-
INT4 Tensor Core 598.7/1197.4*
TOPS
1248/2496*
TOPS
-
VRAM 48GB GDDR6 40GB HBM2 32GB HBM2
Memory Boost Clock 1740 MHz 1410 MHz 1597 MHz
Memory Band Width Up to 696 GB/s Up to 1555GB/s Up to 1134 GB/s
Memory Bus Width 384 bit 5120 bit 4096 bit
NVLink NVLink3
112.5GB/s
NVLink3
600GB/s
-
Display Connectors DP 1.4 x3 - -
TDP 300W 250W 250W

* 新しいスパース性機能を使用した場合の TFLOPS/TOPS 実効値

 

 

 

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。

お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。

各種カスタマイズ・詳細なお見積はこちらからお問い合わせください。

製品案内