株式会社HPCテック

GPU Solution：NVIDIA Quadro SERIES

Ada Lovelace アーキテクチャ採用マルチワークロード GPU

NVIDIA L40S

製品仕様
お問い合わせ

NVIDIA L40S は、AI コンピューティングとグラフィックス、メディア高速化を組み合わせたハイエンド GPUです。生成 AI や LLM (大規模言語モデル) の推論、トレーニングから 3D グラフィックス、レンダリングやビデオまで次世代のマルチワークロードを高速化します。

詳しくは担当営業までお気軽にお問い合わせください。

Ada Lovelace アーキテクチャベース CUDAコア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。

第3世代 RTコア

スループットとコンカレントレイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーションブラーを高速化し、驚異的なリアルタイムアニメーションを実現しています。

第4世代 Tensorコア

構造的なスパース性と最適化された TF32 形式のハードウェアサポートによるパフォーマンス向上で、AI とデータサイエンスのモデルトレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。

Transformer Engine

Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャニューラルネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。

効率性とセキュリティ

L40S GPU は、24 時間 365 日稼動するエンタープライズデータセンター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータセンター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュアブートを備え、データセンターにさらなるセキュリティ層を提供します。

DLSS 3

L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレームレートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェアイノベーション (第 4 世代 Tensor コアやオプティカルフローアクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。

マルチワークロードの高速化

	生成 AI 新しいサービス、インサイト、オリジナルコンテンツを開発します。次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5 倍の推論性能と、NVIDIA HGX™ A100 の 1.2 倍の性能を実現します。‌画期的な性能と 48 ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AI ワークロードを高速化するのに理想的なプラットフォームです。
LLM のトレーニングと推論 AI のトレーニングと推論のワークロードを高速化します。 FP8 をサポートする第 4 世代 Tensor コアは、卓越した AI コンピューティングパフォーマンスを提供し、最先端の LLM と生成 AI モデルのトレーニングと推論を高速化します。
	レンダリングと 3D グラフィックス NVIDIA RTX™ グラフィックスで忠実度の高いクリエイティブワークフローにパワーを与えます。第 3 世代 RT コアは、前世代の最大 2 倍のリアルタイムレイトレーシングパフォーマンスを提供し、インタラクティブレンダリングからリアルタイムの仮想制作まで、驚異的なビジュアルコンテンツと忠実度の高いクリエイティブワークフローの制作にパワーを与えます。
NVIDIA Omniverse メタバースアプリケーションの作成と運用をします。 NVIDIA Omniverse™ は、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTX グラフィックスと AI 機能を備えた L40S は、Omniverse で構築された Universal Scene Description (OpenUSD) ベースの 3D ワークフローとシミュレーションワークフローに優れたパフォーマンスを提供します。

NVIDIA L40S データシート

NVIDIA L40S GPU Accelerator - Product Brief

製品仕様

L40S / A100 80GB SXM 仕様比較

	L40S	A100 80GB SXM
Best For	Universal GPU for Gen AI	Highest Perf Multi-Node AI
GPU Architecture	NVIDIA Ada Lovelace	NVIDIA Ampere
FP64	N/A	9.7 TFLOPS
FP32	91.6 TFLOPS	19.5 TFLOPS
RT Core	212 TFLOPS	N/A
TF32 Tensor Core	366 TFLOPS	312 TFLOPS
FP16/BF16 Tensor Core	733 TFLOPS	624 TFLOPS
FP8 Tensor Core	1466 TFLOPS	N/A
INT8 Tensor Core	1466 TOPS	1248 TFLOPS
GPU Memory	48 GB GDDR6	80 GB HBM2e
GPU Memory Bandwidth	864 GB/s	2039 GB/s
L2 Cache	96 MB	40 MB
Media Engines	3 NVENC(+AV1) 3 NVDEC 4 NVJPEG	0 NVENC 5 NVDEC 5 NVJPEG
Power	Up to 350 W	Up to 400 W
Form Factor	2-slot FHFL	8-way HGX
Interconnect	PCle Gen4 x16	PCle Gen4 x16