NVIDIA L40S は、AI コンピューティングとグラフィックス、メディア高速化を組み合わせたハイエンド GPUです。生成 AI や LLM (大規模言語モデル) の推論、トレーニングから 3D グラフィックス、レンダリングやビデオまで次世代のマルチワークロードを高速化します。
詳しくは担当営業までお気軽にお問い合わせください。
単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。 |
スループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。 |
構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。 |
Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。 |
L40S GPU は、24 時間 365 日稼動するエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータ センター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュア ブートを備え、データ センターにさらなるセキュリティ層を提供します。 |
L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。 |
生成 AI 次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5 倍の推論性能と、NVIDIA HGX™ A100 の 1.2 倍の性能を実現します。画期的な性能と 48 ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AI ワークロードを高速化するのに理想的なプラットフォームです。 |
|
LLM のトレーニングと推論
|
|
レンダリングと 3D グラフィックス |
|
NVIDIA Omniverse
メタバース アプリケーションの作成と運用をします。 |
L40S / A100 80GB SXM 仕様比較
L40S | A100 80GB SXM | |
Best For | Universal GPU for Gen AI | Highest Perf Multi-Node AI |
GPU Architecture | NVIDIA Ada Lovelace | NVIDIA Ampere |
FP64 | N/A | 9.7 TFLOPS |
FP32 | 91.6 TFLOPS | 19.5 TFLOPS |
RT Core | 212 TFLOPS | N/A |
TF32 Tensor Core | 366 TFLOPS |
312 TFLOPS |
FP16/BF16 Tensor Core | 733 TFLOPS | 624 TFLOPS |
FP8 Tensor Core | 1466 TFLOPS | N/A |
INT8 Tensor Core | 1466 TOPS | 1248 TFLOPS |
GPU Memory | 48 GB GDDR6 | 80 GB HBM2e |
GPU Memory Bandwidth | 864 GB/s | 2039 GB/s |
L2 Cache | 96 MB | 40 MB |
Media Engines | 3 NVENC(+AV1) 3 NVDEC 4 NVJPEG |
0 NVENC 5 NVDEC 5 NVJPEG |
Power | Up to 350 W | Up to 400 W |
Form Factor | 2-slot FHFL | 8-way HGX |
Interconnect | PCle Gen4 x16 | PCle Gen4 x16 |