GeForce RTX2080Ti は Turing アーキテクチャを採用し、レイトレーシングをアクセラレートする「RT コア」とディープラーニング向けの「Tensor コア」を搭載。さらに次世代超高速 GDDR6 メモリ 11GB によるフラグシップ GPU です。
・リアルタイムレイトレーシングの処理を専門に行う RT コア
従来では膨大な計算と時間がレイトレーシングでは必要でしたが、ポリゴンと光線の衝突判定処理を
専門におこなう RT コアを実装することにより、より現実に近い光と影の描画が可能となりました。
・AI のパフォーマンスを実現する革新的なテクノロジ Tensor コア
Deep Learning を実行する「学習させる」だけではなく、学習させたものを実際に動作させる
「推論」を高速に行うことが可能となりました。リアルタイムレイトレーシング等の処理を行うため
に新しいコアを追加しましたが、特に Tensor コアはディープラーニングの高速化にも焦点をあてた
アーキテクチャになっています。
・製造プロセスが 12nm となり、前世代から比べて微細化
・最大で GeForce GTX 1080 Ti の約 10 倍となる 10G Ray/s のレイトレーシング性能を実現
・グラフィックメモリに「GDDR6」をサポートし、14Gbps の転送速度を実現
・SLI に変わり、高速 NVLink を採用
従来のテクノロジの 50 倍もの転送帯域幅で 2 つの NVLink SLI 対応グラフィックス カードを接続し、
非常に優れた視覚的忠実度を実現。
・VirtualLink 用の USB コントローラーを内蔵し、背面の出力端子に USB Type-C を搭載
TU102 ダイは 6 個の GPC があり、それぞれの GPC は 12 個の SM とラスタライザで構成されており、合計で 72 個の SM が搭載されている。
DDR5X から GDDR6 となり、メモリ転送レートは GDDR5X 11Gbps から、GDDR6 14Gbps へと大幅に高速化されました。
GDDR6 ではメモリの実効率も向上
HPCテックではワークステーションやラックマウントサーバに搭載し、Caffe や Torch、Tensorflow、NVIDIA DIGITS などをインストールしてお届けしますので届いたその日からディープ・ニューラル・ネットワークの運用や開発を行っていただけます。使い方はそれぞれ違いますので、全てカスタマイズ仕様にてご提案させていただきます。お気軽にご相談ください。
仕様比較
製品名 | RTX 2080 Ti | GTX 1080 Ti |
Architecture | Turing | Pascal |
GPCs | 6 | 6 |
TPCs | 34 | 28 |
SMs | 68 | 28 |
CUDA Cores / SM | 64 | 128 |
CUDA Cores / GPU | 4352 | 3548 |
Tensor Cores / SM | 8 | NA |
Tensor Cores / GPU | 544 | NA |
RT Cores | 68 | NA |
GPU Base Clock | 1350 | 1480 |
GPU Boost Clock MHz | 1635 (FE) | 1582 |
Frame Buffer Memory Size and Type | 11GB GDDR6 | 11GB GDDR5X |
Memory Interface | 352-bit | 352-bit |
Memory Clock (Data Rate) |
14 Gbps | 11 Gbps |
ROPs | 88 | 88 |
Texture Units | 272 | 224 |
Memory Bandwidth (GB/sec) | 616 GB/sec | 484 GB/sec |
L2 Cache Size | 5632 KB | 2816 KB |
Register File Size/SM | 256 KB | 256 KB |
Register File Size/GPU | 17508 KB | 7168 KB |
Transistor Count | 18.6 Billion | 12 Billion |
Die Size | 754 | 471 |
Manufacturing Process | 12 nm FFN | 16 nm |
TDP | 260 W | 250 W |
性能比較
製品名 | RTX 2080 Ti | GTX 1080 Ti |
RTX-OPS | 76 Tera-OPS | 11.3 Tera-OPS |
Rays Cast | 10 Giga Rays/sec | 1.1 Giga Rays/sec |
Peak FP32 TFLOPS | 14.2 | 11.3 |
Peak INT32 TIPS | 14.2 | NA |
Peak FP16 TFLOPS | 28.5 | NA |
Peak FP16 Tensor TFLOPS with FP32 | 56.9 | NA |
Peak FP16 Tensor TFLOPS with FP16 | 113.8 | NA |
Peak INT8 Tensor TOPS | 227.7 | NA |
Peak INT4 Tensor TOPS | 455.4 | NA |
Texel Fill-rate | 444.7 Gigatexels/sec | 354.4 Gigatexels/sec |