NVIDIA最新世代のGeForce RTX 40シリーズ。上位モデルは圧倒的高性能だが、ミドルレンジ帯は前世代のRTX 30シリーズに対して大きな性能向上が見られず、価格高めで“微妙”と見られることが多い。しかし、実際のところそれは本当なのか?
ここでは真実を確かめるべく、以下の5つのGPUを用意。性能・消費電力・コスパで比較し、人気のミドルレンジGPU帯の購入はどれが正解なのかを調査していく。
- GeForce RTX 4060 Ti(16GB版と8GB版)
- GeForce RTX 4060
- GeForce RTX 3060 Ti
- GeForce RTX 3060(12GB版)
GeForce RTX 40シリーズと30シリーズの違い
性能テストの前に各GPUのスペックを紹介しておこう。
GeForce RTX 4060 Ti |
GeForce RTX 4060 |
GeForce RTX 3060 Ti |
GeForce RTX 3060(12GB) |
|
---|---|---|---|---|
CUDAコア数 | 4,352 | 3,072 | 4,864 | 3,584 |
ベースクロック | 2,310MHz | 1,830MHz | 1,410MHz | 1,320MHz |
ブーストクロック | 2,535MHz | 2,460MHz | 1,665MHz | 1,777MHz |
メモリサイズ | GDDR6 8GB/16GB | GDDR6 8GB | GDDR6 8GB | GDDR6 12GB |
メモリバス幅 | 128bit | 128bit | 256bit | 192bit |
L2キャッシュ | 32MB | 24MB | 4MB | 3MB |
RTコア | 第3世代 | 第3世代 | 第2世代 | 第2世代 |
Tensorコア | 第4世代 | 第4世代 | 第3世代 | 第3世代 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ampere | Ampere |
DLSS | 3 | 3 | 2 | 2 |
NVENC | 第8世代 | 第8世代 | 第7世代 | 第7世代 |
消費電力 | 160W/165W | 115W | 200W | 170W |
電源コネクタ | 8ピン×1または12VHPWR×1 | 8ピン×1または12VHPWR×1 | 8ピン×1 | 8ピン×1 |
RTX 4060 Ti/RTX 4060は、RTX 30シリーズの同クラスに対してCUDAコア数は減っているが、クロックは向上している。メモリバス幅が128bitと狭い点が気になるが、それはRTX 30シリーズよりもL2キャッシュを増やすことでメインメモリへのアクセスを減らし、高い実効性能を実現しているという。
ポイントになるのは、RTX 40シリーズはTensorコアが強化され、DLSS 3に対応していること。DLSS 3では従来のアップスケーラーに加えて、AIによるフレーム生成が追加されたことで、さらに高いフレームレートが出せるようになった。
また、NVENCも世代が進み、高圧縮&高画質のAV1へのハードウェアエンコードに対応となった。消費電力もRTX 30シリーズより下がっている。
RTX 4060シリーズのRTX 3060シリーズに対するアドバンテージは「DLSS 3対応」、「AV1エンコード対応」、「低消費電力」にあるワケだが、自分がプレイしたいゲームがDLSS 3に対応していなければ意味がなく、AV1も配信や動画編集をやらない人には必要ない。
そして消費電力がいくら低いと言っても1時間あたりで数円程度の差、という点が評価を“微妙”にしているのではないだろうか。
そして価格もRTX 3060 TiよりもRTX 4060 Tiのほうが、RTX 3060よりもRTX 4060のほうが高い。いくら機能差があっても基本性能に大きな差がなければ、コストパフォーマンスがよいと感じられないのは仕方のないところ。
しかし、実際はどうなのだろうか。RTX 40シリーズはじわじわと価格が下がってきている。それを踏まえた上で、改めて性能、消費電力、コストパフォーマンスを比較していく。用意したのは下記のGPUだ。
- GeForce RTX 4060 Ti(16GB版)
:MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC - GeForce RTX 4060 Ti(8GB版)
:NVIDIA GeForce RTX 4060 Ti Founders Edition - GeForce RTX 4060
:MSI GeForce RTX 4060 GAMING X 8G - GeForce RTX 3060 Ti
:NVIDIA GeForce RTX 3060 Ti Founders Edition - GeForce RTX 3060(12GB版)
:ZOTAC GAMING GeForce RTX 3060 Twin Edge OC
人気の6タイトルで性能&消費電力をチェック
ここからは性能チェックに移る。テスト環境は以下の通りだ。今回はビデオカードの消費電力を実測できるNVIDIAの専用キット「PCAT」を導入。ゲーム系のベンチマークではカード単体の消費電力も合わせて掲載する。
CPUのパワーリミットは無制限に設定。MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OCはブーストクロック2,610MHz、MSI GeForce RTX 4060 GAMING X 8Gはブーストクロック2,595MHz設定で実行している。
【検証環境】CPU:Core i9-13900K(24コア32スレッド)●マザーボード:MSI MPG Z790 CARBON WIFI(Intel Z790)●メモリ:Micron Crucial DDR5 Pro CP2K16G56C46U5(PC5-44800 DDR5 SDRAM 16GB×2)●システムSSD:Western Digital WD_BLACK SN850 NVMe WDS200T1X0E-00AFY0(PCI Express 4.0 x4、2TB)●CPUクーラー:Corsair iCUE H150i RGB PRO XT(簡易水冷、36cmクラス)●電源:Super Flower LEADEX V G130X 1000W(1,000W、80PLUS Gold)●OS:Windows 11 Pro(22H2)
まずは、定番の3Dベンチマーク「3DMark」のスコアから見ていこう。
3DMarkでは、スコアが高い順にRTX 4060 Ti(8GB/16GB)、RTX 4060、RTX 3060 Ti、RTX 4060、RTX 3060となる。GPUの価格的にも順当と言えるところだ。RTX 4060 Tiはビデオメモリの容量以外、基本スペックは同じなのでスコアもほぼ変わらないという結果。ビデオメモリを大量に使う作業以外では差はないと見てよいだろう。
続いて、実ゲームを試そう。まずは定番FPSの「レインボーシックス シージ」と「Apex Legends」だ。レインボーシックス シージはゲーム内のベンチマーク機能を実行し、Apex Legendsはトレーニングモードの一定コースを移動した際のフレームレートを「FrameView」で測定している。DLSSなどアップスケーラーを使わない状態での性能や消費電力を確かめるテストと言える。
力関係としては3DMarkと同じだ。どれでも軽めのFPSなら、フルHD(1,920×1,080ドット)で高フレームレート、4K(3,840×2,160ドット)でも十分プレイできるパワーを持っている。
ただ、カード単体の消費電力に目を向けると大きい順がRTX 3060 Ti、RTX 3060、RTX 4060 Ti(16GB)、RTX 4060 Ti(8GB)、RTX 4060となる。RTX 40シリーズのワットパフォーマンスのよさが分かる部分だ。
ただ、RTX 4060 Tiは16GBと8GBで性能差はほとんどないのに、消費電力だけは16GBのほうが上となかなか厳しいところ。
次は、ストリートファイター6を試そう。このゲームは120fpsまで設定できるが、対戦時は最大60fpsまでとなる。CPU同士の対戦を実行した際のフレームレートを「FrameView」で測定している。
フルHDとWQHD(2,560×1,440ドット)では、すべてのビデオカードが平均60fpsを達成。4KでもRTX 4060 Ti、RTX 4060、RTX 3060 Tiはほぼ平均60fpsに到達できている。
このゲームでの注目は消費電力だろう。最大60fpsなのでGPU負荷が低く、フルHDではRTX 4060 Tiが圧倒的な低消費電力を実現している。RTX 3060の半分以下だ。RTX 40シリーズのワットパフォーマンスのよさが光る。
DLSS 3対応ゲーム
続いて、DLSS 3に対応するゲームを試してみよう。RTX 40シリーズは従来からのアップスケーラーに加えてフレーム生成が利用可能、RTX 30シリーズはアップスケーラーのみでフレーム生成は使えない。
この機能差がフレームレートにどこまで影響するのかがポイントになる。まずは、描画負荷が軽めのタイトルとしてディアブロIVを実行しよう。キヨヴァシャド周辺の一定コースを移動した際のフレームレートを「FrameView」で測定した。
ディアブロIVはDLSS 3のフレーム生成がそれほど効くタイトルではないようだ。それでもフルHDでは、ここまでのテストでRTX 3060 Tiに勝てなかったRTX 4060がわずかだが逆転。力関係に変化が見られた。
また、ビデオメモリ量が効くようでRTX 4060 Tiの16GB版が8GB版のフレームレートを若干ではあるが上回っている。
加えて、DLSSは内部のレンダリング解像度が下がるのでGPUの負荷が減って消費電力も小さくなる。RTX 40シリーズは特にその効果が大きく、レインボーシックス シージやApex Legendsに比べて、消費電力がそこそこ減っている点にも注目したい。
レイトレーシング対応ゲーム
続いて、レイトレーシングにも対応する描画負荷が強烈なタイトルとして「Marvel's Spider-Man: Miles Morales」と「サイバーパンク2077」を用意した。
Marvel's Spider-Man: Miles Moralesはマップ内の一定コースを60秒ダッシュした際のフレームレートを、サイバーパンク2077はゲーム内のベンチマーク機能を実行した際のフレームレートをそれぞれ「FrameView」で測定した。
この2本はDLSS 3のフレーム生成の効果が非常に大きいようで、RTX 4060がすべての解像度でRTX 3060 Tiを上回るようになる。RTX 40シリーズの優位性がハッキリと見える部分だ。それでいて消費電力はほとんどの解像度でRTX 30シリーズよりも小さくなる。
フルHDのワット&コストパフォーマンスを集計
ここまでのテストを集計し、各タイトルのフルHD時の消費電力をフレームレートで割ったものを「ワットパフォーマンス」、各ビデオカードの平均的な価格をフレームレートで割ったものを「コストパフォーマンス」としてグラフ化してみた。
ワットパフォーマンスでは、RTX 4060 Ti(8GB)が強い。小さな消費電力で高フレームレートを出せるGPUと言ってよいだろう。DLSS 3対応のタイトルではRTX 30シリーズとの差は大きくなる。消費電力で選ぶなら、RTX 4060 Ti(8GB)がRTX 4060が候補になるだろう。
コストパフォーマンスでは、RTX 4060 Ti(16GB)を9万円、RTX 4060 Ti(8GB)を6万3,000円、RTX 4060を4万7,000円、RTX 3060 Tiを5万7,000円、RTX 3060(12GB)を4万3,000円として算出した(2023年8月中旬調べ)。
その結果、レインボーシックス シージとApex LegendsではRTX 4060 Ti(8GB)とRTX 3060 Ti、RTX 4060とRTX 3060(12GB)が拮抗する。DLSS 3まで含めるとRTX 4060がコストパフォーマンスではトップに立つ。
ただ、各ビデオカードを最安値にすると少々変わってくる。原稿執筆の8月中旬時点では以下のような価格だった。
- GeForce RTX 4060 Ti(16GB):7万7,000円前後
- GeForce RTX 4060 Ti(8GB):6万円前後
- GeForce RTX 4060:4万4,000円前後
- GeForce RTX 3060 Ti:4万5,000円前後
- GeForce RTX 3060(12GB):3万8,000円前後
そうなると、DLSS 3非対応のレインボーシックス シージとApex LegendsではRTX 3060 Tiがコストパフォーマンスのトップになる。
ただし、RTX 3060 Tiの最安値モデルはシングルファンのシンプルな定格クロックの製品。冷却や性能重視したい人には選びにくいという点は覚えておきたい。
Stable Diffusion XL 1.0ではRTX 3060(12GB)が強い!!!!
AI処理性能も見ていこう。まずは、Stability AIが2023年7月27日に公開した画像生成AIモデル「Stable Diffusion XL 1.0(SDXL 1.0)」を試そう。ここではStable Diffusion web UIを使用し、Sampling Methodに「DPM++ SDE Karass」を選択、「Base」モデルで生成を実行した。起動パラメータには「--xformers --no-half-vae」を追加している。
今回は512×512ドットと768×768ドットの2種類の解像度で生成したが、ビデオメモリが8GBでは強烈に時間がかかった。SDXL 1.0での高速な生成には、ビデオメモリ12GB以上とGPUのパワー両方が必要と言ってよいだろう(起動パラメータの調整で変わる可能性はあるが)。
ゲームでは微妙だったRTX 4060 Ti(16GB)が圧倒的トップ。続くのがRTX 3060(12GB)だ。ビデオカードの価格を考えると、画像生成を楽しみたいならRTX 3060(12GB)が一番おトクと言ってよい。
ただし、ビデオメモリ量が多ければどんなAI処理でも強いというわけではない。
次に「Procyon AI Inference Benchmark for Windows」を実行する。これは、MobileNet V3、Inception V4、YOLO V3、DeepLab V3、Real-ESRGAN、ResNet 50とさまざまな推論エンジンを使ってAIの総合的なパフォーマンスを測定できるベンチマークだ。ここでは、NVIDIA TensorRTのFlost32に設定してテストしている。
RTX 4060 Ti(8GB/16GB)がほぼ同スコアで、RTX 4060、RTX 3060 Ti、RTX 3060(12GB)と続き、ビデオメモリの量がスコアに結びついてはいない。つまり、前掲のSDXL 1.0が特にビデオメモリ量の効果が高いということだ。
フルHDゲームならRTX 4060がバランスよし! 画像生成もやるならRTX 3060(12GB)
NVIDIAのミドルレンジGPUをテストしてきたが、RTX 4060 Ti(8GB)/4060の価格が発売当初よりもじわじわと下がってきていることもあり、コストパフォーマンスではRTX 3060 Ti/3060(12GB)と拮抗、ワットパフォーマンスは明確に上回る。
フルHDでのゲームプレイを考えているなら、どのGPUを選んでも性能的に問題なしと言えるが、中でも低消費電力でDLSS 3にも対応できるという点からRTX 4060のバランスが一番よい。
その一方で、ビデオメモリ量がパフォーマンスに大きく影響する画像生成をやってみたいと考えているならRTX 3060(12GB)がベストな選択だ。なお、RTX 3060は8GB版もあるので購入時には注意してほしい。
ミドルレンジGPUは人気があるだけに、今回のテスト結果が購入の参考になれば幸いだ。
からの記事と詳細 ( 【特集】 なぜGeForce RTX 4060は微妙と言われるのか?いまだに人気の3060と性能やコスパを比べて本当の所を見極める - PC Watch )
https://ift.tt/XJnxh27
科学&テクノロジー
No comments:
Post a Comment