| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA RTX 4070 SUPER | Ada Lovelace | 5 nm | 1980 MHz | 2475 MHz | 7168 | GDDR6X | 1313 MHz 21 Gbps |
192 bit | 220W | 详细参数>> | |
| NVIDIA RTX 2070 | Turing | 12 nm | 1410 MHz | 1620 MHz | 2304 | GDDR6 | 1750 MHz 14 Gbps |
256 bit | 175W | 详细参数>> |
核心频率与架构
核心频率:4070S 1980 MHz → 2475 MHz;2070 1410 MHz → 1620 MHz。
架构:4070S 为 Ada Lovelace,工艺 5 nm;2070 为 Turing,工艺 12 nm。
在相同工作频率下,4070S 的 SM 计算单元更大、缓存更宽,整体能耗效率更好。
核心与缓存
7168 Shading Units、224 TMUs、56 RT Cores、224 Tensor Cores;
2070 为 2304 Shading Units、144 TMUs、36 RT Cores、288 Tensor Cores。
4070S 的光追核心与纹理处理单元数量显著提升,Tensor Cores 也更为高效,适合 AI 加速与 DLSS。
显存与带宽
12 GB GDDR6X,位宽 192 bit,带宽 504 GB/s;
8 GB GDDR6,位宽 256 bit,带宽 448 GB/s。
4070S 在高分辨率与高纹理负载下更易保持流畅,显存容量也更足。
计算性能
FP32:35.48 TFLOPS(4070S)vs 7.465 TFLOPS(2070)。
FP16:35.48 TFLOPS(1:1)vs 14.93 TFLOPS(2:1)。
FP64:554.4 GFLOPS(4070S)vs 233.3 GFLOPS(2070)。
在 CUDA 计算、机器学习与科学仿真场景中,4070S 能实现 4–5 倍吞吐。
图形功能
两卡均支持 DirectX 12 Ultimate、OpenGL 4.6、Vulkan 1.3、CUDA 8.9(4070S)vs 7.5(2070)。
4070S 在光追、RTX 3D 纹理和 DLSS 3 上拥有更高效率与更低延迟。
基准测试
实际使用场景对比
| 场景 | 4070S 适用性 | 2070 适用性 |
|---|---|---|
| 1440p / 4K 游戏(包括光追) réfléch | 能在 60 fps 以上,尤其在《Cyberpunk 2077》《Red Dead Redemption 2》 | 在 1440p 可达 60 fps,4K 光追多在 30 fps 级别 |
| 1080p/120Hz 游戏 | 也能轻松应付,支持 DLSS 3 | 1080p 仍可满足多数游戏需求 |
| GPU 计算、CUDA 工作 | 大规模并行任务可获得显著加速 | 仍可完成,但总时长与能耗上升 |
| 视频编辑 / 4K 渲染 | 大显存与高带宽可缩短渲染时间 | 需要关闭光追或降低分辨率以维持 30 fps |
| 矿业(以 hash 为衡量) | hash 率提升约 1.7–2 倍 | 仍具可行性,但收益降低 |
| 长期电源预算有限(如台式机后期) | TDP 220 W,功耗略高但能效更好 | TDP 175 W,功耗更低,但旧版功能支持有限 |
选择建议
若关注的是现代游戏体验、光追与 AI 加速,或需要 12 GB 以上显存来玩 4K 分辨率并保持高帧率,4070S 在这些指标上占据明显优势。
若用户主要跑 1080p 传统游戏或对电源预算与功耗更敏感,2070 在现有工作负载下仍能保持可接受的帧率与图形表现。
在做选购决策时,可先评估目标应用的 GPU 需求——若需频繁开启光追或 DLSS、执行 CUDA 任务、或在 4K 分辨率下保持 60 fps,4070S 的技术优势会直接体现在体验上;若主要玩旧款或不使用光追的游戏,2070 仍能满足基本需求。