GTX 1070 / RTX 2070 参数对比总结
💡以下内容由AI总结
核心频率、核心架构和工艺差异
- GTX 1070基于Pascal,核心频率在1506 MHz(高频1683 MHz)范围内。
- RTX 2070采用Turing,核心频率1410 MHz(高频1620 MHz)。
- 尽管1070的基础频率略高,但2070在Turing架构下拥有更多的SM(36 vs 15)和显存位宽保持相同,整体并行度显著提升。
并行计算单元
- Shading Units:2070拥有2304个,而1070为1920个,约多了20 %。
- TMUs:2070提供144个,1070为120个,提升了纹理采样吞吐。
- 这意味着在纹理密集或光照复杂的场景中,2070的渲染效率更高。
缓存与显存
- L1 Cache 2070为64 KB/SM,1070为48 KB/SM;L2 Cache 4 MB vs 2 MB。
- 显存带宽从256.3 GB/s提升到448 GB/s,GDDR6提供更高频率与更高峰值带宽。
- 在高分辨率(≥1440p)或高纹理需求的游戏中,2070能够更好地保持帧率。
理论浮点性能
- FP32:2070 7.465 TFLOPS,1070 6.463 TFLOPS。
- FP16(半精度):2070 14.93 TFLOPS,1070 101 GFLOPS。
- Turing对深度学习、AI推理和部分游戏中的光线追踪有显著优势。
图形功能
- DirectX 12 Ultimate (12.2) 在2070上可开启硬件光线追踪、纹理压缩等新特性;1070仅支持12.1。
- 对于使用光线追踪技术的现代游戏(如《Cyberpunk 2077》、 《Control》),2070能够开启高质量光线追踪,而1070则只能使用软件折衷。
主流基准对比
- 3DMark Time Spy:1070 5679,2070 9214;差距约63 %。
- 3DMark Fire Strike Standard:1070 14984,2070 18678;约25 %。
- 3DMark Ice Storm Unlimited:1070 463865,2070 425550;1070略优。
- 3DMark Ice Storm Extreme:两卡相近(约310k)。
- 云门标:1070 30229,2070 49226;约62 %提升。
矿工算力
- 以DaggerHashimoto为例:1070 27 MH/s,2070 42.7 MH/s;约58 %提升。
- 其余工作负载(ETC、KAWPOW、ZelHash)同样呈现显著提升。
使用场景
- 1080p/1440p游戏
- 在1080p,1070已能保持高帧率;2070在1440p时可进一步提升帧率,特别是在开启光线追踪时仍保持可玩性。
- 光线追踪需求
- 2070支持RT Cores,可开启光线追踪。1070无此硬件,需关闭相关效果或使用低质量预设。
- 内容创作(视频编码/渲染)
- Turing的RT、Tensor Core可加速AI增强、HDR编码;2070在CUDA、OpenCL性能上略优。
- 深度学习/AI推理
- 2070的Tensor Core在FP16/INT8推理上具有显著优势;1070不具备。
- 挖矿
- 2070在多数算法上均超过1070,尤其是ETC、KAWPOW、ZelHash。
选型建议
- 若关注光线追踪、AI相关工作或需要在更高分辨率下保持流畅,2070更适合。
- 若预算有限、仅在1080p游戏且不使用光线追踪,1070仍能提供足够的性能。
- 在矿工或工作负载上,2070的算力提升能更好地利用其硬件优势。