核心对比
-
核心数量与频率
- P620:512个 Shading Unit,核心频率 1266 MHz,Turbo 1354 MHz。
- GTX 1070 Mobile:2048个 Shading Unit,核心频率 1443 MHz,Turbo 1645 MHz。
结果:P620 的单个单元性能远低于 GTX 1070 Mobile,但其能耗仅为 40 W,适合移动工作站环境。
-
显存与带宽
- P620:2 GB GDDR5,128 bit 位宽,带宽 80 GB/s。
- GTX 1070 Mobile:8 GB GDDR5,256 bit 位宽,带宽 256 GB/s。
结果:在需要大量纹理或高分辨率模型的情况下,GTX 1070 Mobile 可提供更高的缓存与内存带宽。
-
计算性能(FP32)
- P620:约 1.4 TFLOPS。
- GTX 1070 Mobile:约 6.7 TFLOPS。
结果:GTX 1070 Mobile 的单精度计算能力是 P620 的四倍多,适合需要大规模并行计算的任务。
-
缓存与架构
- P620 L2 缓存 1 MB;GTX 1070 Mobile L2 缓存 2 MB。
- P620 的 SM 数量为 4;GTX 1070 Mobile 为 16。
结果:GTX 1070 Mobile 在多任务与多线程渲染上具备更大的并行度。
跑分对比(以 3DMark 为例)
| 测试项目 | P620 | GTX 1070 Mobile |
| Time Spy 2560×1440 | 1 582.5 | 5 268 |
| Time Spy Graphics 2560×1440 | 1 388 | 5 485 |
| Ice Storm 1280×720 | 310 112 | 338 057 |
| Cloud Gate 1280×720 | 23 291.5 | 27 920 |
| Fire Strike 1920×1080 | 4 447.5 | 13 797.5 |
在所有测试中,GTX 1070 Mobile 的分数均高出 2–3 倍,说明其在图形渲染与游戏场景下的实际表现更佳。
使用场景举例
-
专业 CAD / 3D 建模
- 软件(如 SolidWorks、Revit、AutoCAD)对 NVIDIA Quadro 系列的驱动进行了优化,能够利用硬件加速绘制、光照、材质等功能。
- 虽然 P620 的硬件规格较低,但其驱动稳定性和对专业 API 的支持,使得在复杂模型(几百万多边形)下的实时预览仍能保持较高帧率。
- 如果项目需要 4K 纹理、物理渲染或实时布线,GTX 1070 Mobile 的 8 GB 内存和更高的带宽会更有优势。
-
游戏 & 娱乐
- GTX 1070 Mobile 的显存、核心数量与频率使其在 1080p 或 1440p 游戏中能轻松达到 60 fps 以上。
- P620 在游戏中会因为核心数不足而出现明显瓶颈,尤其在需要高帧率的射击或即时战略游戏中。
-
GPU 计算 & 深度学习
- 两者均支持 CUDA 6.1,但 GTX 1070 Mobile 的 CUDA 核心更多,理论上可实现更快的向量运算。
- 对于需要大量显存的深度学习模型,GTX 1070 Mobile 的 8 GB 更适合;P620 仅适用于轻量级模型或小批量推理。
-
功耗与散热
- P620 仅 40 W,适合配合低功耗移动工作站、轻薄本或高效散热设计。
- GTX 1070 Mobile 120 W,需更大的电源供应与散热系统,适合桌面或高性能笔记本。
选型建议
- 若首要任务是 专业图形设计、CAD、工程可视化,且设备对功耗与尺寸有严格限制,可选用 P620。
- 若需求是 高帧率游戏、GPU 密集型计算或需要大显存的 3D 渲染,则 GTX 1070 Mobile 更为合适。
- 对功耗、散热、系统集成有极高要求时,P620 的低功耗优势可带来更长续航和更低噪声。
- 对显存容量、渲染细节与多线程并行度要求更高的工作流,GTX 1070 Mobile 的硬件规格提供了更大的空间。