| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA P620 | Pascal | 14 nm | 1266 MHz | 1354 MHz | 512 | GDDR5 | 1252 MHz 5 Gbps |
128 bit | 40W | 详细参数>> | |
| NVIDIA GTX 1060 5 GB | Pascal | 16 nm | 1506 MHz | 1709 MHz | 1280 | GDDR5 | 2002 MHz 8 Gbps |
160 bit | 120W | 详细参数>> |
核心算力差距显著:FP32 计算能力分别为 1.386 TFLOPS(P620)与 4.375 TFLOPS(GTX 1060),约为 4 倍。着色单元数量也从 512 级别上升到 1280,纹理单元与 ROPs 同样呈现相同的比例提升。显存宽度与带宽从 128 bit / 80 GB/s 扩展到 160 bit / 160 GB/s,双倍数据吞吐。TDP 从 40 W 提升到 120 W,说明后者在功耗与发热方面更为激进。
在基准表现中,P620 的 3DMark Time Spy 得分 1582/1388,Ice Storm 310112,Cloud Gate 23291/30409,Fire Strike 4447/4672;相对 GTX 1060 的得分分别为 4631/4194、437988、30538/77035、11090/12984。各项比值均在 60–70 % 左右,表明在 DirectX 12/11 的典型游戏或渲染负载下,P620 的帧率与 GPU 处理能力落后约 1/3。
使用场景对比
| 场景 | P620 适用性 | GTX 1060 适用性 |
|---|---|---|
| 大型 3D CAD / 机械设计 | 驱动专门优化、支持专业 API,功耗低,机箱占用少 | 处理较大模型时显存不足,功耗高 |
| VFX 与动画渲染 | 适合低功耗工作站,支持 CUDA/OpenCL 计算任务 | 计算性能更强,可加速 GPU 渲染 |
| 游戏(1080p/1440p) | 低帧率,无法满足高设定需求 | 可在中高设定下保持 60 fps 以上 |
| VR 与实时可视化 | 低显存与性能不利于高帧率体验 | 适合要求更高的实时渲染 |
| 预算与电源受限的机箱 | 40 W TDP,单插槽,尺寸小 | 120 W TDP,双插槽,尺寸大 |
如何选择
综合来看,GTX 1060 在绝大多数基准与实际负载下,算力与显存带宽远优于 P620,而 P620 则凭借低功耗与专业驱动优势定位于工作站市场。选择应以实际工作负载与环境约束为核心依据。