| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA CMP 30HX | Turing | 12 nm | 1530 MHz | 1785 MHz | 1408 | GDDR6 | 1750 MHz 14 Gbps |
192 bit | 125W | 详细参数>> | |
| NVIDIA RTX 5000 | Turing | 12 nm | 1620 MHz | 1815 MHz | 3072 | GDDR6 | 1750 MHz 14 Gbps |
256 bit | 230W | 详细参数>> |
核心频率与 Turbo 频率略高于 CMP 30HX,说明 RTX 5000 在单周期频率上有优势。
核心数量、SM、Shading Units、TMUs 与 ROPs 等算子数量均显著提升,RTX 5000 具备 3072 个 Shader、192 个 TMU 以及 64 个 ROP,CMP 30HX 仅为 1408、88 与 48。
L2 缓存容量从 1.5 MB 扩大到 4 MB,带宽提升 33 %(336 GB/s → 448 GB/s)。
FP32 与 FP16 计算性能分别从 5.027 TFLOPS / 10.05 TFLOPS 提升至 11.15 TFLOPS / 22.30 TFLOPS,几乎翻倍。
显存宽度与容量提升 26 bit 与 10 GB,提供更高的内存带宽与更大存储空间,适用于高分辨率纹理与大型模型。
显存频率保持一致,但宽度与带宽差距导致 RTX 5000 在纹理压缩与高分辨率渲染时更具优势。
TDP 与供电接口差异明显:125 W 与 1×8 pin 对比 230 W 与 6+8 pin。若系统电源与散热不足,CMP 30HX 更易部署。
PCIe 接口宽度从 x4(CMP 30HX)扩展到 x16(RTX 5000),在 PCIe 3.0 环境下可利用更高带宽。
在 3D CAD、仿真与虚拟化等专业场景,RTX 5000 的显存容量、计算单元与带宽能提供更快的渲染与更大数据处理能力。
在机器学习推理或轻度 CAD 任务,或对电源与散热有严格限制的工作站,CMP 30HX 由于低功耗与较小尺寸,能满足需求。
跑分方面,DaggerHashimoto 与 ETCHash 算力均为 27.5(CMP 30HX)与 37(RTX 5000),显示 RTX 5000 在同等算法下有约 35 % 的算力提升。
选择依据: