| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA GTX 980 Ti | Maxwell 2.0 | 28 nm | 1000 MHz | 1076 MHz | 2816 | GDDR5 | 1753 MHz 7 Gbps |
384 bit | 250W | 详细参数>> | |
| NVIDIA CMP 40HX | Turing | 12 nm | 1470 MHz | 1650 MHz | 2304 | GDDR6 | 1750 MHz 14 Gbps |
256 bit | 185W | 详细参数>> |
核心频率方面,GTX 980Ti 为 1000 MHz,Turbo 1076 MHz;CMP 40HX 为 1470 MHz,Turbo 1650 MHz。Turing 架构的 CMP 40HX 在每个时钟周期的指令吞吐量比 Maxwell 更高,导致其单精度浮点性能(FP32)从 6.060 TFLOPS 提升至 7.603 TFLOPS,约 25 % 的提升。
显存大小与带宽:980Ti 配 6 GB GDDR5,384‑bit 位宽,336.6 GB/s;40HX 配 8 GB GDDR6,256‑bit 位宽,448 GB/s。虽然位宽较低,GDDR6 的时钟更快,使得总带宽提升约 33 %。
单元方面:980Ti 拥有 2816 个着色单元、176 TMUs、96 ROP;40HX 仅 2304 个着色单元、144 TMUs、64 ROP。对需要大量像素渲染或 3D 画面处理(如 4K 游戏、VR、专业可视化)而言,着色单元与 ROP 的数量往往是瓶颈,980Ti 在这类工作负载下更具优势。
功耗与尺寸:980Ti TDP 250 W,功率接口 6‑pin + 8‑pin,尺寸 267 mm × 111 mm × 40 mm;40HX TDP 185 W,单 8‑pin 接口,尺寸 229 mm × 111 mm × 35 mm。对电源预算有限或机箱散热空间受限的用户,40HX 的低功耗与紧凑尺寸更为友好。
功能兼容:两者均支持 OpenGL 4.6、Vulkan 1.3、OpenCL 3.0;但 40HX 支持 DirectX 12 Ultimate(12.2),并拥有更先进的 CUDA 7.5。若需使用新版本的 CUDA 或 DirectX 12 特性,40HX 更合适。
输出接口:980Ti 配 1 x DVI、1 x HDMI 2.0、3 x DisplayPort 1.2,适合日常桌面使用;40HX 无任何视频输出,定位为挖矿/专业计算卡。
挖矿算力:在 DaggerHashimoto 与 ETCHash 两大算法下,40HX 的算力 36 MH/s,而 980Ti 为 20 MH/s,明显更优。
使用场景对比
选择建议