| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| AMD RX 480 | GCN 4.0 | 14 nm | 1120 MHz | 1266 MHz | 2304 | GDDR5 | 2000 MHz 8 Gbps |
256 bit | 150W | 详细参数>> | |
| NVIDIA P104-100 | Pascal | 16 nm | 1607 MHz | 1733 MHz | 1920 | GDDR5X | 1251 MHz 10 Gbps |
256 bit | 200W | 详细参数>> |
核心频率
RX 480 1120 MHz → Turbo 1266 MHz,P104‑100 1607 MHz → Turbo 1733 MHz。
P104 具备更高的基础与提升频率,理论上可提供更快的指令执行。
架构与制造工艺
RX 480 基于 GCN 4.0,14 nm 制程;P104‑100 基于 Pascal,16 nm 制程。
GCN 以 8 B 指令管线为主,Pascal 采用 16‑位 SIMD 单元,单元间通信更为高效。
L1 Cache:RX 480 16 KB/CU,P104 48 KB/SM;两者 L2 相同 2 MB。
显存容量:RX 480 8 GB GDDR5,P104 4 GB GDDR5X;带宽分别 256 GB/s 与 320.3 GB/s。
单元分布
Shading Units:RX 480 2304,P104 1920;TMUs:RX 480 144,P104 120;ROP:RX 480 32,P104 64。
虽然 RX 480 拥有更多 Shading 与 TMUs,但 P104 通过更高的时钟和更宽的位宽获得更快的纹理与像素率。
理论计算性能
FP32:RX 480 5.834 TFLOPS,P104 6.655 TFLOPS。
FP64:RX 480 364.6 GFLOPS,P104 208 GFLOPS。
FP16 及纹理率略高于 RX 480。
总的来看,P104 在单精度和纹理处理方面略占优势,FP64 则更偏向 RX 480。
总线与接口
RX 480 采用 PCIe 3.0 ×16,足以支撑高带宽需求。
P104‑100 采用 PCIe 1.0 ×4,约 8 GB/s,已无法满足高分辨率游戏的显存和纹理读取需求。
输出接口:RX 480 提供 HDMI 2.0b 与 DisplayPort 1.4a,P104 无显示输出,专为挖矿设计。
功耗与热设计
RX 480 TDP 150 W,P104‑100 的 TDP 未公开,但建议电源 200 W。
在功耗相近的前提下,RX 480 的能耗效率更适合高频率游戏。
挖矿算力
使用场景对比
主机游戏
深度学习/科学计算
矿工部署
整体能效
选择依据