| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA RTX 5070 Ti | Blackwell 2.0 | 5 nm | 2295 MHz | 2452 MHz | 8960 | GDDR7 | 1750 MHz 28 Gbps |
256 bit | 300W | 详细参数>> | |
| AMD RX 9070 | RDNA 4.0 | 5 nm | 1330 MHz | 2520 MHz | 3584 | GDDR6 | 2518 MHz 20.1 Gbps |
256 bit | 220W | 详细参数>> |
核心频率与计算单元
RTX 5070Ti 的基准频率 2295 MHz,Turbo 2452 MHz,核心单元 8960 个;
RX 9070 的基准频率 1330 MHz,Turbo 2520 MHz,核心单元 3584 个。
单个 GPU 计算核心数量几乎是 RTX 的两倍,且核心频率亦高,这意味着在需要大量并行算子、Shader 计算或传统游戏图形渲染时 RTX 5070Ti 能提供更高的吞吐量。
光栅化与纹理单元
RTX 拥有 96 ROPs 与 280 TMUs,RX 9070 则为 128 ROPs 与 224 TMUs。
虽然 ROP 数量略低,RTX 在纹理采样能力上更强;而 RX 的 ROP 数量更高,在极低分辨率或需要大量像素写入的工作负载(如某些 VR 场景)下可略占优势。
光线追踪与张量核心
RTX 提供 70 RT Cores 与 280 Tensor Cores;RX 9070 具 56 RT Cores 与 112 Tensor Cores。
在开启 RTX 3.x 或 DLSS 3 的游戏中,RTX 的光线追踪加速与混合 AI 处理能带来更平滑的帧率与更高质量渲染。RX 的光线追踪虽然支持,但核心数不足,表现会相对逊色。
显存与内存带宽
两张卡都配备 16 GB 显存,位宽 256 bit。
RTX 使用 GDDR7,频率 1750 MHz(28 Gbps),带宽 896 GB/s;
RX 采用 GDDR6,频率 2518 MHz(20.1 Gbps),带宽 644.6 GB/s。
在 4K 纹理密集或超高分辨率 VR 场景下,RTX 的更宽内存带宽可减少瓶颈,RX 在大多数游戏中仍能满足需求,但在极端纹理占用时可能受限。
理论浮点性能
RTX 5070Ti: FP32 43.94 TFLOPS;FP16 43.94 TFLOPS;FP64 686.6 GFLOPS。
RX 9070: FP32 36.13 TFLOPS;FP16 72.25 TFLOPS;FP64 1.129 TFLOPS。
在传统单精度渲染与游戏图形中,RTX 5070Ti 更占优势;若需要大量半精度运算或双精度计算(科学模拟、AI 训练等),RX 9070 的 FP16 与 FP64 性能更高。
功耗与散热
RTX 5070Ti TDP 300 W,建议电源 700 W;
RX 9070 TDP 220 W,建议电源 550 W。
若机箱空间有限、功耗受限,RX 9070 更友好;若追求极致性能,RTX 5070Ti 需要更强散热与更大电源。
3DMark 基准
使用场景举例
如何选取