| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA A40 | Ampere A | 8 nm | 1305 MHz | 1740 MHz | 10752 | GDDR6 | 14.5 Gbps | 384 bit | 300W | 详细参数>> | |
| NVIDIA RTX 4090 | Ada Lovelace | 5 nm | 2235 MHz | 2520 MHz | 16384 | GDDR6X | 1313 MHz 21 Gbps |
384 bit | 450W | 详细参数>> |
A40 与 RTX 4090 均基于 Ada Lovelace 架构,核心频率、CUDA 核心数、显存容量与显存带宽几乎一致。两卡在 FP32、FP16 的理论吞吐量都达 82.58 TFLOPS,FP64 也相同。区别主要体现在以下几个维度:
| 参数 | A40 | RTX 4090 |
|---|---|---|
| 目标市场 | 专业工作站、数据中心、科研仿真 | 家用游戏机、创意工作站 |
| 内存 ECC | 支持 ECC,可在长时间运算中避免错误 | 不支持 ECC,主打高频率渲染 |
| NVLink 支持 | 可与多张 A40 通过 NVLink 互联,适合 GPU 集群 | 仅单卡,无法 NVLink 互联 |
| 驱动与软件支持 | NVIDIA RTX Studio/Quadro 驱动,优化 CAD、3D 渲染软件 | GeForce 驱动,针对游戏与创意软件进行优化 |
| 热设计功耗 (TDP) | 450 W,建议 850 W PSU | 450 W,建议 850 W PSU |
| 尺寸与插槽 | 3 slots(304 mm 长) | 2.5‑3 slots(约 304 mm 长) |
3D 渲染与 CAD
游戏与娱乐
AI 训练与深度学习
高性能计算(HPC)
在两卡硬件性能基本一致的前提下,决定权最终落在是否需要 ECC、NVLink 以及专业驱动的支持上。