# GPU选择指南

# 决定GPU性能的主要参数

# 内存大小

神经网络越深,或者训练时批量大小越大,所需要的GPU内存就越多

# 计算能力

GPU的运算速度越快,计算能力就越高

# 内存带宽

内存带宽要有足够空间才能发挥出所有的计算能力

# 现有产品的性能对比

GPU类型 内存(G) 内存带宽(GB/s) 计算能力(TeraFLOPS)
GeForce RTX 3080 10G 760 14.9
GeForce RTX 2080 Ti 11G 616 6.7
Tesla P100 16G 732 5.3
Tesla T4 16G 320+ 4
GeForce RTX 3090 23G 936 17.8
Tesla V100 32G 900 7
Ampere A100 40G 1600 9.7

# 选择合适的GPU步骤

# 根据使用用途确定GPU的内存大小

用途 所需内存大小
参加Kaggle、天池等竞赛 大于(包含)8G
深度学习业余学习 大于(包含)10G
深度学习研究人员、CV(video) 大于(包含)24G

# 通过两种方式提升运算速度

A.选择内存较大的GPU增加batchsize

B.增加GPU的数量,多GPU并行

# GPU在不同模型上的表现(CNN训练速度img/s)

GPU类型 VGG-16 ResNet-50
GeForce RTX 3080 282 445
GeForce RTX 2080 Ti 170 294
Tesla P100 203 169
Tesla T4 106 256
GeForce RTX 3090 313.7 509.5
Tesla V100 240 405
Ampere A100 440.35 642.63