深度学习显卡用amd还是英伟达
NVIDIA使用的人较多,所以网上的资源也比较多,容易学习和构建。而AMD的显卡,由于很迟才推出它的编程架构,用的人比较少,所以网上的资料较少,所以很难去学习。NVIDIA 在深度学习训练方面的领先地位在MLPerf 0.6中得到了证明,这是AI训练的第一项行业级基准测试。
深度学习显卡的选择:
1、选择算力在5.0以上的
根据官方说明,在GPU算力高于5.0时,可以用来跑神经网络。算力越高,计算能力越强,建议小伙伴们在资金充足的情况下,尽量买算力高一些的。
2、尽量选择大显存
显存越高,意味着性能越强悍。特别是对于CV领域的朋友们,建议至少有一个8GB显存的显卡。下面是英伟达的部分中高端显卡的一些性能参数。
3、GPU几个重要的参数
GPU架构:
不同款的GPU可能采用不同设计架构,比如GeForce 10系列的GTX 1080/1080Ti采用的是Pascal架构,而GeForce 20系列的RTX 2080/2080Ti采用的是Turing架构。不同架构的GPU,即使其他参数差不多,性能差别可能非常大。
显存带宽:
代表GPU芯片每秒与显存交换的数据大小,这个值等于显存位宽*工作频率,单位为GB/秒,该值越大,代表GPU性能越好。Geforce GTX 1080的显存带宽为320GB/秒,而它的升级版Geforce RTX 2080的带宽为448GB/秒。
显存位宽:
代表GPU芯片每个时钟周期内能从GPU显存中读取的数据大小,这个值越大代表GPU芯片和显存之间数据交换的速度越快,性能越好。Geforce GTX 1080的显存位宽为256bit,Geforce RTX 2080Ti显存位宽为352bit。
GPU工作频率:
代表GPU每秒钟工作次数,单位为MHz,跟CPU的频率类似。该值越大代表性能越好。
CUDA核心数量:
CUDA核心数量越大越好,Geforce GTX 1080的CUDA核心数量是2560个。而Geforce RTX 2080Ti的CUDA核心数高达4352个。
功耗:
GPU能耗,像Geforce这种消费级的显卡一般功耗非常高,Geforce GTX 1080的最大功耗为175W,Tesla P4的最大功耗为75W。像那种数据中心大规模级别的GPU部署,低功耗的显卡一年电费能省很多。