英伟达最新A100加速计算卡 性能较V100提升3.5倍

下载贤集网APP看更多精彩视频

视频介绍

英伟达最新发布的基于新架构的A100加速计算卡,其官网宣传:自动混合精度和FP16,可以为A100带来2倍的性能提升;而且,在不更改代码的情况下,具有TF32的A100与英伟达Volta相比,性能能够高出20倍。那么,A100与V100相比,究竟如何?硬件参数对比,相比V100,A100的单精度浮点计算能力,从15.7TFLOPS提升至19.5TFLOPS;而双精度浮点运算从7.8TFLOPS提升至9.7TFLOPS。在卷积神经网络训练中:1块A100的训练速度是1块V100的2.2倍;使用混合精度时,前者则是后者的1.6倍。在语言模型训练中:1块A100的训练速度是1一块V100的3.4倍;使用混合精度时,前者则是后者的2.6倍。其中,分别用8块A100与8块V100,进行32位训练:前者速度能够达到后者的3.5倍;针对不同模式下的深度学习训练,英伟达A100都有着相当不错的效率。感兴趣的可以关注一。

飞速科创

了解更多有趣的知识,就关注飞速科创

我来说几句


获取验证码
最新评论

还没有人评论哦,抢沙发吧~

)