RTX 3090 AI性能实测:FP32训练速度提升50%张量核心缩水

气动机构原标题:RTX 3090 AI性能实测:FP32训练速度提升50%,张量核心缩水 RTX 3090在深度学习训练任务中,性能表现究竟如何,它能否取代Titan RTX成为最强消费级AI训练卡?现在已经有了答案。...

日期: 2024-01-19 08:44

  气动机构原标题:RTX 3090 AI性能实测:FP32训练速度提升50%,张量核心缩水

  RTX 3090在深度学习训练任务中,性能表现究竟如何,它能否取代Titan RTX成为最强消费级AI训练卡?现在已经有了答案。

  国外两位AI从业者在拿到这款显卡后,第一时间测试了其在TensorFlow上的AI训练性能。

  话不多说,先看数据。在FP32任务上,RTX 3090每秒可处理561张图片,Titan RTX每秒可处理373张图片,性能提升50.4%!

  为何在FP32任务上的性能提升比在FP16上更明显,主要是因为RTX 3090大大提高了CUDA核心的数量。但是用于处理FP16的张量核心数量明显减少,这可能会影响FP16性能。

  即便如此,张量核心更少的RTX 3090在很多FP16任务上,性能依然有小幅提升。

  可以看出,使用FP32进行的所有模型训练,RTX 3090都能实现40%~60%的训练提升。而大多数模型的FP16训练速度几乎不变,最多提升20%,甚至在Inception模型上还有所下降。

  只能说RTX 3090在张量核心上的“刀法”颇为精准,如果你对FP16训练性能有较高要求,也许可以等待今后的升级版。

  不过RTX 3090上市价格仅1499美元,比Titan RTX便宜1000美元,仍不失为“性价比”之选。

  本文系网易新闻网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

  「2020中国人工智能年度评选」正式启幕!将从公司、人物、产品、社区四大维度共7个奖项寻找优秀的AI企业,欢迎大家扫名参与。

  原标题:《RTX 3090 AI性能实测:FP32训练速度提升50%,张量核心缩水》返回搜狐,查看更多

返回顶部