我是h1

 

地址: 深圳湾科技生态园5栋D座1302室
客服电话:
4008400488
邮箱: bd@rainxn.com

墨客星球

友情链接

© 2019 深圳雨本信息技术有限公司 | 粤ICP备17123203号 网站建设:中企动力 深圳

联系我们

最新文章

新一代国产CPU龙芯3A6000发布:四核2.5GHz,对标英特尔10代酷睿
新一代国产CPU龙芯3A6000发布:四核2.5GHz,对标英特尔10代酷睿
LeCun:超级AI不会主宰人类,但人工智能必须开源!;知情人士称:长安并非唯一一家入股华为新平台的车企
LeCun:超级AI不会主宰人类,但人工智能必须开源!;知情人士称:长安并非唯一一家入股华为新平台的车企
小雪节气
小雪节气
2023年11月22日
美国禁令芯片出口;严重停机!ChatGPT崩溃近2小时
美国禁令芯片出口;严重停机!ChatGPT崩溃近2小时
首款国产5G基站核心芯片上架淘宝;ChatGPT 真实参数只有 200 亿
首款国产5G基站核心芯片上架淘宝;ChatGPT
雷军称小米14越级对标iPhone15Pro; 四维图新董事长辞职
雷军称小米14越级对标iPhone15Pro;

TensorFlow 中的自动混合精度,可在 NVIDIA GPU 上实现更快的 AI 训练

快讯
2019年3月20日
浏览量
【摘要】:
TensorFlow技术博客发布新文,文章讨论道,混合精度训练利用半精度加速训练,在某些情况下即便是使用相同超参数进行单精度训练,也能达到相同的精度。如此一来,内存需求会减少。使用混合精度需要两个步骤:移植模型以在适当时候使用半精度数据类型;并使用损耗缩放来保留小的梯度值。我们(指英伟达)为TensorFlow引入了自动混合精度功能(现在可以在1.x中使用,很快也能在2.x中使用),这能通过英伟达

TensorFlow 技术博客发布新文,文章讨论道,混合精度训练利用半精度加速训练,在某些情况下即便是使用相同超参数进行单精度训练,也能达到相同的精度。如此一来,内存需求会减少。使用混合精度需要两个步骤:移植模型以在适当时候使用半精度数据类型;并使用损耗缩放来保留小的梯度值。我们(指英伟达)为 TensorFlow 引入了自动混合精度功能(现在可以在 1.x 中使用,很快也能在 2.x 中使用),这能通过英伟达的 Volta 和 Turing GPU 中的 Tensor Core 进行修改以提高训练性能。自动混合精度在 TensorFlow 中内部应用这两个步骤,在 NVIDIA 的 NGC 容器中使用单个环境变量,并在必要时实现更精细的控制。