标签:缩放

用FP8训练大模型有多香?微软:比BF16快64%,省42%内存
AIGC动态欢迎阅读原标题:用FP8训练大模型有多香?微软:比BF16快64%,省42%内存关键字:精度,张量,模型,框架,缩放文章来源:机器之心内容字数:8552字内容摘要:机器之心报道编辑……