标签:张量

用FP8训练大模型有多香?微软:比BF16快64%,省42%内存
AIGC动态欢迎阅读原标题:用FP8训练大模型有多香?微软:比BF16快64%,省42%内存关键字:精度,张量,模型,框架,缩放文章来源:机器之心内容字数:8552字内容摘要:机器之心报道编辑……
「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need
AIGC动态欢迎阅读原标题:「乘法变加法」!MIT清华校友全新方法优化Transformer:AdditionisAllYouNeed关键字:乘法,尾数,模型,精度,张量文章来源:新智元内容字数:0字内容摘要:……
PyTorch团队重写「分割一切」模型,比原始实现快8倍
AIGC动态欢迎阅读原标题:PyTorch团队重写「分割一切」模型,比原始实现快8倍关键字:本,内核,矩阵,张量,乘法章来源:机器之心内容字数:7501字内容摘要:机器之心报道编辑:陈萍我……
一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源
AIGC动态欢迎阅读原标题:一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源关键字:报告,精度,模型,张量,矩阵文章来源:量子位内容字数:0字内容摘要:允中发自凹非寺量……