标签:模型压缩

NEW突破极限:LLM能力密度惊人翻倍的Densing法则揭秘
大模型不仅有ScalingLaw,还有DensingLaw原标题:LLM最大能力密度100天翻一倍!清华刘知远团队提出DensingLaw文章来源:机器之心内容字数:5265字大模型的发展趋势:ScalingLaw与De……
颠覆传统:腾讯优图与中科大携手推出全新模型知识蒸馏SOTA!
一种基于Sinkhorn距离的知识蒸馏方法原标题:模型知识蒸馏新SOTA!告别传统散度蒸馏|腾讯优图&中科大出品文章来源:量子位内容字数:6619字基于Sinkhorn距离的知识蒸馏新方法S……