标签:高效推理

陈丹琦团队降本又来了:数据砍掉三分之一,性能却完全不减
首次用元数据加速预训练原标题:陈丹琦团队降本又来了:数据砍掉三分之一,性能却完全不减文章来源:量子位内容字数:3463字陈丹琦团队新研究:元数据加速大模型预训练,数据量减少……
开源推理模型阿里Marco-o1技术细节全面解读
OpenAIO1模型引发业界对大规模推理模型(largereasoningmodels,LRM)研究的热潮。前文评测结果显示开源的Marco-o1效果不错,甚至超越部分闭源产品。今天这篇小作文将全面介绍Marco-o……
我与vLLM的2024:清华大佬的vLLM开发之路
也许二十年后再回首,我们会发现,现在我们就站在下一个“互联网级奇迹”的起点上。原标题:我与vLLM的2024:清华大佬的vLLM开发之路文章来源:智猩猩GenAI内容字数:12100字vLLM项目……
我与vLLM的2024:清华大佬的vLLM开发之路
也许二十年后再回首,我们会发现,现在我们就站在下一个“互联网级奇迹”的起点上。原标题:我与vLLM的2024:清华大佬的vLLM开发之路文章来源:智猩猩GenAI内容字数:12100字vLLM项目……