高效推理 | 86AIGC导航

标签：高效推理

陈丹琦团队降本又来了：数据砍掉三分之一，性能却完全不减

首次用元数据加速预训练原标题：陈丹琦团队降本又来了：数据砍掉三分之一，性能却完全不减文章来源：量子位内容字数：3463字陈丹琦团队新研究：元数据加速大模型预训练，数据量减少……

3个月前

开源推理模型阿里Marco-o1技术细节全面解读

OpenAIO1模型引发业界对大规模推理模型(largereasoningmodels，LRM)研究的热潮。前文评测结果显示开源的Marco-o1效果不错，甚至超越部分闭源产品。今天这篇小作文将全面介绍Marco-o……

3个月前

我与vLLM的2024：清华大佬的vLLM开发之路

也许二十年后再回首，我们会发现，现在我们就站在下一个“互联网级奇迹”的起点上。原标题：我与vLLM的2024：清华大佬的vLLM开发之路文章来源：智猩猩GenAI内容字数：12100字vLLM项目……

3个月前

我与vLLM的2024：清华大佬的vLLM开发之路

也许二十年后再回首，我们会发现，现在我们就站在下一个“互联网级奇迹”的起点上。原标题：我与vLLM的2024：清华大佬的vLLM开发之路文章来源：智猩猩GenAI内容字数：12100字vLLM项目……

4个月前