百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径


超低价格就能享受到的顶级模型

百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径

原标题:百万tokens仅需8毛,不蒸馏造出世界一流大模型豆包全新1.5Pro不走捷径
文章来源:机器之心
内容字数:11209字

豆包大模型1.5Pro版本重磅发布:性能大幅提升,价格更低

临近春节,国内AI厂商竞争激烈,豆包大模型率先发布1.5Pro版本,带来多项重大升级,为开发者和用户带来福音。

  1. 核心升级:性能全面提升,成本大幅降低

    1.5Pro版本包含基础模型Doubao-1.5-pro (32k和256k上下文长度)、新版视觉理解模型Doubao-1.5-vision-pro和实时语音模型Doubao-1.5-realtime-voice-pro,以及轻量级模型Doubao-1.5-lite。该版本在多项公开评测基准上达到全球领先水平,基础能力多模态能力均显著增强,且完全基于自主数据生产体系训练,未采用任何其他模型生成的数据。

    在成本方面,1.5Pro版本性价比极高。32k上下文长度的模型处理100万token仅需8毛钱,轻量级模型Doubao-1.5-lite更便宜。火山引擎提供API服务的Doubao-1.5-pro拥有高达50%的毛利率。

  2. 实测效果逻辑推理多模态能力卓越

    机器之心对1.5Pro版本进行了实测,其在逻辑推理题(真话者与说谎者)、数学题(高考题)和梗图理解等方面表现出色,准确率高且速度快。基于Doubao-1.5-realtime-voice-pro的实时语音功能,表现力也得到质的飞跃,能够实现拟人化、情绪理解和情感表达。

  3. 技术创新:稀疏MoE架构高效训练推理

    Doubao-1.5-pro采用稀疏MoE架构,在保持模型性能的同时降低了算力需求团队从稀疏度Scaling Law出发,确定性能和效率平衡的稀疏比例,实现了“小打大”,性能杠杆达到7倍,超越了LLaMA-3.1-405B等超大规模稠密预训练模型。

    在训练阶段,团队设计了一套高度自主的数据生产体系,深度融合了高效标注与模型自提升技术,没有使用任何第三方模型生成的数据。在SFT、Reward Model和RL阶段也进行了技术创新与优化,充分发挥真实数据的优势。

    在推理阶段,团队针对不同计算象限进行高效结合异构硬件与不同的低精度优化策略,实现了低延迟与吞吐量提升并举,降低了总成本。

  4. 全模态能力升级:视觉和语音交互能力增强

    在视觉多模态方面,通过技术升级,模型在视觉推理、文字文档识别、细粒度信息理解和指令遵循等方面能力显著增强,原生支持任意分辨率和长宽比的图片输入。在语音模态方面,团队提出了新的端到端Speech2Speech框架,实现了语音理解生成端到端,在语音对话效果上相比传统方式有质的飞跃。

  5. 开发者友好:低门槛、高效率的开发平台

    豆包大模型已在豆包APP灰度上线,开发者可在火山引擎直接调用API。火山引擎进一步优化了基于豆包大模型开发和部署应用的流程,降低了开发门槛,让开发者更轻松地将创意变成产品和服务。豆包大模型的不同版本可满足不同应用场景的需求。

  6. 未来展望:深度思考模式与智能体应用

    豆包大模型团队正在研发“Doubao深度思考模式”,其推理模型Doubao-1.5-pro-AS1-Preview在AIME基准上超过o1-preview和o1。团队认为,豆包大模型已为“智能体之年”做好准备,将在AI应用爆发中占据主导地位。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

暂无评论

暂无评论...