OpenAI 正式发布了其 o1 模型,该模型已从预览版升级为核心功能,成为 ChatGPT 平台的一部分。现在,该模型还具备图像分析功能,这是一个极具实用性的更新。用户可以上传图片,AI 聊天机器人将对其进行解读,并提供详细的建造指导,例如,仅凭一张鸟屋的照片,用户就能获得完整的建造计划。定价体系分为两个层次:用户可通过现有的 20 美元每月的 Plus 套餐访问标准版 o1,而需要更强性能的用户可以选择新的 ChatGPT Pro 套餐,每月费用为 200 美元。每月 200 美元的 ChatGPT Pro 专为专业人士和组织设计,他们需要可扩展的研究级 AI 工具。它提供对 OpenAI 最先进功能的无限访问,包括 o1 推理模型、GPT-4o 的独家版本和高级语音功能。OpenAI 的联合创始人兼首席执行官山姆·奥特曼于 2024 年 12 月 5 日上午 10 点太平洋时间在 YouTube 直播中宣布了这一消息。这次活动是 OpenAI 年末“12 天更新”系列的一部分,与圣诞节假期相呼应。为复杂任务提供更多计算能力o1 Pro 版本通过调用额外计算能力,以更高的精度解决复杂问题。据 OpenAI 称,这种增强模式在数据科学、编程挑战和法律分析方面表现出色。该公司针对研究人员、工程师等专业人士的需求,专门打造了这一专业级产品,他们需要每天使用 OpenAI 所说的“研究级智能”。测试结果显示,OpenAI 的数据表明 o1 在多个基准测试中轻松超越了预览模型和 GPT-4o。新模型在数学竞赛、编程挑战和博士级别科学问题上的表现尤为出色。OpenAI 计划不久后推出 o1 的 API 版本,开发者将能够直接利用这些功能。GPT-4o 升级到 o1 后,在编码任务上的性能提升尤为显著,部分结果甚至超越了人类专家。OpenAI 计划不久后推出该模型的 API 版本。专业版凭借其强大的处理能力,全面提升了这些改进,全面超越了标准 o1 模型,表现更加出色。在可靠性测试中,o1 的 Pro 模式设定了极高的标准——要求四个答案全部正确——并且持续超越标准版 o1 和预览版。更高的准确度,幻觉更少测试结果显示,o1 的幻觉频率低于 GPT-4o。在针对 4,000 个基于事实问题的“SimpleQA”测试中,o1 的准确率达到了 47%,超过了 GPT-4o 的 38%,幻觉率从 61%下降到 44%。专注于公众人物的“PersonQA”测试也取得了类似进步:o1 的准确率提升至 55%(高于 GPT-4o 的 50%),幻觉率从 30%降至 20%。较小的模型——GPT-4-Mini 和 o1-Mini——在准确性方面遇到更多困难,并且比它们的更大版本产生了更多的幻觉。图片由 OpenAI 提供。OpenAI 将此次改进归因于其新推出的“思维链”训练方法。这种方法教会模型在作出回应前进行更深入的思考,从而使系统能够更有效地核实事实,并更快地识别出不可靠的信息。o1 和 ChatGPT Pro 的发布正值人工智能行业竞争日趋激烈之时。中国的竞争对手,包括阿里巴巴和 DeepSeek,推出了诸如 Marco-o1 和 R1-Lite-Preview 等推理模型,发展势头迅猛,正通过开源方案对 OpenAI 的领导地位发起挑战,并在某些第三方基准测试中超越了 o1-preview。这些发展体现了对能够处理复杂问题解决任务的大型推理模型(LRM)需求的不断增长。随着 OpenAI 不断改进其产品,o1 和 ChatGPT Pro 的推出标志着其在提供易于获取、性能卓越的 AI 工具方面迈出了重要一步。这些新进展能否帮助 OpenAI 在竞争激烈的市场中保持领先地位,尚需时间验证。© AI范儿要进“交流群”,请关注公众号获取进群方式投稿、需求合作或报道请添加公众号获取联系方式往期推荐点这里👇关注我,记得标星哦~点个在看你最好看
暂无评论...