“AGI重要里程碑”
原标题:o3来了!编程跻身人类全球前200,陶哲轩说难的数学测试,北大校友任泓宇现身直播间
文章来源:量子位
内容字数:2616字
OpenAI发布o3模型及其亮点
近日,OpenAI在“双12”直播活动中正式发布了其下一代模型o3,标志着o1之后的重大进步。该模型在多个测试中表现出色,尤其是在程序员竞赛和AGI准备的测试ARC-AGI中取得了显著成绩。
1. o3模型的突出成绩
o3模型在CodeForces竞赛中,程序员分数超过2700,这一成绩在人类程序员中非常罕见,只有不到200人达到此分数。此外,o3在ARC-AGI测试中得分从32%大幅跃升至75.7%和87.5%,显示出其在逻辑推理能力上的显著提升。
2. 高低思考程度的支持
o3支持低思考程度和高思考程度两种设置,前者在算力消耗上更低,而后者则能充分发挥模型的能力。这使得o3能够在不同的应用场景中灵活运用。
3. o3-mini的发布
与此同时,OpenAI还发布了o3-mini,支持低、中、高三种思考程度设置。o3-mini在编程能力上的展示引人注目,特别是在较高思考设置下,其表现超越了o1的正式版本。
4. 编程演示的成功
在现场,北大校友任泓宇展示了o3-mini的编程能力,成功编写并执行了一个Python脚本,通过API调用生成代码。该演示展示了o3-mini在短时间内完成复杂任务的能力,令人印象深刻。
5. 研究团队的背景
值得一提的是,任泓宇博士是OpenAI的核心开发者,曾在各大科技公司积累了丰富的研究经验。他的加入为OpenAI的语言模型训练带来了新的视角和创新。
总结
OpenAI的o3和o3-mini模型的发布,标志着AI技术的又一重大突破。尽管目前仍处于早期预览阶段,但其在编程、逻辑推理等方面的潜力无疑令人期待。未来,随着技术的不断发展,AI的应用场景将更加广泛。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破
暂无评论...