AI代理更强了
原标题:超强AI代理上线!OpenAI推出“Deep Research”,媲美研究分析师水平?
文章来源:大数据文摘
内容字数:5883字
OpenAI发布ChatGPT深度研究功能:AI代理智商再升级
OpenAI重磅发布了ChatGPT的全新代理功能——Deep Research(深度研究),引发业界广泛关注。该功能能够自动查找、分析和综合数百个在线资源,在数十分钟内生成一份高质量的综合报告,堪称“超能力”。
1. 深度研究功能详解
深度研究由即将面世的OpenAI o3模型驱动,具备强大的推理能力,能够智能地浏览互联网上的文本、图像和PDF文件,并根据信息进行调整。它旨在帮助从事金融、科学、政策和工程等领域的人员进行深入研究,也适用于需要个性化推荐的消费者。目前,ChatGPT Pro用户每月可使用100次,Plus和Team用户以及企业用户也将陆续获得该功能。
2. 性能表现与测试结果
深度研究在多个基准测试中取得了领先成绩,例如在“Humanity’s Last Exam”测试中达到26.6%的准确性新高,并在GAIA基准测试中达到最先进水平。OpenAI展示了其在商业报告制作、信息检索、医学研究分析、用户体验设计和个性化购物推荐等多个领域的应用场景。
3. 效率提升与价值创造
内部评估显示,深度研究能够自动化完成数小时的人工调查工作,其任务通过率与工具调用次数成正比,并且任务的经济价值与通过率的相关性高于与人类花费时间的关系。Sam Altman表示,深度研究的性价比极高,投入50美分的计算成本,可以创造500美元的价值。
4. 用户体验与应用案例
生物医学科学家Derya Unutmaz试用后表示,深度研究改变了多个领域的“游戏规则”,它像一位24/7全天候的专家助手,甚至能胜任专业医生的工作。多伦多大学教授Kevin A. Bryan则展示了深度研究在10分钟内完成一篇专业论文的案例,凸显了其在学术研究中的潜力。
5. 与谷歌Gemini 2.0 Flash对比
与谷歌的类似功能相比,OpenAI的深度研究更注重深入分析和思考,而非单纯的信息汇总。它更像是一位见解独到的研究员,能够提供更具深度和个性化的研究成果。
6. 局限性与未来展望
深度研究仍处于早期阶段,可能存在幻觉或错误推断的情况,但发生率低于现有ChatGPT模型。OpenAI计划未来将其与Operator功能结合,实现更复杂的任务执行,并扩展其对专业数据源的访问。
7. OpenAI进军AI硬件
OpenAI被爆料可能开发人工智能专用硬件和芯片,Sam Altman暗示这将是一次重大的技术革新,并可能与苹果前首席设计官乔尼·艾维合作。 OpenAI正在开发定制芯片以提升AI效率,但原型机可能需要数年时间才能面世。
总而言之,OpenAI的深度研究功能标志着AI代理能力的显著提升,它将深刻改变人们获取和处理信息的方式,并释放巨大的商业潜力。 然而,我们也需要关注其潜在的局限性和伦理问题,确保其健康发展和应用。
联系作者
文章来源:大数据文摘
作者微信:
作者简介:普及数据思维,传播数据文化