下一代AI视觉搜索,不止于“搜”。
支付宝“探一下”:下一代AI视觉搜索的探索
本文探讨了支付宝新推出的AI应用“探一下”,以及其代表的下一代AI视觉搜索趋势。与传统视觉搜索不同,“探一下”的核心在于“探索”,它不仅能识别物体,还能提供知识、灵感、文本等多方面信息,堪称随身“视觉百科全书”。
1. 视觉搜索赛道的现状与挑战
过去,视觉搜索主要作为文字搜索的补充,但近年来其重要性日益凸显。Google Lens的成功佐证了视觉搜索的巨大潜力,其每月调用量已超200亿次。然而,国内视觉搜索产品大多局限于特定领域,缺乏对图片深层信息的理解和分析能力,未能实现突破性发展。
2. 生成式AI重塑视觉搜索
生成式AI(GenAI)的兴起为视觉搜索带来了性的变化。它使得视觉搜索从单纯的信息检索工具,进化为能够理解用户意图、提供个性化内容、激发创意灵感并连接服务生态的智能工具。Google Lens和苹果新款iPhone的视觉智能功能也体现了这一趋势。
3. “探一下”的技术优势与创新
“探一下”正是基于GenAI技术,将多模态大模型、mRAG技术、基础视觉算法和Agent能力相结合。它采用多模态大模型全图理解和open-set多主体检测技术,实现快速、精准的意图识别,并能进行更深入的分析和解读。同时,它还具备“探灵感”功能,能根据场景生成趣味性文本,并通过轻量化推理加速和Coarse-to-Fine机制提升响应速度。为了保证准确性和可靠性,“探一下”利用RAG技术进行信息交叉验证,并注明信息来源。此外,它还严格遵守支付宝的金融级安全合规标准。
4. “探一下”的生态优势与未来发展
依托支付宝庞大的用户基础和商业生态,“探一下”有望成为国内现象级视觉搜索产品。“探一下”未来将专注于GenAI优势领域,并可能接入小程序、智能体等,进一步拓展应用场景,例如与支付宝的AI管家服务(支小宝、蚂小财、AI健康管家)以及“车生活”服务进行整合。此外,“探一下”也将在旅游、户外、亲子等场景落地,并探索无障碍辅助等领域,服务更多人群。团队还在探索与智能硬件的融合,例如智能眼镜等。
5. 总结:视觉搜索的未来
在生成式AI时代,视觉搜索将成为搜索的重要组成部分,它不再仅仅是寻找答案,而是提供更智能、更丰富、更具交互性的服务体验。支付宝“探一下”的推出,标志着蚂蚁集团在AI First战略上的进一步推进,也为下一代AI视觉搜索的发展方向提供了新的思路,有望让AI技术更便捷地服务大众生活。
联系作者
文章来源:智东西
作者微信:
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。