胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。
胡瀚加入腾讯,负责多模态大模型研发
本文报道了计算机视觉领域专家胡瀚加入腾讯的消息,并详细介绍了他的学术背景、职业经历以及在Swin Transformer项目中的重要贡献。胡瀚接替离职的刘威,负责腾讯多模态大模型的研发工作,这标志着腾讯在该领域发展的新阶段。
胡瀚的学术与职业生涯
胡瀚拥有清华大学本科和博士学位,师从周杰教授,博士论文获得2016年中国人工智能学会优秀博士论文奖。他曾在宾夕法尼亚大学GRASP实验室进行访问研究,后加入百度深度学习研究所担任Tech Leader,并在2016年加入微软亚洲研究院视觉计算组,担任首席研究员。
Swin Transformer的突破性贡献
胡瀚作为Swin Transformer论文的核心作者之一,对计算机视觉领域做出了重大贡献。Swin Transformer凭借其优异的性能,超越了当时的主流网络架构,成为计算机视觉领域的通用backbone,并获得ICCV最佳论文奖。该论文解决了当时业界关于Transformer与卷积网络孰优孰劣的争论焦点。
接替刘威,负责腾讯多模态大模型研发
胡瀚加入腾讯,接替了离职的刘威,负责腾讯多模态大模型的研发工作。刘威曾是腾讯AI Lab的重要成员,在CV基础大模型、多模态理解大模型以及文生图、文生视频等方面都有突出贡献,并获得诸多荣誉。
腾讯多模态大模型的进展
腾讯在多模态大模型研发方面取得了显著进展,近期开源了参数量达130亿的混元大模型的文生视频能力,此前已陆续推出文生文、文生图、3D生成等能力,这标志着腾讯在多模态大模型领域迈出了坚实的一步。
总结
胡瀚的加入为腾讯多模态大模型的研发注入了新的活力。凭借其在计算机视觉领域的深厚积累和Swin Transformer的成功经验,他将带领团队进一步推动腾讯在人工智能领域的发展,为用户带来更先进、更智能的产品和服务。
联系作者
文章来源:AI科技评论
作者微信:
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。
暂无评论...