引领未来的视频创作革命:腾讯Sora免费开放,参数量最大文生视频模型来袭!


腾讯开源进一步促进大模型生态繁荣发展。

引领未来的视频创作革命:腾讯Sora免费开放,参数量最大文生视频模型来袭!

原标题:开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
文章来源:机器之心
内容字数:9780字

腾讯混元视频生成模型开源概览

近日,腾讯宣布旗下的混元视频生成大模型HunYuan-Video(HY-Video)正式对外开源。这款参数量达到130亿的模型为企业与个人开发者提供了全新的视频生成工具,旨在促进视频生成领域的开源生态发展。

1. 模型特点

HunYuan-Video具备以下几个显著特点:

  • 卓越画质:提供超写实的视觉体验,支持真实与虚拟风格的无缝切换。
  • 动态流畅:突破了动态图像的局限,实现完整大幅度动作的流畅演绎。
  • 语义遵从:以多模态大语言模型为文本编码器,展现出强大的语义理解能力
  • 原生镜头转换:具备多视角镜头切换能力,能够实现艺术镜头无缝衔接。

2. 开源资源与应用

HunYuan-Video的开源资源包括官网链接、代码库和技术报告,用户可通过腾讯元宝APP申请试用该功能。该模型在多个应用场景中表现出色,能够实现高质量的文生视频创作

3. 技术创新架构设计

混元团队在模型架构设计中引入了多个创新技术,包括:

  • 自研的3D视觉编码器,支持图像与视频混合训练
  • 采用全注意力机制,提升画面流畅度并实现主体一致的多视角切换。
  • 基于Scaling Law的设计与训练,优化模型参数与数据配比。

4. 开源生态的未来

腾讯混元系列模型的开源进程不断加快,未来将继续推出更多基于视频创作的模型与生态插件,促进大模型生态的繁荣发展。腾讯对开源社区的贡献已超过170个项目,吸引了大量开发者的关注。

总而言之,HunYuan-Video的开源不仅为视频生成领域带来了新的机遇,也为创作者与开发者提供了强大的工具,有望推动整个行业的创新与发展。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

暂无评论

暂无评论...