腾讯混元文生图大模型再创新,ControlNet插件助力创作
近日,腾讯再次推出重磅功能,正式发布了混元文生图大模型(HunyuanDiT)的新插件ControlNet。这次更新包括三款全新插件:tile(高清放大)、inpainting(图像修复与扩充)和lineart(线稿生图),进一步丰富了ControlNet的功能矩阵。这些新插件的加入,为混元DiT模型的应用场景拓宽了边界,覆盖了美术、创意、建筑、摄影、美妆和电商等众多领域,为全球的企业、个人开发者及创作者提供了更为精准的图片生成和更大的创作自由度。
ControlNet插件的强大功能
新推出的tile插件能够为图像扩充信息,实现超清放大,甚至达到4K至8K的清晰度,非常适合对图片细节有高要求的场景。inpainting插件则可以根据创作者的需求,对图片中的涂抹和斑驳部分进行处理,实现背景更换、人物主体的改变等复杂效果,方便处理大面积的图像重绘。而lineart插件则通过不同类型的线条创作真人、动漫和建筑图像,特别适合建筑效果图的生成和手稿上色。
持续升级与社区建设
腾讯混元DiT在此之前已发布了canny(边缘)、depth(深度)、pose(人体姿势)等条件的ControlNet模型,支持开发者进行推理,并开源了ControlNet的训练方案,方便开发者和创作者自定义模型。从5月宣布全面升级并开源以来,混元DiT不断强化开发者生态,发布了专属加速库,提升了推理效率,缩短了生图时间。此外,7月混元DiT升级至1.2版本,推出了小显存版本,最小只需6G显存即可运行,为个人电脑本地部署的开发者提供了更多便利。
广受欢迎的开源模型
目前,混元DiT在Github上的Star数已超过3.1k,成为最受欢迎的国产DiT开源模型。腾讯混元文生图大模型的ControlNet插件发布,不仅拓展了模型的应用范围,也为全球的企业和个人创造者提供了更丰富的图片生成可能性。随着混元DiT的持续升级和开源,期待有更多的开发者和创作者加入这个充满创新活力的社区,共同探索未来的创作新天地。
联系作者
文章来源:小夏聊AIGC
作者微信:
作者简介:专注于人工智能生成内容的前沿信息与技术分享。我们提供AI生成艺术、文本、音乐、视频等领域的最新动态与应用案例。每日新闻速递、技术解读、行业分析、专家观点和创意展示。期待与您一起探索AI的无限潜力。欢迎关注并分享您的AI作品或宝贵意见。