AI项目和框架 | 第 3 页

产品名称：Aurora产品简介：Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像，擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像（如米老鼠）。Auror……

19小时前

产品名称：MEMO产品简介：MEMO（Memory-GuidedEMOtionawarediffusion）是SkyworkAI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架，用在生成具有身份一致性和表现力的……

19小时前

产品名称：SNOOPI产品简介：SNOOPI是创新的文本到图像生成框架，基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB（适当指导SwiftBrush）和NASA（负向远离转向注……

19小时前

Clone-voice是一款基于深度学习技术的开源声音克隆工具，能够高质量地分析和模拟人类声音。它支持中文、英文、日文、韩文等16种语言，用户可以将文本转化为语音，或在不同声音风格……

19小时前

O1-CODER是一个由北京交通大学研究团队开发的开源项目，旨在重现OpenAI的O1模型，专注于编码任务。通过结合强化学习（RL）和蒙特卡洛树搜索（MCTS）技术，O1-CODER显著增强了模型的……

19小时前

产品名称：SOLAMI产品简介：SOLAMI是创新的VR端3D角色扮演AI系统，是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动，基于社交视觉-语言-行为模型……

19小时前

产品名称：NVILA产品简介：NVILA是NVIDIA推出的系列视觉语言模型，能平衡效率和准确性。模型用“先扩展后压缩”策略，有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统……

19小时前

产品名称：OOTDiffusion产品简介：OOTDiffusion是开源的AI虚拟试衣工具，能智能适配不同性别和体型，自动调整衣物尺寸和形状，生成自然贴合的试穿效果。OOTDiffusion支持半身和全身……

19小时前

产品名称：ChatTTSPlus产品简介：ChatTTSPlus是ChatTTS的扩展版本，基于集成TensorRT加速、语音克隆和移动模型部署等先进技术，提升语音合成的性能和灵活性。在Windows平台上，能实……

19小时前

书生·万象InternVL2.5是上海AI实验室OpenGVLab团队推出的一款开源多模态大型语言模型（MLLM）系列，基于InternVL2.0进行了显著的改进，尤其是在训练、测试策略和数据质量方面。该系……

19小时前

1 234 5…15

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐