AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
AI工具
AI工具
One Shot, One Talk:中科大与香港理工携手打造创新动态图像生成技术,实现实时创作与智能化设计
OneShot,OneTalk是前沿的图像生成技术,能够从单张图片中创造出具有个性化细节的全身动态说话头像。该技术实现了生动的动画效果,包括自然的面部表情与灵活的身体动作,致力于提升……
xAI为Grok AI助手推出的新图像生成模型
产品名称:Aurora产品简介:Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠)。Auror……
音频驱动的生成肖像说话视频框架,保持身份一致性和表现力
产品名称:MEMO产品简介:MEMO(Memory-GuidedEMOtionawarediffusion)是SkyworkAI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性和表现力的……
AI文本到图像生成框架,提升单步扩散模型的效率和性能
产品名称:SNOOPI产品简介:SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导SwiftBrush)和NASA(负向远离转向注……
clone-voice:多语言声音克隆工具支持16种语言,实现个性化语音合成
Clone-voice是一款基于深度学习技术的开源声音克隆工具,能够高质量地分析和模拟人类声音。它支持中文、英文、日文、韩文等16种语言,用户可以将文本转化为语音,或在不同声音风格……
南洋理工推出的VR端3D角色扮演AI系统
产品名称:SOLAMI产品简介:SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动,基于社交视觉-语言-行为模型……
O1-CODER:智能编码助手O1版提升开发效率与代码质量
O1-CODER是一个由北京交通大学研究团队开发的开源项目,旨在重现OpenAI的O1模型,专注于编码任务。通过结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,O1-CODER显著增强了模型的……
英伟达推出的视觉语言大模型
产品名称:NVILA产品简介:NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统……
AI食谱应用,提供定制化的餐食建议
产品名称:ChefBot产品简介:ChefBot是基于AI技术快速生成个性化食谱的应用。用户输入简单的食材和饮食偏好,ChefBot能在60秒内提供定制化的烹饪方案。ChefBot满足个性化需求、注重……
AI颜色调色板,输入关键词或主题自动生成颜色组合
产品名称:ColorifyRocks产品简介:ColorifyRocks是AI颜色调色板,能根据用户输入的关键词或主题,迅速创建出和谐且吸引人的颜色组合。工具基于先进的AI技术,理解色彩理论、趋势和……