一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。Audio2Face官网入口网址
腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象,YOLO-World官网入口网址
一个能够录下你的语音内容,然后自动帮助你把这些语音转成文字,对内容进行总结,并且生成相关的任务列表的AI笔记工具。notesGPT官网入口网址
自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。MoneyPrinter官网入口网址
一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。SoraWebui官网入口网址
一个高度可控的虚拟模特服装试穿开源工具,OOTDiffusion可以根据不同性别和体型自动调整服装,可控试穿参数,自然融合与逼真效果。OOTDiffusion官网入口网址
一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。Sora.FM官网入口网址
一个专注于动漫图像超分辨率的项目,旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。APISR官网入口网址
一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。Open WebUI官网入口网址
毫不费力地改变图像和视频中的照明,实现超逼真的效果。使用Beeble AI 的创新技术,通过逼真的灯光效果增强您的创作。Beeble AI官网入口网址
一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的理解,从经典作品到最新发布的动漫,覆盖了从古老到现代的各种艺术风格。Animagine XL 3.1官网入口网址
一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。StreamMultiDiffusion官网入口网址
一款漂亮且功能强大的在线海报设计器,图片编辑器,仿稿定设计,迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。迅排设计官网入口网址
MotionAgent 集成了大语言模...
小狐狸AI创作系统是一款基于T...
AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。AIdea官网入口网址
TextBase 是一款简单的框架,用于构建 AI 聊天机器人,它可以帮助开发人员快速搭建和优化聊天机器人。TextBase官网入口网址
EasyPhoto是一个用于生成AI肖像的Webui UI插件,可以用来训练与你相关的数字化替身。EasyPhoto官网入口网址
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper语音识别模型官网入口网址
AI Companion App,一键创建和训练属于你的AI伴侣/女朋友。AI Companion App官网入口网址
FaceChain是一个可以用来打造...
Gemini是Google DeepMind推出的全新AI模型,集成了多模态推理功能,超越了以往模型的性能,适用于科学文献洞察、竞争性编程等多种应用场景。Gemini官网入口网址
解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。HandRefiner官网入口网址
DreaMoving,一种基于扩散的可控视频生成框架,用于生成高质量的定制人类舞蹈视频。DreaMoving官网入口网址
LucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航)/移动和滚动(缩放)以感受3D。LucidDreamer官网入口网址
PIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实现动作控制,与各种个性化T2I模型兼容,无需特定调整。PIA官网入口网址
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。AnyDoor官网入口网址
一个开源的 AI 图像重绘增强工具,通过使用最新的 BSR Gan技术,可以将低分辨率图像提升至高分辨率并修复和增强图像的细节。DemoFusion官网入口网址
一款融合了音乐理解和多模态音乐生成任务,旨在助力用户进行音乐艺术创作的引领潮流的框架。M2UGen官网入口网址
一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。DreamTalk官网入口网址