AI源码 | 第 3 页 | 86AIGC导航

AI源码

硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源，开发者可自行接入多方大模型、语音识别（ASR）、语音合成（TTS）能力，实现数字人实时交互。DUIX官网入口网址

在多轮交互式图像生成中制作一致的主题，AutoStudio官网入口网址

ChatGPT-Next-Web-LangChain

一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 &amp; Gemini Pro 模型。（基于 LangChain 实现插件功能），ChatGPT-Next-Web-LangChain官网入口网址

EmotiVoice是一个强大的开源TTS引擎，完全免费，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。，EmotiVoice官网入口网址

PhotoMaker：利用多张照片作为身份ID，获取人物特征，然后根据描述生成一个新的、个性化的人物图像。PhotoMaker官网入口网址

一个增强版免费开源的ChatGPT程序，LibreChat 是一个免费开源的聊天机器人平台，集成了多种 AI 模型。LibreChat官网入口网址

AI角色动画工具，通过先进的视频处理和3D渲染技术，MotionShop能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。Motionshop官网入口网址

一个声音克隆和文本到语音转换的开源 Python RAG框架，只需1分钟语音即可训练一个自己的TTS模型。GPT-SoVITS官网入口网址

DiffusionGPT

字节跳动开发的由LLM驱动文本生成图像多合一系统，专门设计用于为不同的输入提示生成高质量的图像。DiffusionGPT官网入口网址

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。Lumiere官网入口网址

网易有道一个开源的本地知识库问答系统，旨在支持多种文件格式和数据库，允许离线安装和使用。，QAnything官网入口网址

一个为黑白图像上色的魔搭模型，通过双解码器实现逼真的图像着色，输入一张黑白图像，实现端到端的全图上色，返回上色处理后的彩色图像。，DDColor官网入口网址

基于大规模扩散的高保真通用图像恢复模型，SupIR能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。SupIR官网入口网址

FunASR 基础语音识别工具包

FunASR是一个基础语音识别工具包，提供多种功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程，支持预训练好的模型的推理与微调，FunASR 基础语音识别工具包官网入口网址

一个视频搜索和流媒体代理工具，能让您在 ChatGPT 中与您的视频库聊天并观看视频流。StreamRAG官网入口网址

Diffuse to Choose

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。Diffuse to Choose官网入口网址

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。WhisperFusion官网入口网址

DuckDB-NSQL

一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码。DuckDB-NSQL官网入口网址

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。Media2Face官网入口网址

一款由AI驱动的应用程序，通过语音生成富有表现力的3D面部动画。Audio2Face官网入口网址

腾讯AI实验室开发的一个实时目标检测工具，它能够自动识别和定位图像中的各种对象，YOLO-World官网入口网址

一个能够录下你的语音内容，然后自动帮助你把这些语音转成文字，对内容进行总结，并且生成相关的任务列表的AI笔记工具。notesGPT官网入口网址

MoneyPrinter

自动创建YouTube短视频的自动化赚钱项目，只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。MoneyPrinter官网入口网址

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。SoraWebui官网入口网址

OOTDiffusion

一个高度可控的虚拟模特服装试穿开源工具，OOTDiffusion可以根据不同性别和体型自动调整服装，可控试穿参数，自然融合与逼真效果。OOTDiffusion官网入口网址

一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。Sora.FM官网入口网址

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。APISR官网入口网址

一个可扩展、功能丰富且用户友好的自托管 WebUI，适用于各种 LLM 运行器，支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。Open WebUI官网入口网址

毫不费力地改变图像和视频中的照明，实现超逼真的效果。使用Beeble AI 的创新技术，通过逼真的灯光效果增强您的创作。Beeble AI官网入口网址

Animagine XL 3.1

一个开源的文本生成图像动漫模型，通过整合新的数据集，Animagine XL 3.1扩展了对广泛动漫作品和风格的理解，从经典作品到最新发布的动漫，覆盖了从古老到现代的各种艺术风格。Animagine XL 3.1官网入口网址

1 234 5…10