ai工具箱

Motionshop

AI角色动画工具，通过先进的视频处理和3D渲染技术，MotionShop能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。Motionshop官网入口网址

GPT-SoVITS

一个声音克隆和文本到语音转换的开源 Python RAG框架，只需1分钟语音即可训练一个自己的TTS模型。GPT-SoVITS官网入口网址

DiffusionGPT

字节跳动开发的由LLM驱动文本生成图像多合一系统，专门设计用于为不同的输入提示生成高质量的图像。DiffusionGPT官网入口网址

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。Lumiere官网入口网址

SupIR

基于大规模扩散的高保真通用图像恢复模型，SupIR能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。SupIR官网入口网址

StreamRAG

一个视频搜索和流媒体代理工具，能让您在 ChatGPT 中与您的视频库聊天并观看视频流。StreamRAG官网入口网址

Diffuse to Choose

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。Diffuse to Choose官网入口网址

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。WhisperFusion官网入口网址

DuckDB-NSQL

一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码。DuckDB-NSQL官网入口网址

Media2Face

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。Media2Face官网入口网址

Audio2Face

一款由AI驱动的应用程序，通过语音生成富有表现力的3D面部动画。Audio2Face官网入口网址

YOLO-World

腾讯AI实验室开发的一个实时目标检测工具，它能够自动识别和定位图像中的各种对象，YOLO-World官网入口网址

notesGPT

一个能够录下你的语音内容，然后自动帮助你把这些语音转成文字，对内容进行总结，并且生成相关的任务列表的AI笔记工具。notesGPT官网入口网址

MoneyPrinter

自动创建YouTube短视频的自动化赚钱项目，只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。MoneyPrinter官网入口网址

SoraWebui

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。SoraWebui官网入口网址

OOTDiffusion

一个高度可控的虚拟模特服装试穿开源工具，OOTDiffusion可以根据不同性别和体型自动调整服装，可控试穿参数，自然融合与逼真效果。OOTDiffusion官网入口网址

Sora.FM

一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。Sora.FM官网入口网址

APISR

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。APISR官网入口网址

Open WebUI

一个可扩展、功能丰富且用户友好的自托管 WebUI，适用于各种 LLM 运行器，支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。Open WebUI官网入口网址

Beeble AI

毫不费力地改变图像和视频中的照明，实现超逼真的效果。使用Beeble AI 的创新技术，通过逼真的灯光效果增强您的创作。Beeble AI官网入口网址

Animagine XL 3.1

一个开源的文本生成图像动漫模型，通过整合新的数据集，Animagine XL 3.1扩展了对广泛动漫作品和风格的理解，从经典作品到最新发布的动漫，覆盖了从古老到现代的各种艺术风格。Animagine XL 3.1官网入口网址

StreamMultiDiffusion

一种基于区域语义控制的实时交互生成图像方法，主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功，旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。StreamMultiDiffusion官网入口网址

迅排设计

一款漂亮且功能强大的在线海报设计器，图片编辑器，仿稿定设计，迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。迅排设计官网入口网址

MotionAgent一站式视频生成工具

MotionAgent 集成了大语言模...

小狐狸AI创作系统

小狐狸AI创作系统是一款基于T...

AIdea

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等，支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。AIdea官网入口网址

TextBase

TextBase 是一款简单的框架，用于构建 AI 聊天机器人，它可以帮助开发人员快速搭建和优化聊天机器人。TextBase官网入口网址

EasyPhoto

EasyPhoto是一个用于生成AI肖像的Webui UI插件，可以用来训练与你相关的数字化替身。EasyPhoto官网入口网址

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。Whisper语音识别模型官网入口网址

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。AI Companion App官网入口网址

1 234 5 6

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐

ai工具箱