语音合成 | 86AIGC导航

Kokoro-TTS轻量级文本转语音模型，支持多语言多语音风格生成Kokoro-TTS是由hexgrad开发的一款轻量级文本转语音（TTS）模型，参数高达8200万。它结合了StyleTTS2和ISTFTNet的混合架……

2个月前

EmojiAI是一款基于人工智能的表情包制作应用，专注于卡通风格，具备搜索和文本生成图像的功能，帮助用户迅速制作个性化的表情。该应用特别推出了节日主题的表情包，以满足不同文化……

3个月前

ElevenLabsFlashElevenLabs推出的低延迟语音合成模型ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型，专为快速响应的对话型人工智能而设计。其提供的Flashv2版本支持……

3个月前

ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型，专为需要快速响应的对话型AI应用设计。该产品分为两个版本：Flashv2支持英语，而Flashv2.5则扩展至32种语言。与其他……

3个月前

ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型，专为需要快速响应的对话型AI应用设计。该产品分为两个版本：Flashv2支持英语，而Flashv2.5则扩展至32种语言。与其他……

3个月前

EmojiAI是一款基于人工智能的表情包制作应用，专注于卡通风格，具备搜索和文本生成图像的功能，帮助用户迅速制作个性化的表情。该应用特别推出了节日主题的表情包，以满足不同文化……

3个月前

ElevenLabsFlashElevenLabs推出的低延迟语音合成模型ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型，专为快速响应的对话型人工智能而设计。其提供的Flashv2版本支持……

3个月前

SlidesOrator是一款先进的AI平台，通过创建虚拟形象实时展示幻灯片进行解说，旨在提升演示的吸引力与互动性。该工具利用智能技术生成语音旁白，使得演示内容能够与观众进行动态交互……

4个月前

Voice-Pro是一款开源的全能音频处理工具，具备语音转文字（STT）、文本转语音（TTS）、实时翻译、YouTube视频下载和人声分离等多种强大功能。它支持超过100种语言，适用于教育、娱……

4个月前

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐