AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:语音合成
Kokoro-TTS
Kokoro-TTS轻量级文本转语音模型,支持多语言多语音风格生成Kokoro-TTS是由hexgrad开发的一款轻量级文本转语音(TTS)模型,参数高达8200万。它结合了StyleTTS2和ISTFTNet的混合架……
Emoji AI:个性化AI表情包生成器,让你的情感随时随地生动表达
EmojiAI是一款基于人工智能的表情包制作应用,专注于卡通风格,具备搜索和文本生成图像的功能,帮助用户迅速制作个性化的表情。该应用特别推出了节日主题的表情包,以满足不同文化……
ElevenLabs Flash
ElevenLabsFlashElevenLabs推出的低延迟语音合成模型ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型,专为快速响应的对话型人工智能而设计。其提供的Flashv2版本支持……
ElevenLabs Flash:创新低延迟语音合成模型提升语音交互体验
ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型,专为需要快速响应的对话型AI应用设计。该产品分为两个版本:Flashv2支持英语,而Flashv2.5则扩展至32种语言。与其他……
ElevenLabs Flash:创新低延迟语音合成模型提升语音交互体验
ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型,专为需要快速响应的对话型AI应用设计。该产品分为两个版本:Flashv2支持英语,而Flashv2.5则扩展至32种语言。与其他……
Emoji AI:个性化AI表情包生成器,让你的情感随时随地生动表达
EmojiAI是一款基于人工智能的表情包制作应用,专注于卡通风格,具备搜索和文本生成图像的功能,帮助用户迅速制作个性化的表情。该应用特别推出了节日主题的表情包,以满足不同文化……
ElevenLabs Flash
ElevenLabsFlashElevenLabs推出的低延迟语音合成模型ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型,专为快速响应的对话型人工智能而设计。其提供的Flashv2版本支持……
Slides Orator:AI驱动的虚拟解说平台实现幻灯片内容的即时生动呈现
SlidesOrator是一款先进的AI平台,通过创建虚拟形象实时展示幻灯片进行解说,旨在提升演示的吸引力与互动性。该工具利用智能技术生成语音旁白,使得演示内容能够与观众进行动态交互……
Voice-Pro:一站式音频处理解决方案集转录翻译与语音合成于一体
Voice-Pro是一款开源的全能音频处理工具,具备语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种强大功能。它支持超过100种语言,适用于教育、娱……