音频处理 | 86AIGC导航

OmniAudio-2.6BNexaAI推出的端侧多模态音频语言模型OmniAudio-2.6B是NexaAI推出的一款创新音频语言模型，专为边缘部署而设计，旨在实现快速且高效的音频文本处理。该模型拥有2.6亿……

3个月前

EchoMimicV2是一款由蚂蚁集团开发的先进半身数字人动画生成工具。它基于参考图片、音频剪辑和手部姿势序列，能够高效生成高质量的动画视频，确保音频内容与动画之间的完美契合。相……

3个月前

OmniAudio-2.6BNexaAI推出的端侧多模态音频语言模型OmniAudio-2.6B是NexaAI推出的一款创新音频语言模型，专为边缘部署而设计，旨在实现快速且高效的音频文本处理。该模型拥有2.6亿……

3个月前

琴乐大模型是一款由腾讯AILab与腾讯TME天琴实验室共同打造的先进人工智能音乐创作系统。该模型允许用户通过输入中英文关键词、描述性语句或音频，直接生成高质量的立体声音频和多轨……

4个月前

MMAudio是一项创新的音频合成技术，专注于将视频内容转化为音频，通过多模态联合训练，使模型能够在多种视听和文本数据集上进行高效学习。其核心组件是同步模块，确保生成的音频与……

4个月前

MMAudio是一项创新的音频合成技术，专注于将视频内容转化为音频，通过多模态联合训练，使模型能够在多种视听和文本数据集上进行高效学习。其核心组件是同步模块，确保生成的音频与……

4个月前

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐