语音识别 | 第 3 页

audiobot是一款基于AI技术的文本转语音平台，用户可以轻松将文本转换为多种语言和口音的自然且专业的声音，并以MP3格式下载。该平台不仅支持西班牙语及其14个国家的地方口音，还提……

3个月前

DRT-o1腾讯研究院推出的文学翻译系列AI模型DRT-o1是什么DRT-o1是由腾讯研究院开发的一系列人工智能模型，利用长链思考推理（CoT）技术显著提高了文学翻译的质量。该模型在处理比喻……

4个月前

OmniAudio-2.6BNexaAI推出的端侧多模态音频语言模型OmniAudio-2.6B是NexaAI推出的一款创新音频语言模型，专为边缘部署而设计，旨在实现快速且高效的音频文本处理。该模型拥有2.6亿……

4个月前

FreedAI医疗助手，自动转写医生与患者对话内容生成结构化病历Freed是什么Freed是一款AI驱动的医疗文档助手，采用前沿的语音识别与自然语言处理技术，能够自动捕捉并转录医生与患者……

4个月前

Wavy是一款基于人工智能技术的照片编辑应用，能够将用户的普通照片转变为具有艺术感的杰作。它受到了全球用户的广泛喜爱，因其便捷和创新的功能而备受推崇。Wavy的核心功能包括AI艺……

4个月前

AIChinese是什么AIChinese是由嗨你好教育推出的一款基于人工智能技术的双语中文学习平台，专为外国学习者设计。该平台模拟中国教师的在线授课，利用TikTok平台上的短视频和直播方式……

4个月前

小库AI云是一个专为建筑行业打造的人工智能应用平台，旨在通过灵感生成、模型训练及社区共享等功能，全面提升设计师的创作效率和创新能力。该平台基于自主研发的AI建筑大模型，提供……

4个月前

Klap是一个先进的AI驱动视频编辑工具，旨在快速将长视频转换为适合社交媒体平台的短视频内容。它通过智能分析视频场景，自动裁剪和调整视频布局，生成符合不同平台需求的竖屏视频。……

4个月前

产品名称：Genesis核心观点：Genesis是由卡内基梅隆大学、马里兰大学、斯坦福大学和麻省理工学院等知名研究机构联合开发的开源生成式物理引擎，旨在以简单的语言快速生成精确的物理……

4个月前

Apollo是Meta与斯坦福大合推出的一款大型多模态模型（LMMs），专注于提升视频理解能力。该项目通过系统研究揭示了视频理解在LMMs中的关键驱动因素，提出了“ScalingConsistency”现象……

4个月前

1 234 5 6

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐