AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:语音识别
audiobot:多语言AI语音合成平台,支持西班牙语及14种本地口音
audiobot是一款基于AI技术的文本转语音平台,用户可以轻松将文本转换为多种语言和口音的自然且专业的声音,并以MP3格式下载。该平台不仅支持西班牙语及其14个国家的地方口音,还提……
DRT-o1
DRT-o1腾讯研究院推出的文学翻译系列AI模型DRT-o1是什么DRT-o1是由腾讯研究院开发的一系列人工智能模型,利用长链思考推理(CoT)技术显著提高了文学翻译的质量。该模型在处理比喻……
OmniAudio-2.6B
OmniAudio-2.6BNexaAI推出的端侧多模态音频语言模型OmniAudio-2.6B是NexaAI推出的一款创新音频语言模型,专为边缘部署而设计,旨在实现快速且高效的音频文本处理。该模型拥有2.6亿……
Freed
FreedAI医疗助手,自动转写医生与患者对话内容生成结构化病历Freed是什么Freed是一款AI驱动的医疗文档助手,采用前沿的语音识别与自然语言处理技术,能够自动捕捉并转录医生与患者……
Wavy:智能图像处理应用,轻松实现图像增强与艺术风格转换
Wavy是一款基于人工智能技术的照片编辑应用,能够将用户的普通照片转变为具有艺术感的杰作。它受到了全球用户的广泛喜爱,因其便捷和创新的功能而备受推崇。Wavy的核心功能包括AI艺……
AI Chinese:与中国老师实时互动,轻松掌握中文技巧与文化精髓
AIChinese是什么AIChinese是由嗨你好教育推出的一款基于人工智能技术的双语中文学习平台,专为外国学习者设计。该平台模拟中国教师的在线授课,利用TikTok平台上的短视频和直播方式……
小库AI云
小库AI云是一个专为建筑行业打造的人工智能应用平台,旨在通过灵感生成、模型训练及社区共享等功能,全面提升设计师的创作效率和创新能力。该平台基于自主研发的AI建筑大模型,提供……
Klap:智能视频编辑工具,实现精彩片段自动识别与智能布局优化
Klap是一个先进的AI驱动视频编辑工具,旨在快速将长视频转换为适合社交媒体平台的短视频内容。它通过智能分析视频场景,自动裁剪和调整视频布局,生成符合不同平台需求的竖屏视频。……
Genesis:开源生成式物理引擎助力创新模拟与实时交互体验
产品名称:Genesis核心观点:Genesis是由卡内基梅隆大学、马里兰大学、斯坦福大学和麻省理工学院等知名研究机构联合开发的开源生成式物理引擎,旨在以简单的语言快速生成精确的物理……
Apollo:Meta与斯坦福大学携手推出创新多模态模型,实现图像与文本的深度融合与理解
Apollo是Meta与斯坦福大合推出的一款大型多模态模型(LMMs),专注于提升视频理解能力。该项目通过系统研究揭示了视频理解在LMMs中的关键驱动因素,提出了“ScalingConsistency”现象……