AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:实时字幕生成
RealtimeSTT
RealtimeSTTAI实时语音转文本库,自动检测说话的开始与结束RealtimeSTT是什么RealtimeSTT是一款开源的实时语音转文本库,专为低延迟应用场景而设计。它具备强大的语音活动检测功能……
VideoRefer
VideoRefer浙大联合阿里达摩学院推出的视频对象感知与推理技术VideoRefer是由浙江大学与阿里达摩学院联合研发的一款前沿工具,专注于视频中对象的感知与推理。借助增强型视频大型语……
VidTok
VidTok微软开源的视频分词器,支持连续和离散分词化VidTok是什么VidTok(视频分词器)是微软推出的开源视频处理工具,旨在通过高效的算法将视频内容转化为一系列精简的“视频词”。该……
VidTok
VidTok微软开源的视频分词器,支持连续和离散分词化VidTok是什么VidTok(视频分词器)是微软推出的开源视频处理工具,旨在通过高效的算法将视频内容转化为一系列精简的“视频词”。该……