AI项目和框架 | 第 15 页

GLM-Edge是一系列优化的大语言对话模型及多模态理解模型，专为端侧部署而设计。该系列包含多款模型：GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B。其中，……

1周前

MultiFoley是一款由AdobeResearch和密歇根大学联合开发的音效生成系统，能够通过多模态的文本、音频和视频输入，生成高质量的Foley声音效果。该系统允许用户根据文本提示、参考音频……

1周前

MyTimeMachine（MyTM）是一种创新的个性化面部年龄转换技术，能够根据约50张个人照片，模拟20至40年的年龄变化。该技术通过训练一个适配器网络，结合预训练的全局老化模型，生成高……

1周前

AnchorCrafter是一款基于扩散模型的智能视频制作系统，专为自动生成高保真度的主播风格产品推广视频而设计。该系统通过整合人-物交互（HOI）与姿态引导的人体视频生成技术，能够高……

1周前

Co-opTranslator是微软推出的一款开源翻译工具，旨在通过AzureAI服务实现自动化的多语言翻译，支持项目文档和图像中的文本。用户只需输入一条命令，Co-opTranslator便能分析项目内……

1周前

360Zhinao2-7B是360公司自主研发的一款AI大模型，是360智脑7B参数的升级版本，涵盖了基础模型及多种上下文长度的聊天模型。此模型作为360Zhinao1-7B的重要后续更新，采用了全新的多……

1周前

MVGenMaster是一款由复旦大学、阿里巴巴达摩院和湖潘实验室共同开发的多视图扩散模型，专注于利用增强的3D先验技术来处理多样化的新视角合成（NVS）任务。该模型能够从单一图像出发……

1周前

HiFiVFS（高保真视频换脸）是腾讯与VIVO公司联合推出的一款先进的视频换脸框架。其基于StableVideoDiffusion（稳定视频扩散，简称SVD）框架，利用多帧输入和时间注意力机制来确保生……

1周前

Infinity-MM是智源研究院推出的一个规模庞大的多模态指令数据集，拥有4300万条样本，总数据量达到10TB。经过严格的质量筛选与去重，Infinity-MM保证了数据的高质量与多样性，这为提……

1周前

1…13 1415

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐