多模态学习 | 86AIGC导航

IP-Adapter是一种先进的图像生成工具，旨在通过结合图像提示与文本提示，提升预训练文本到图像扩散模型（如StableDiffusion）的表现。该技术由腾讯AI实验室的研究团队研发，旨在简……

3个月前

MiniRAG港大推出高效部署小语言模型的新型RAG系统MiniRAG是什么MiniRAG是由香港大学开发的一种创新型检索增强生成（RAG）系统，旨在资源受限的环境中高效部署小型语言模型（SLMs）……

3个月前

CogView-3-Flash智谱推出的首个免费AI图像生成模型CogView-3-Flash是什么CogView-3-Flash是智谱推出的首个免费AI图像生成模型，能够根据用户提供的文本描述生成高审美分数的图像，……

3个月前

MoE++是一种创新的混合专家（Mixture-of-Experts）框架，由昆仑万维2050研究院与北大袁粒团队共同开发。该架构通过引入零计算量专家（如零专家、复制专家和常数专家），有效降低了……

3个月前

学习了！原标题：够新！够权威！智源研究院发布2025十大AI技术趋势文章来源：机器之心内容字数：46字请提供扫码下载报告全文的内容。我没有访问外部文件或互联网的能力，无法总结您……

3个月前

FlexRAG中科院推出的高性能多模态RAG框架FlexRAG是什么FlexRAG是一种创新的检索增强生成（RAG）框架，旨在克服传统RAG系统在处理长上下文时所面临的高计算成本与生成质量不足的问题……

3个月前

支持中文。原标题：超GPT-4o，1240亿参数！最强开源多模态模型PixtralLarge！文章来源：智猩猩GenAI内容字数：4212字2024中国生成式AI大会预告及Mistral.ai新动态2024中国生成式AI……

3个月前

原标题：田渊栋：2024年年终总结文章来源：新智元内容字数：7452字田渊栋2024年AI研究总结及2025年展望本文总结了田渊栋博士2024年在人工智能领域的研究成果，并展望了2025年的发展……

4个月前

VideoVAE+香港科技大学推出的先进跨模态视频变分自编码器VideoVAE+是一款由香港科技大学团队研发的前沿跨模态视频变分自编码器。该模型通过创新的时空分离压缩技术与文本指导，成功……

4个月前

原标题：Llama2024年度要点总结文章来源：人工智能学家内容字数：7315字2024年Llama项目进展概述随着2024年的结束，Llama项目在全球范围内取得了显著的进展。该项目的成功不仅体现……

4个月前

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐