AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:多模态学习
IP-Adapter
IP-Adapter是一种先进的图像生成工具,旨在通过结合图像提示与文本提示,提升预训练文本到图像扩散模型(如StableDiffusion)的表现。该技术由腾讯AI实验室的研究团队研发,旨在简……
MiniRAG
MiniRAG港大推出高效部署小语言模型的新型RAG系统MiniRAG是什么MiniRAG是由香港大学开发的一种创新型检索增强生成(RAG)系统,旨在资源受限的环境中高效部署小型语言模型(SLMs)……
CogView-3-Flash
CogView-3-Flash智谱推出的首个免费AI图像生成模型CogView-3-Flash是什么CogView-3-Flash是智谱推出的首个免费AI图像生成模型,能够根据用户提供的文本描述生成高审美分数的图像,……
MoE++
MoE++是一种创新的混合专家(Mixture-of-Experts)框架,由昆仑万维2050研究院与北大袁粒团队共同开发。该架构通过引入零计算量专家(如零专家、复制专家和常数专家),有效降低了……
够新!够权威!智源研究院发布2025十大AI技术趋势
学习了!原标题:够新!够权威!智源研究院发布2025十大AI技术趋势文章来源:机器之心内容字数:46字请提供扫码下载报告全文的内容。我没有访问外部文件或互联网的能力,无法总结您……
FlexRAG
FlexRAG中科院推出的高性能多模态RAG框架FlexRAG是什么FlexRAG是一种创新的检索增强生成(RAG)框架,旨在克服传统RAG系统在处理长上下文时所面临的高计算成本与生成质量不足的问题……
超越想象的未来:揭秘1240亿参数的Pixtral Large多模态模型!
支持中文。原标题:超GPT-4o,1240亿参数!最强开源多模态模型PixtralLarge!文章来源:智猩猩GenAI内容字数:4212字2024中国生成式AI大会预告及Mistral.ai新动态2024中国生成式AI……
田渊栋:2024年年终总结
原标题:田渊栋:2024年年终总结文章来源:新智元内容字数:7452字田渊栋2024年AI研究总结及2025年展望本文总结了田渊栋博士2024年在人工智能领域的研究成果,并展望了2025年的发展……
VideoVAE+
VideoVAE+香港科技大学推出的先进跨模态视频变分自编码器VideoVAE+是一款由香港科技大学团队研发的前沿跨模态视频变分自编码器。该模型通过创新的时空分离压缩技术与文本指导,成功……
揭开未来之门:Llama2024年度亮点全解析
原标题:Llama2024年度要点总结文章来源:人工智能学家内容字数:7315字2024年Llama项目进展概述随着2024年的结束,Llama项目在全球范围内取得了显著的进展。该项目的成功不仅体现……