AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:情感分析
Emoji AI
EmojiAIAI表情包生成应用,根据文本描述创建个性化表情EmojiAI是什么EmojiAI是一款基于人工智能的表情包制作应用,专注于卡通风格,提供便捷的搜索和文本生成图片功能,帮助用户迅……
Liner:智能推荐与信息管理的全能助手
Liner是一款为学生和研究者量身打造的人工智能搜索引擎,旨在提升研究效率。它提供可靠的信息来源、自动引用生成、事实核查以及信息筛选功能,帮助用户快速而准确地获取所需信息。L……
Agent-S
Agent-S是什么Agent-S是一款前沿的智能代理框架,旨在通过图形用户界面(GUI)实现人机交互的高度自动化。该系统模拟人类的操作方式,通过鼠标和键盘直接与计算机进行互动,能够高……
Illuminate
Illuminate是谷歌推出的一款创新项目,旨在将学术论文转化为人工智能生成的音频讨论。借助谷歌先进的语言模型Gemini,该项目能够将学术内容转变为引人入胜的对话,使用户能够在、驾……
SPIKY.AI:智能销售助手实时分析通话数据助力策略优化
SPIKY.AI是一款为销售团队量身定制的实时AI助理,通过分析销售通话、客户互动和培训会议等,提供实时洞察,指导销售代表遵循销售手册,自动更新CRM,以提升销售业绩,特别适合远程……
EMMA-X:具身多模态动作模型推动人机交互的革新与应用
EMMA-X是一款由新加坡科技设计大学开发的具身多模态动作模型,拥有70亿参数,旨在提升机器人在复杂环境中的任务执行能力。该模型基于有根据的链式思维(CoT)推理数据,对OpenVLA进……
Apollo:Meta与斯坦福大学携手推出创多模态模型,实现图像与本的深度融合与理解
Apollo是Meta与斯坦福大合推出的一款大型多模态模型(LMMs),专注于提升视频理解能力。该项目通过系统研究揭示了视频理解在LMMs中的关键驱动因素,提出了“ScalingConsistency”现象……
Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署
LargeActionModels(LAMs)是微软推出的一款前沿开发框架,旨在创造能够在现实世界中执行复杂任务的智能系统。相比于传统的大型语言模型(LLMs),LAMs不仅具备本生成的能力,更能……
Lyra:提升多模态交互体验的SmartMore创解决方案
Lyra是一款由香港中大学、SmartMore和香港科技大合开发的高效多模态大型语言模型(MLLM),旨在增语音、视觉和本之间的交互能力。该模型利用开源的大型模型、多模态LoRA模块和潜在……
Veo 2:高分辨率4K视频生成的先进AI模型,助力创意无限
Veo2是GoogleDeepMind最推出的一款AI视频生成模型,能够根据本或图像提示创作出高质量的视频内容。它支持高达4K分辨率的输出,能够理解镜头控制指令,并可以模拟现实中的物理现象及……