GLM-PC:智谱CogAgent驱动的智能视觉助手,赋能创新与效率提升

GLM-PC是一款由智谱科技研发的先进通用Agent,基于CogAgent视觉多模态模型,旨在模拟人类操作计算机,实现“无人驾驶”PC的技术创新。它能够自主执行多种任务,包括安排会议、处理文档和搜索网页等,并支持远程与定时操作。GLM-PC通过模拟人眼的视觉、脑部的思考及手部的执行,展现出跨平台的强大能力,无需依赖HTML或API,具备更高的能力上限。目前,该产品正处于内测阶段,致力于提升工具的使用能力并探索自我学习的潜力。

GLM-PC是什么

GLM-PC是智谱科技推出的一款通用Agent,基于CogAgent视觉多模态模型,旨在模拟人类如何使用计算机,从而实现“无人驾驶”的技术探索。它不仅可以执行如会议安排、文档处理和网页搜索总结等任务,还能远程和定时操作。GLM-PC通过模拟人眼的视觉、脑部的思维和手部的操作来进行计算机使用,具备跨平台能力,且不依赖于HTML或API,拥有更高的能力上限。该产品目前正在内测中,旨在提升工具的使用效率并探索自我学习的可能性。

GLM-PC:智谱CogAgent驱动的智能视觉助手,赋能创新与效率提升

GLM-PC的主要功能

  • 会议助手:协助用户安排和参与会议,并提供会议总结。
  • 文档处理:支持文档的下载、发送以及内容的理解和总结。
  • 网页搜索与总结:在特定平台(如微信公众号、知乎、小红书等)上搜索关键词,并完成信息的阅读和总结。
  • 远程与定时操作:用户可以通过手机远程发送指令,让GLM-PC自主完成电脑操作,或在未来特定时间点执行任务。
  • 隐形工作模式:在用户工作时,GLM-PC可以在不占用屏幕的情况下自主完成工作,释放用户的屏幕使用权。

产品官网

希望体验GLM-PC的用户可以访问其官方网站进行申请,内测申请地址为「邀请体验」,需填写问卷以申请内测。

如何使用GLM-PC

  • 安装与设置
    • 确保您的电脑为搭载M系列芯片的Mac设备,推荐使用M1或M3系列。
    • 访问GLM-PC的官方网站下载安装包。
    • 按照网站指示完成下载和安装。
  • 用户授权:首次使用时需要授权GLM-PC访问部分电脑功能,以便其执行任务。
  • 输入指令:打开GLM-PC应用后,在对话框中输入操作指令,例如“查询B站热门内容”或“预定腾讯会议并发送邀请”。
  • 执行任务:GLM-PC会评估指令并制定操作计划,自动执行相应任务,例如打开浏览器进行搜索或打开日历应用安排会议。
  • 确认敏感操作:在遇到敏感的操作时,GLM-PC会暂停并等待用户确认,用户需点击控制条上的继续按钮以继续任务。
  • 远程操作:如果需要通过手机远程控制电脑,请在GLM-PC设置中开启“挂起模式”,并发送远程指令。

GLM-PC的应用场景

  • 信息处理:适用于微信、飞书、钉钉等平台,与联系人或群聊发送信息。
  • 会议安排:支持腾讯会议、飞书会议等,安排会议日程并发送邀请;可定时加入指定会议。
  • 文档处理:支持文档的下载、发送及内容的理解与总结。
  • 网页内容处理:打开浏览器,在百度、公众号、知乎、小红书等平台进行关键词搜索,完成阅读、总结或翻译。
  • 电子商务:能够在淘宝上购买特定尺码的商品并完成交易流程。
版权声明:atcat 发表于 2024-12-05 20:19:20。
转载请注明:GLM-PC:智谱CogAgent驱动的智能视觉助手,赋能创新与效率提升 | 86AIGC导航

暂无评论

暂无评论...