GLM-PC是一款由智谱科技研发的先进通用Agent,基于CogAgent视觉多模态模型,旨在模拟人类操作计算机,实现“无人驾驶”PC的技术创新。它能够自主执行多种任务,包括安排会议、处理文档和搜索网页等,并支持远程与定时操作。GLM-PC通过模拟人眼的视觉、脑部的思考及手部的执行,展现出跨平台的强大能力,无需依赖HTML或API,具备更高的能力上限。目前,该产品正处于内测阶段,致力于提升工具的使用能力并探索自我学习的潜力。
GLM-PC是什么
GLM-PC是智谱科技推出的一款通用Agent,基于CogAgent视觉多模态模型,旨在模拟人类如何使用计算机,从而实现“无人驾驶”的技术探索。它不仅可以执行如会议安排、文档处理和网页搜索总结等任务,还能远程和定时操作。GLM-PC通过模拟人眼的视觉、脑部的思维和手部的操作来进行计算机使用,具备跨平台能力,且不依赖于HTML或API,拥有更高的能力上限。该产品目前正在内测中,旨在提升工具的使用效率并探索自我学习的可能性。
GLM-PC的主要功能
- 会议助手:协助用户安排和参与会议,并提供会议总结。
- 文档处理:支持文档的下载、发送以及内容的理解和总结。
- 网页搜索与总结:在特定平台(如微信公众号、知乎、小红书等)上搜索关键词,并完成信息的阅读和总结。
- 远程与定时操作:用户可以通过手机远程发送指令,让GLM-PC自主完成电脑操作,或在未来特定时间点执行任务。
- 隐形工作模式:在用户工作时,GLM-PC可以在不占用屏幕的情况下自主完成工作,释放用户的屏幕使用权。
产品官网
希望体验GLM-PC的用户可以访问其官方网站进行申请,内测申请地址为「邀请体验」,需填写问卷以申请内测。
如何使用GLM-PC
- 安装与设置:
- 用户授权:首次使用时需要授权GLM-PC访问部分电脑功能,以便其执行任务。
- 输入指令:打开GLM-PC应用后,在对话框中输入操作指令,例如“查询B站热门内容”或“预定腾讯会议并发送邀请”。
- 执行任务:GLM-PC会评估指令并制定操作计划,自动执行相应任务,例如打开浏览器进行搜索或打开日历应用安排会议。
- 确认敏感操作:在遇到敏感的操作时,GLM-PC会暂停并等待用户确认,用户需点击控制条上的继续按钮以继续任务。
- 远程操作:如果需要通过手机远程控制电脑,请在GLM-PC设置中开启“挂起模式”,并发送远程指令。
GLM-PC的应用场景
- 信息处理:适用于微信、飞书、钉钉等平台,与联系人或群聊发送信息。
- 会议安排:支持腾讯会议、飞书会议等,安排会议日程并发送邀请;可定时加入指定会议。
- 文档处理:支持文档的下载、发送及内容的理解与总结。
- 网页内容处理:打开浏览器,在百度、公众号、知乎、小红书等平台进行关键词搜索,完成阅读、总结或翻译。
- 电子商务:能够在淘宝上购买特定尺码的商品并完成交易流程。
暂无评论...