全球首个会操作手机的AI智能体模型开源
北京日报客户端 | 记者 孙奇茹

2025-12-09 17:07 语音播报

经济

12月9日,智谱宣布开源其核心AI Agent(智能体)模型AutoGLM。此次开源意味着硬件厂商、手机厂商和开发者均可基于该模型能力,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。

2024年10月,中国计算机大会(CNCC)上,智谱首次公开AutoGLM相关内容,成为全球业界首个具备“手机操作”(Phone Use)能力的AI Agent。‌目前,AutoGLM已能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程,支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。

让AI操控手机,如何能让AI“不乱来”?智谱团队介绍,技术人员选择了把AutoGLM放进一台虚拟手机里,用户通过AutoGLM能力让AI所进行的操作行为是发生在云端的虚拟手机上,与用户的物理手机实现了隔离。此外,该智能体模型还采取了不收集用户名或密码,支付、内容发布等关键动作需用户确认,以及支付、发布等高风险步骤默认不自动执行等机制。

“每一个动作都可以回放、审计、干预。除了云手机的选择,我们也主动放弃了操作微信等这些离用户隐私较近的APP。”智谱方面表示,通过开源和私有化部署,企业和开发者可以在自己的合规环境中完整掌控数据、日志和权限,希望通过“开源”这一动作,使得“会用手机的AI能力”不止掌握在极少数厂商手中,而是变成整个行业可以共同拥有、共同打磨的公共底座,从而实现“技术向整个生态开放,让数据与隐私永远留在使用方这一侧”的目标。

业内人士分析,AutoGLM的此次开源将大幅降低AI手机的技术门槛,推动AI手机生态从封闭走向开放共创。


编辑:孙奇茹

打开APP阅读全文
APP内打开