智谱开源可操控手机的智能体模型:AI手机只在一家做是不够的[尬笑] 12月9日

轩叔观察 2025-12-09 21:20:41

智谱开源可操控手机的智能体模型:AI手机只在一家做是不够的[尬笑] 12月9日国内人工智能公司智谱AI宣布,正式开源其核心的AI智能体模型——AutoGLM。这一举措意味着,开发者和相关厂商可以免费获取并使用这项技术,尝试开发能够实际操作手机完成任务的智能助手。 与以往侧重于对话的大模型不同,AutoGLM的目标是实现对手机的直接操作。它经过专门训练,能够解析手机屏幕上的图文信息,并通过模拟点击、输入、滑动等触控操作,自动执行一系列连续的任务。 当用户提出“预订一张明天飞往上海的最便宜机票”的指令后,该模型可以自行打开旅行类应用,完成搜索、比价乃至下单的整个流程。目前,该模型已能支持微信、淘宝、抖音等超过50款常用应用的核心功能。 当AI获得操作手机的权限时,安全与隐私自然成为关注焦点。智谱AI采用了“云手机”的技术方案。AutoGLM的所有操作都在云端的一台虚拟手机环境中进行,与用户手中的真实设备完全隔离,这有助于保护用户的个人数据和账号信息。 系统还设置了安全机制,在进行支付等敏感操作前会请求用户二次确认,并且所有的操作步骤均可被记录和审计。 智谱AI选择将此项核心技术开源,主要目的是为了推动行业生态的共建。公司方面认为,如果“会使用手机”这项关键能力仅由少数大型平台掌握,可能会限制整个行业的创新活力。 通过开源AutoGLM,智谱希望将其打造为一个公共的技术基础,降低手机厂商和广大开发者研发相关功能的门槛,共同构建一个更开放的AI应用生态。 本次开源的内容较为全面,包括了训练好的核心模型、赋予AI手机操作能力的框架与工具链,以及可供体验的演示案例等。这一动作被外界视为可能加速AI在手机端落地的重要一步。 随着AI更深地融入日常生活,如何在享受自动化便利的同时,妥善地管理隐私与安全,将成为一项持久的议题。 这个模型最核心的能力,是能让AI“看懂”手机屏幕,并像真人一样通过点击、滑动来操作手机应用,完成诸如点外卖、订机票等一系列复杂任务。 网友评论: 这相当于把曾经可能被大公司垄断的“高阶技能”下放,让广大开发者和中小厂商也能低成本地打造属于自己的“AI手机助手”。 这就像是给行业“打了样”,有望推动AI手机生态从封闭走向开放共创。 模型在理解复杂指令和执行长链条任务时还不够稳定,在规划旅行路线时,可能无法准确关联景点和交通信息。对于AI在涉及支付等敏感操作时的准确性和安全性也存在顾虑。 AutoGLM这类技术未来可以集成到智能眼镜、手表甚至汽车里,实现真正的“能动口就不动手”。在开车时,只需说一句话,AI就能帮你完成订咖啡、规划路线等一系列操作,让汽车从一个单纯的交通工具变身成懂你需求的智能伙伴。 它的价值不仅在于技术本身,更在于其通过开放降低行业门槛,激发集体创新的策略。当前技术确实存在需要优化的空间,其大规模应用也必然伴随着对隐私安全和使用体验的持续考验。 这件事也预示着一个趋势:AI正从一个主要进行对话和问答的“参谋”,向着能实际动手操作的“执行官”角色演进。这不仅仅是技术的进步,更可能深刻改变我们与数字世界交互的方式。 那么,对于这样一个能帮你操作手机APP的AI助手,你最期待它帮你完成什么具体任务呢?欢迎在评论区分享你的真实想法和期待! 信息来源:界面新闻

0 阅读:0
轩叔观察

轩叔观察

感谢大家的关注