如何将Agent部署在Android上

Xiao Qiang Lv4

背景

随着AI在日常生活中愈发的深度绑定,人们已经不满足于只能用文字和AI交流和发起任务。同时手机📱也是人们最为密切的生产工具之一。随着LLM的飞速发展,各个手机厂商也将LLM融入了各家的手机智能助手,但是很尴尬的是,智能助手并没有我们想的那么智能,智能助手只能调用手机内部的api,比如说我现在使用的mate 60,“小艺、小艺,你帮我发条短信给妈妈”这是没有问题的,但如果我想说“小艺、小艺,你帮我发一条微信给妈妈”,这时智能助手就只能提示你,“我不能操作其他app,不能获取其他app的权限”。通过以上的场景,我们能够发现智能助手其实还是没有那么智能,并不能只是动动嘴就可以让手机来自动执行我们想要的一些操作。这个时候能够操作手机的agent就诞生了,同时也是受到豆包手机的影响,看见了一个开源框架 Open-AutoGLM,通过文字输入的方式来控制手机的操作,可以暂且把这一系列的操作可以成为mobile agent。本文主要通过文字的方式来表达用户的需求,从而通过 Open-AutoGLM接受并转换成对应的手机命令操作手机。

什么Open-AutoGLM?

Open-AutoGLM 是一个开源的 AI 手机智能助理框架,由中国 AI 公司智谱 AI(Zhipu AI,也叫 Z.ai)在 2025 年 12 月 8 日左右发布的。它基于他们的 AutoGLM 模型系列(一个能“自主操作”图形界面的 AI 基础模型),专为 Android 手机设计,让 AI 像真人一样“玩手机”——看屏幕、点按钮、滑动、输入文字,全自动帮你完成任务。

通俗解释,就像聊天一样:

想象一下,你的手机是个调皮的孩子,你懒得一步步教它怎么操作(比如打开 App、搜索东西、下单买东西),你直接用大白话说一句“帮我打开美团,搜附近的火锅店下单”,AI 就自己看懂屏幕、想好步骤、动手操作,一气呵成,不用你再碰手机。它不是简单聊天机器人,而是带“眼睛”和“手”的超级助手,能处理多步复杂任务,比如订外卖、买机票、刷社交 App。
归根到底来说,还是一个agent类型的框架,在我们之前接触的agent类型的框架只是在电脑上调用其他的api而获取agent强大的能力,这个最大的两点就是将调用api换成了通过adb【Android debug bridge】像安卓手机发送对应的操作指令来操作手机。👇🏻的图片是Open-AutoGLM的执行过程。其实大体看起来和普通的agent运行过程没有很大的区别。

Demo

环境准备

  • python环境
  • 大模型本地部署环境 Vllm,没有话需要先安装 pip install vllm
  • 克隆代码库,git clone git@github.com:zai-org/Open-AutoGLM.git
  • 按照官网readme的指导,就可以一步一步的完成环境的配置
    这里要注意的是,如果要使用官网的启动命令来启动VLLM,可能会遇到大模型下载失败的问题。这里可以采取一个折中的办法在ms【ModelScope】中将模型先单独下载好,然后直接使用VLLM运行能够加速很多,当我们能够看到以下的截图的时候,代表模型已经在本地运行起来了。这时候可以运行python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b"之后就可以看到以下结果,然后再Open-AutoGLM的运行控制台中就可以看到接口请求成功的日志。至此,手机能够连上,大模型已经跑起来·

总结

当前项目确实有很多的可玩性,相当于提供了VLM与手机操作的一个底层框架,我相信在未来肯定还是会有很多的项目能够基于此爆发的,刚发布就获得了4k的star数,我敢说这又是一个爆款项目。但是目前这个开源项目还是有一些的局限性。因为采用了VLM,对于GPU的要求就很高了。我目前是无法在我本地mac mini M4+16G memory的机器上平稳运行,一旦运行本地机器CPU就会超负荷运转autoglm-phone-9b模型的参数过多,后续可能会有小型量化的模型推出,直接可以在手机上运行。同时该框架暂时只能支持Android上的运行,对于IOS的支持度并不是很高【可能是因为IOS的协议比较严格】

  • Title: 如何将Agent部署在Android上
  • Author: Xiao Qiang
  • Created at : 2025-12-10 17:31:29
  • Updated at : 2025-12-10 17:31:29
  • Link: http://fdslk.github.io/tech/ai/LLM/agent/2025/12/10/mobile-agent-Open-AutoGLM/
  • License: This work is licensed under CC BY-NC-SA 4.0.
Comments