如何免费使用 AutoGLM:完整的开源移动 AI 代理指南
如何免费使用 AutoGLM:完整的开源移动 AI 代理指南
智谱 AI 静悄悄地发布了一项了不起的产品:AutoGLM,他们的完全开源移动 AI 代理框架。通过这一发布,任何人现在都可以构建一个 AI 系统,能够看到手机屏幕,理解正在发生的事情,并使用自然语言指令控制设备——完全免费。
换句话说,你可以输入一个简单的命令,比如:
“打开 YouTube 并搜索 AI 教程。”
你的 Android 手机将会自动执行这个任务。
本指南将带你了解如何从零开始使用 AutoGLM,无需付费 API 密钥和云订阅。所有操作都在你的控制之下本地运行。
官方 GitHub 仓库:
https://github.com/zai-org/Open-AutoGLM
1. 什么是 AutoGLM?
AutoGLM 是一个基于多模态大语言模型构建的开源移动 AI 代理系统。它不依赖脆弱的自动化脚本,而是允许 AI:
- 视觉上理解手机屏幕上显示的内容
- 决定下一步应该采取的行动
- 自动点击、滑动和输入
- 自主执行完整的多步骤任务
简单来说,AutoGLM 将你的智能手机变成一个真正的 AI 操作设备,而不仅仅是一个聊天机器人界面。
由于它支持本地部署,你还可以享受:
- 无需重复的 API 成本
- 无需强制的云依赖
- 无需自动数据上传
你完全控制你的设备和你的 AI 系统。
2. 使用 AutoGLM 免费所需的条件
要开始,你只需要:
- 一台运行 Windows、macOS 或 Linux 的计算机
- 一部运行 Android 7.0 或更高版本的 Android 手机
- 一根 USB 数据线或 Wi-Fi 连接用于 ADB
- Python 3.10 或更新版本
- 基本的命令行经验
建议使用专用 GPU 以获得流畅的模型性能,但仅使用 CPU 的设置仍然可以用于测试和学习。
3. 第一步:安装 Python
如果尚未安装 Python,请从以下网址下载:
安装后,验证安装:
python --version第二步:安装 ADB(Android 调试桥)
ADB 允许你的计算机直接向手机发出命令。
从 Google 的官方网站下载:
https://developer.android.com/tools/releases/platform-tools
安装后,验证:
adb version第三步:在手机上启用开发者模式
在你的 Android 设备上:
打开设置
进入关于手机
多次点击版本号,直到启用开发者模式
启用 USB 调试
连接你的手机并验证:
adb devices如果你的设备出现,连接成功。
第四步:安装 ADB 键盘(用于自动输入)
AutoGLM 需要一种特殊的输入法来模拟输入。
从 AutoGLM 仓库下载 ADB 键盘 APK
在手机上安装
在输入法设置中激活它
这使得 AI 能够在任何应用程序中自动输入。
第五步:安装 AutoGLM
克隆仓库:
git clone https://github.com/zai-org/Open-AutoGLM.git
cd Open-AutoGLM安装依赖:
pip install -r requirements.txt
pip install -e .第六步:下载并运行 AutoGLM 模型
AutoGLM 目前提供两个官方模型:
AutoGLM-Phone-9B(针对中文优化)
AutoGLM-Phone-9B-Multilingual(推荐给全球用户)
你可以使用 vLLM 在本地部署模型:
python3 -m vllm.entrypoints.openai.api_server \
--served-model-name autoglm-phone-9b \
--model zai-org/AutoGLM-Phone-9B \
--port 8000一旦运行,你的本地 AI API 将可在以下地址访问:
http://localhost:8000/v1此时,你已经拥有一个完全功能的本地 AI 引擎用于移动控制。
如果你计划持续运行 AutoGLM(例如,24/7 移动自动化或远程设备控制),将你的模型服务托管在轻量级云 VPS 上会非常方便。许多开发者使用按小时计费的 VPS 平台,如 LightNode,因为你可以即时扩展或关闭,而无需长期成本承诺。
第七步:使用自然语言控制你的手机
交互模式
python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b"然后输入一个命令,例如:
打开 Chrome 并搜索 OpenAI你的手机将自动执行该操作。
单行命令模式
python main.py --base-url http://localhost:8000/v1 "打开 TikTok 并滚动视频"Python API 模式
from phone_agent import PhoneAgent
from phone_agent.model import ModelConfig
model_config = ModelConfig(
base_url="http://localhost:8000/v1",
model_name="autoglm-phone-9b",
)
agent = PhoneAgent(model_config=model_config)
agent.run("打开亚马逊并搜索无线耳机")此模式非常适合希望将 AutoGLM 集成到更大自动化系统中的开发者。
第八步:无线手机控制,无需 USB
你还可以通过无线方式控制手机:
adb connect 192.168.1.88:5555连接后,你可以在没有任何物理电缆的情况下运行 AutoGLM。此设置通常用于:
远程设备测试
基于云的手机自动化
多设备移动 AI 农场
在实际部署中,许多用户将模型服务和控制脚本放在云服务器上。对于短期测试环境,通常选择支持按小时计费的 VPS 服务(如 LightNode),以避免资源浪费。
支持的应用程序
AutoGLM 已经支持数十种主流应用程序,包括:
消息:WhatsApp、微信、Telegram
电子商务:亚马逊、eBay、AliExpress
导航与服务:Google Maps、外卖应用
媒体:YouTube、TikTok、流媒体平台
查看完整支持列表:
python main.py --list-apps现实世界的使用案例
AutoGLM 适用于许多实际场景,例如:
自动化内容浏览
产品价格监控
应用工作流测试
为老年人和残疾用户提供无障碍支持
移动 AI 研究
大规模手机自动化
它有效地将智能手机从手动工具转变为 AI 可操作的设备。
常见问题解答(FAQ)
AutoGLM 完全免费使用吗?
是的。AutoGLM 完全开源,不需要任何付费 API 或本地部署的订阅。
我需要 GPU 来运行 AutoGLM 吗?
建议使用 GPU 以获得更好的性能,但仅使用 CPU 的设置仍然可以用于基本测试。
AutoGLM 支持 iPhone 吗?
不支持。AutoGLM 依赖于 ADB,而 ADB 仅适用于 Android 设备。
我的手机数据会上传到云端吗?
不会。所有识别和推理都在本地进行,除非你手动连接到外部 API。
AutoGLM 可以用于商业项目吗?
可以,商业使用在开源许可证下是允许的。然而,自动控制第三方应用程序必须遵守平台规则和当地法规。