如何免費使用 AutoGLM:完整的開源移動 AI 代理指南
如何免費使用 AutoGLM:完整的開源移動 AI 代理指南
Zhipu AI 靜靜地發布了一個了不起的產品:AutoGLM,他們的完全開源移動 AI 代理框架。隨著這一發布,任何人現在都可以構建一個 AI 系統,能夠看見手機螢幕,理解正在發生的事情,並使用自然語言指令控制設備——完全免費。
換句話說,你可以輸入一個簡單的命令,例如:
“打開 YouTube 並搜索 AI 教程。”
而你的 Android 手機將實際上自行執行這個任務。
本指南將引導你從零開始使用 AutoGLM,不需要付費的 API 金鑰或雲訂閱。所有操作都在你的控制之下本地運行。
官方 GitHub 倉庫:
https://github.com/zai-org/Open-AutoGLM
1. 什麼是 AutoGLM?
AutoGLM 是一個基於多模態大型語言模型的開源移動 AI 代理系統。它不再依賴脆弱的自動化腳本,而是允許 AI:
- 直觀理解手機螢幕上顯示的內容
- 決定下一步應採取的行動
- 自動點擊、滑動和輸入
- 自主執行完整的多步任務
簡單來說,AutoGLM 將你的智能手機變成一個真正的 AI 操作設備,而不僅僅是一個聊天機器人界面。
由於它支持本地部署,你還可以享受:
- 無需重複的 API 成本
- 無需強制的雲依賴
- 無自動數據上傳
你完全掌控你的設備和 AI 系統。
2. 使用 AutoGLM 免費所需的條件
要開始使用,你只需要:
- 一台運行 Windows、macOS 或 Linux 的電腦
- 一部運行 Android 7.0 或更高版本的 Android 手機
- 一條 USB 數據線或 Wi-Fi 連接以進行 ADB
- Python 3.10 或更新版本
- 基本的命令行經驗
建議使用專用 GPU 以獲得流暢的模型性能,但僅使用 CPU 的設置仍然可以用於測試和學習。
3. 步驟 1:安裝 Python
如果尚未安裝 Python,請從以下網址下載:
安裝後,驗證安裝:
python --version步驟 2:安裝 ADB(Android 調試橋)
ADB 允許你的電腦直接向手機發出命令。
從 Google 的官方網站下載:
https://developer.android.com/tools/releases/platform-tools
安裝後,驗證:
adb version5. 步驟 3:在手機上啟用開發者模式
在你的 Android 設備上:
打開設置
進入關於手機
多次點擊版本號,直到啟用開發者模式
啟用 USB 調試
連接你的手機並驗證:
adb devices如果你的設備出現,則連接成功。
6. 步驟 4:安裝 ADB 鍵盤(用於自動輸入)
AutoGLM 需要一種特殊的輸入法來模擬輸入。
從 AutoGLM 倉庫下載 ADB 鍵盤 APK
在你的手機上安裝
在輸入法設置中啟用它
這樣可以讓 AI 在任何應用程序中自動輸入。
7. 步驟 5:安裝 AutoGLM
克隆倉庫:
git clone https://github.com/zai-org/Open-AutoGLM.git
cd Open-AutoGLM安裝依賴:
pip install -r requirements.txt
pip install -e .8. 步驟 6:下載並運行 AutoGLM 模型
AutoGLM 目前提供兩個官方模型:
AutoGLM-Phone-9B(針對中文優化)
AutoGLM-Phone-9B-Multilingual(建議全球用戶使用)
你可以使用 vLLM 在本地部署模型:
python3 -m vllm.entrypoints.openai.api_server \
--served-model-name autoglm-phone-9b \
--model zai-org/AutoGLM-Phone-9B \
--port 8000運行後,你的本地 AI API 將可用於:
http://localhost:8000/v1此時,你已經擁有一個完全功能的本地 AI 引擎,用於移動控制。
如果你計劃持續運行 AutoGLM(例如,24/7 移動自動化或遠程設備控制),在輕量級雲 VPS 上托管你的模型服務將非常方便。許多開發者使用按小時計費的 VPS 平台,例如 LightNode,因為你可以隨時擴展或關閉,而無需長期的成本承諾。
9. 步驟 7:使用自然語言控制你的手機
互動模式
python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b"然後輸入命令,例如:
打開 Chrome 並搜索 OpenAI你的手機將自動執行該操作。
單行命令模式
python main.py --base-url http://localhost:8000/v1 "打開 TikTok 並滾動視頻"Python API 模式
from phone_agent import PhoneAgent
from phone_agent.model import ModelConfig
model_config = ModelConfig(
base_url="http://localhost:8000/v1",
model_name="autoglm-phone-9b",
)
agent = PhoneAgent(model_config=model_config)
agent.run("打開亞馬遜並搜索無線耳機")此模式非常適合希望將 AutoGLM 集成到更大自動化系統中的開發者。
10. 無需 USB 的無線手機控制
你也可以無線控制你的手機:
adb connect 192.168.1.88:5555一旦連接,你可以在沒有任何實體電纜的情況下運行 AutoGLM。這種設置通常用於:
遠程設備測試
基於雲的手機自動化
多設備移動 AI 農場
在實際部署中,許多用戶將模型服務和控制腳本放在雲伺服器上。對於短期測試環境,通常選擇支持按小時計費的 VPS 服務(例如 LightNode),以避免資源浪費。
11. 支持的應用程序
AutoGLM 已經支持數十種主流應用程序,包括:
訊息:WhatsApp、微信、Telegram
電子商務:亞馬遜、eBay、AliExpress
導航與服務:Google 地圖、外送應用
媒體:YouTube、TikTok、串流平台
查看完整支持列表:
python main.py --list-apps12. 實際使用案例
AutoGLM 適用於許多實際場景,例如:
自動化內容瀏覽
產品價格監控
應用工作流程測試
為老年人和殘障人士提供無障礙支持
移動 AI 研究
大規模手機自動化
它有效地將智能手機從手動工具轉變為 AI 可操作的設備。
常見問題 (FAQ)
AutoGLM 完全免費使用嗎?
是的。AutoGLM 是完全開源的,並且不需要任何付費 API 或本地部署的訂閱。
我需要 GPU 來運行 AutoGLM 嗎?
建議使用 GPU 以獲得更好的性能,但僅使用 CPU 的設置仍然可以用於基本測試。
AutoGLM 支持 iPhone 嗎?
不支持。AutoGLM 依賴於 ADB,僅適用於 Android 設備。
我的手機數據會上傳到雲端嗎?
不會。所有識別和推理都在本地進行,除非你手動連接到外部 API。
AutoGLM 可以用於商業項目嗎?
可以,根據開源許可證允許商業使用。然而,自動控制第三方應用必須遵守平台規則和當地法規。