Как использовать AutoGLM бесплатно: Полное руководство по открытому мобильному ИИ-агенту
Как использовать AutoGLM бесплатно: Полное руководство по открытому мобильному ИИ-агенту
Zhipu AI тихо выпустила нечто замечательное: AutoGLM, их полностью открытая мобильная ИИ-агентская платформа. С этим релизом любой теперь может создать ИИ-систему, которая может видеть экран телефона, понимать, что происходит, и управлять устройством с помощью инструкций на естественном языке — совершенно бесплатно.
Другими словами, вы можете ввести простую команду, такую как:
“Откройте YouTube и найдите учебные пособия по ИИ.”
И ваш Android телефон действительно выполнит задачу самостоятельно.
Этот гид проведет вас через то, как использовать AutoGLM с нуля, без необходимости в платных API-ключах и подписках на облачные сервисы. Все работает локально под вашим контролем.
Официальный репозиторий на GitHub:
https://github.com/zai-org/Open-AutoGLM
1. Что такое AutoGLM?
AutoGLM — это система мобильного ИИ-агента с открытым исходным кодом, построенная на основе многомодальных больших языковых моделей. Вместо того чтобы полагаться на хрупкие автоматизационные скрипты, она позволяет ИИ:
- Визуально понимать, что отображается на экране телефона
- Решать, какое действие следует предпринять дальше
- Автоматически нажимать, проводить и вводить текст
- Выполнять полные многошаговые задачи автономно
Проще говоря, AutoGLM превращает ваш смартфон в действительно управляемое ИИ устройство, а не просто интерфейс чат-бота.
Поскольку он поддерживает локальное развертывание, вы также получаете:
- Отсутствие повторяющихся затрат на API
- Отсутствие принудительной зависимости от облака
- Отсутствие автоматической загрузки данных
Вы полностью контролируете свое устройство и свою ИИ-систему.
2. Что вам нужно для использования AutoGLM бесплатно
Чтобы начать, вам нужно только:
- Компьютер с Windows, macOS или Linux
- Android телефон с версией Android 7.0 или новее
- USB-кабель или Wi-Fi соединение для ADB
- Python 3.10 или новее
- Базовые навыки работы с командной строкой
Рекомендуется выделенная GPU для плавной работы модели, но конфигурации только с CPU также могут работать для тестирования и обучения.
3. Шаг 1: Установите Python
Если Python еще не установлен, скачайте его с:
После установки проверьте его:
python --versionШаг 2: Установите ADB (Android Debug Bridge)
ADB позволяет вашему компьютеру отправлять команды непосредственно на ваш телефон.
Скачайте его с официального сайта Google:
https://developer.android.com/tools/releases/platform-tools
После установки проверьте:
adb version5. Шаг 3: Включите режим разработчика на вашем телефоне
На вашем Android устройстве:
Откройте Настройки
Перейдите в раздел "О телефоне"
Несколько раз нажмите на номер сборки, пока не будет включен режим разработчика
Включите отладку по USB
Подключите телефон и проверьте:
adb devicesЕсли ваше устройство отображается, соединение успешно.
6. Шаг 4: Установите ADB Keyboard (для автоматического ввода)
AutoGLM требует специального метода ввода для имитации набора текста.
Скачайте APK ADB Keyboard из репозитория AutoGLM
Установите его на ваш телефон
Активируйте его в настройках метода ввода
Это позволяет ИИ автоматически вводить текст в любом приложении.
7. Шаг 5: Установите AutoGLM
Клонируйте репозиторий:
git clone https://github.com/zai-org/Open-AutoGLM.git
cd Open-AutoGLMУстановите зависимости:
pip install -r requirements.txt
pip install -e .8. Шаг 6: Скачайте и запустите модель AutoGLM
На данный момент AutoGLM предлагает две официальные модели:
AutoGLM-Phone-9B (оптимизирована для китайского)
AutoGLM-Phone-9B-Multilingual (рекомендуется для глобальных пользователей)
Вы можете развернуть модель локально с помощью vLLM:
python3 -m vllm.entrypoints.openai.api_server \
--served-model-name autoglm-phone-9b \
--model zai-org/AutoGLM-Phone-9B \
--port 8000После запуска ваш локальный ИИ API будет доступен по адресу:
http://localhost:8000/v1На этом этапе у вас уже есть полностью функциональный локальный ИИ-движок для мобильного управления.
Если вы планируете запускать AutoGLM непрерывно (например, 24/7 для мобильной автоматизации или удаленного управления устройством), размещение вашего модельного сервиса на легком облачном VPS может быть очень удобным. Многие разработчики используют платформы VPS с почасовой оплатой, такие как LightNode для этой цели, так как вы можете мгновенно масштабировать или отключать без долгосрочных обязательств по затратам.
9. Шаг 7: Управляйте своим телефоном с помощью естественного языка
Интерактивный режим
python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b"Затем введите команду, такую как:
Откройте Chrome и найдите OpenAIВаш телефон автоматически выполнит действие.
Режим однострочной команды
python main.py --base-url http://localhost:8000/v1 "Откройте TikTok и прокрутите видео"Режим Python API
from phone_agent import PhoneAgent
from phone_agent.model import ModelConfig
model_config = ModelConfig(
base_url="http://localhost:8000/v1",
model_name="autoglm-phone-9b",
)
agent = PhoneAgent(model_config=model_config)
agent.run("Откройте Amazon и найдите беспроводные наушники")Этот режим идеально подходит для разработчиков, которые хотят интегрировать AutoGLM в более крупные автоматизационные системы.
10. Беспроводное управление телефоном без USB
Вы также можете управлять своим телефоном по беспроводной сети:
adb connect 192.168.1.88:5555После подключения вы можете запускать AutoGLM без физического кабеля. Эта настройка обычно используется для:
Удаленного тестирования устройств
Облачной автоматизации телефонов
Мобильных ИИ-ферм с несколькими устройствами
В реальных развертываниях многие пользователи размещают как модельный сервис, так и управляющие скрипты на облачных серверах. Для краткосрочных тестовых сред часто выбираются VPS-сервисы, которые поддерживают почасовую оплату (такие как LightNode), чтобы избежать расточительства ресурсов.
11. Поддерживаемые приложения
AutoGLM уже поддерживает десятки популярных приложений, включая:
Мессенджеры: WhatsApp, WeChat, Telegram
Электронная коммерция: Amazon, eBay, AliExpress
Навигация и услуги: Google Maps, приложения для доставки еды
Медиа: YouTube, TikTok, стриминговые платформы
Просмотрите полный список поддерживаемых приложений:
python main.py --list-apps12. Практические сценарии использования
AutoGLM подходит для многих практических сценариев, таких как:
Автоматизированный просмотр контента
Мониторинг цен на продукты
Тестирование рабочих процессов приложений
Поддержка доступности для пожилых и людей с ограниченными возможностями
Исследования в области мобильного ИИ
Масштабная автоматизация телефонов
Он эффективно превращает смартфоны из ручных инструментов в управляемые ИИ устройства.
Часто задаваемые вопросы (FAQ)
AutoGLM полностью бесплатен для использования?
Да. AutoGLM полностью с открытым исходным кодом и не требует никаких платных API или подписок для локального развертывания.
Нужен ли мне GPU для запуска AutoGLM?
GPU рекомендуется для лучшей производительности, но конфигурации только с CPU также могут работать для базового тестирования.
Поддерживает ли AutoGLM iPhone?
Нет. AutoGLM зависит от ADB, который работает только с устройствами Android.
Загружаются ли данные моего телефона в облако?
Нет. Все распознавание и рассуждения происходят локально, если вы не подключаетесь вручную к внешнему API.
Можно ли использовать AutoGLM в коммерческих проектах?
Да, коммерческое использование разрешено в рамках лицензии с открытым исходным кодом. Однако автоматизированное управление сторонними приложениями должно соответствовать правилам платформы и местным нормативным актам.