Cómo Usar AutoGLM de Forma Gratuita: Una Guía Completa del Agente de IA Móvil de Código Abierto
Cómo Usar AutoGLM de Forma Gratuita: Una Guía Completa del Agente de IA Móvil de Código Abierto
Zhipu AI lanzó silenciosamente algo notable: AutoGLM, su marco de agente de IA móvil completamente de código abierto. Con este lanzamiento, cualquiera puede ahora construir un sistema de IA que puede ver la pantalla del teléfono, entender lo que está sucediendo y controlar el dispositivo usando instrucciones en lenguaje natural—completamente gratis.
En otras palabras, puedes escribir un comando simple como:
“Abre YouTube y busca tutoriales de IA.”
Y tu teléfono Android realizará la tarea por sí mismo.
Esta guía te llevará a través de cómo usar AutoGLM desde cero, sin necesidad de claves API pagadas ni suscripciones en la nube. Todo se ejecuta localmente bajo tu control.
Repositorio Oficial de GitHub:
https://github.com/zai-org/Open-AutoGLM
1. ¿Qué es AutoGLM?
AutoGLM es un sistema de agente de IA móvil de código abierto construido sobre modelos de lenguaje grande multimodal. En lugar de depender de frágiles scripts de automatización, permite que una IA:
- Entienda visualmente lo que se muestra en la pantalla del teléfono
- Decida qué acción debe tomarse a continuación
- Toque, deslice y escriba automáticamente
- Ejecute tareas completas de múltiples pasos de forma autónoma
En términos simples, AutoGLM convierte tu smartphone en un dispositivo verdaderamente operado por IA, no solo en una interfaz de chatbot.
Dado que admite despliegue local, también obtienes:
- Sin costos recurrentes de API
- Sin dependencia forzada de la nube
- Sin carga automática de datos
Tienes el control total de tu dispositivo y de tu sistema de IA.
2. Lo Que Necesitas para Usar AutoGLM de Forma Gratuita
Para comenzar, solo necesitas:
- Una computadora con Windows, macOS o Linux
- Un teléfono Android que ejecute Android 7.0 o posterior
- Un cable USB o conexión Wi-Fi para ADB
- Python 3.10 o más reciente
- Experiencia básica en línea de comandos
Se recomienda una GPU dedicada para un rendimiento fluido del modelo, pero las configuraciones solo con CPU aún pueden funcionar para pruebas y aprendizaje.
3. Paso 1: Instalar Python
Si Python no está instalado aún, descárgalo desde:
Después de la instalación, verifica:
python --versionPaso 2: Instalar ADB (Android Debug Bridge)
ADB permite que tu computadora emita comandos directamente a tu teléfono.
Descárgalo desde el sitio web oficial de Google:
https://developer.android.com/tools/releases/platform-tools
Después de la instalación, verifica:
adb version5. Paso 3: Habilitar el Modo de Desarrollador en Tu Teléfono
En tu dispositivo Android:
Abre Configuración
Ve a Acerca del Teléfono
Toca Número de Compilación varias veces hasta que se habilite el Modo de Desarrollador
Habilita la Depuración USB
Conecta tu teléfono y verifica:
adb devicesSi tu dispositivo aparece, la conexión es exitosa.
6. Paso 4: Instalar ADB Keyboard (Para Escritura Automática)
AutoGLM requiere un método de entrada especial para simular la escritura.
Descarga el APK de ADB Keyboard desde el repositorio de AutoGLM
Instálalo en tu teléfono
Actívalo en la Configuración del Método de Entrada
Esto permite que la IA escriba automáticamente dentro de cualquier aplicación.
7. Paso 5: Instalar AutoGLM
Clona el repositorio:
git clone https://github.com/zai-org/Open-AutoGLM.git
cd Open-AutoGLMInstala las dependencias:
pip install -r requirements.txt
pip install -e .8. Paso 6: Descargar y Ejecutar el Modelo de AutoGLM
AutoGLM actualmente ofrece dos modelos oficiales:
AutoGLM-Phone-9B (optimizado para chino)
AutoGLM-Phone-9B-Multilingual (recomendado para usuarios globales)
Puedes desplegar el modelo localmente usando vLLM:
python3 -m vllm.entrypoints.openai.api_server \
--served-model-name autoglm-phone-9b \
--model zai-org/AutoGLM-Phone-9B \
--port 8000Una vez en funcionamiento, tu API de IA local estará disponible en:
http://localhost:8000/v1En este punto, ya tienes un motor de IA local completamente funcional para el control móvil.
Si planeas ejecutar AutoGLM continuamente (por ejemplo, automatización móvil 24/7 o control remoto de dispositivos), alojar tu servicio de modelo en un VPS ligero en la nube puede ser muy conveniente. Muchos desarrolladores utilizan plataformas de VPS facturadas por hora como LightNode para este propósito, ya que puedes escalar o apagar instantáneamente sin compromisos de costos a largo plazo.
9. Paso 7: Controla Tu Teléfono con Lenguaje Natural
Modo Interactivo
python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b"Luego escribe un comando como:
Abre Chrome y busca OpenAITu teléfono realizará la acción automáticamente.
Modo de Comando de Una Línea
python main.py --base-url http://localhost:8000/v1 "Abre TikTok y desplaza videos"Modo API de Python
from phone_agent import PhoneAgent
from phone_agent.model import ModelConfig
model_config = ModelConfig(
base_url="http://localhost:8000/v1",
model_name="autoglm-phone-9b",
)
agent = PhoneAgent(model_config=model_config)
agent.run("Abre Amazon y busca auriculares inalámbricos")Este modo es ideal para desarrolladores que desean integrar AutoGLM en sistemas de automatización más grandes.
10. Control Inalámbrico del Teléfono Sin USB
También puedes controlar tu teléfono de forma inalámbrica:
adb connect 192.168.1.88:5555Una vez conectado, puedes ejecutar AutoGLM sin ningún cable físico. Esta configuración se utiliza comúnmente para:
Pruebas de dispositivos remotos
Automatización de teléfonos basada en la nube
Granjas de IA móvil de múltiples dispositivos
En implementaciones del mundo real, muchos usuarios colocan tanto el servicio del modelo como los scripts de control en servidores en la nube. Para entornos de prueba a corto plazo, los servicios de VPS que admiten facturación por hora (como LightNode) son a menudo elegidos para evitar el desperdicio de recursos.
11. Aplicaciones Soportadas
AutoGLM ya admite docenas de aplicaciones principales, incluyendo:
Mensajería: WhatsApp, WeChat, Telegram
Comercio electrónico: Amazon, eBay, AliExpress
Navegación y Servicios: Google Maps, aplicaciones de entrega de comida
Medios: YouTube, TikTok, plataformas de streaming
Consulta la lista completa de soportadas:
python main.py --list-apps12. Casos de Uso en el Mundo Real
AutoGLM es adecuado para muchos escenarios prácticos, tales como:
Navegación de contenido automatizada
Monitoreo de precios de productos
Pruebas de flujo de trabajo de aplicaciones
Soporte de accesibilidad para usuarios mayores y discapacitados
Investigación de IA móvil
Automatización de teléfonos a gran escala
Convierte efectivamente los smartphones de herramientas manuales en dispositivos operables por IA.
Preguntas Frecuentes (FAQ)
¿Es AutoGLM completamente gratuito para usar?
Sí. AutoGLM es completamente de código abierto y no requiere APIs pagadas ni suscripciones para el despliegue local.
¿Necesito una GPU para ejecutar AutoGLM?
Se recomienda una GPU para un mejor rendimiento, pero las configuraciones solo con CPU aún pueden funcionar para pruebas básicas.
¿AutoGLM es compatible con iPhone?
No. AutoGLM depende de ADB, que solo funciona con dispositivos Android.
¿Se suben los datos de mi teléfono a la nube?
No. Todo el reconocimiento y razonamiento ocurre localmente a menos que te conectes manualmente a una API externa.
¿Se puede usar AutoGLM en proyectos comerciales?
Sí, el uso comercial está permitido bajo la licencia de código abierto. Sin embargo, el control automatizado de aplicaciones de terceros debe cumplir con las reglas de la plataforma y las regulaciones locales.