RL RanceLee Tutorials
← Volver a tutoriales

Open Minis: Un agente de bolsillo gratuito 24/7

Últimamente he estado llamando a DeepSeek el rey de la relación costo-beneficio. Hoy lo usé para jugar con Hermes (otro agente) y ejecuté 260 millones de tokens, lo que me costó menos de $3—menos de 20 yuanes—prácticamente gratis. Y es muy rápido. Antes, usar Codex a menudo significaba esperar mucho tiempo, tanto que podía trabajar en otros videos mientras tanto. V4 Flash incluso me da la sensación de que inunda la pantalla, generando resultados rápidamente.

Por supuesto, en términos de capacidad, Codex 5.5 es definitivamente más fuerte. Pero para este tipo de herramienta de agente, las capacidades de V4 Flash son más que suficientes: rápido, bueno y rentable.

Sin embargo, durante el uso descubrí un problema: soy un poco exigente con esto. Por un lado, quiero que se conecte a mi dispositivo principal para que pueda aprovechar más capacidades; si lo instalas en un VPS, no puede acceder a tus fotos locales ni a tu Obsidian local. Por otro lado, si lo instalo en mi propia Mac, no quiero tenerlo funcionando 24/7—aunque las Mac están diseñadas para funcionar 7×24.

Finalmente, por recomendación de imzhichen (el creador detrás de la cuenta pública de WeChat “Corazón de Jugador”) en el grupo, descubrí un agente gratuito que puede seguirte 24/7: Open Minis.

Lo bueno es que se ejecuta en tu iPhone—siempre llevas tu teléfono contigo, nunca se apaga y puede acceder a tus fotos, Obsidian, etc. ¡Es el contenedor de agente perfecto!

Mejor aún, es software gratuito; tu único gasto es el costo de tokens de DeepSeek.

Instalación y configuración

Puedes instalarlo directamente desde la App Store.

Después de descargarlo, abre la aplicación. Tiene una guía simple de 1, 2, 3 pasos.

Primero, toca “Añadir un proveedor”, luego selecciona la primera opción “OpenAI / API compatible”, luego toca “API Key” en la parte superior. Cambia el nombre de la etiqueta a “DeepSeek”, ingresa tu clave API en el campo API Key (si no estás seguro, consulta la guía para obtener una clave API de DeepSeek). Para la dirección API personalizada, selecciona “https://api.deepseek.com”, y recuerda desactivar “Añadir automáticamente” debajo. Una vez que todo esté completo, desplázate hasta el fondo y toca “Añadir proveedor de IA”. Eso es el paso uno.

Segundo, toca “Seleccionar modelos”, elige el primero, V4 Flash, luego toca Siguiente.

Tercero, puedes tocar “Iniciar una conversación” para comenzar a chatear. Puedes hacerle preguntas directamente, por ejemplo, para ver qué capacidades tiene. A continuación se muestra la respuesta que obtuve cuando le pregunté “¿Qué capacidades del iPhone tienes?”

Aquí hay una lista compilada de las capacidades nativas de iOS integradas en Open Minis:

Categoría Herramienta Capacidad
Visión y Voz apple-vision Reconocimiento de texto OCR / código QR / código de barras
Visión y Voz apple-speech Voz a texto (grabación de micrófono / archivos de audio)
Visión y Voz apple-speak Texto a voz (TTS, soporte multilingüe)
Aplicaciones y Sistema apple-open Abrir URLs, aplicaciones, páginas de configuración del sistema
Aplicaciones y Sistema apple-device Información del dispositivo (modelo, sistema, batería, etc.)
Aplicaciones y Sistema apple-clipboard Leer/escribir portapapeles
Aplicaciones y Sistema apple-notification Enviar notificaciones locales
Aplicaciones y Sistema apple-alarm Configurar alarmas y temporizadores
Datos y Salud apple-healthkit Consultar y escribir datos de salud (pasos, frecuencia cardíaca, etc.)
Datos y Salud apple-photos Gestión de biblioteca de fotos (importar, exportar, buscar)
Datos y Salud apple-calendar Calendario y recordatorios (consultar, crear)
Datos y Salud apple-reminders Gestión de recordatorios
Datos y Salud apple-media Búsqueda en biblioteca multimedia y control de reproducción
Datos y Salud apple-player Reproductor de audio/video nativo (reproducir, pausar, etc.)
Ubicación, Mapas y Clima apple-location Obtener ubicación actual, geocodificación inversa/directa
Ubicación, Mapas y Clima apple-maps Buscar lugares, rutas de navegación, tiempo estimado de llegada
Ubicación, Mapas y Clima apple-weather Clima actual, pronóstico por hora/día, alertas meteorológicas
Conectividad y Hardware apple-bluetooth Bluetooth de baja energía (escanear, conectar, leer/escribir)
Conectividad y Hardware apple-nfc Lectura/escritura de etiquetas NFC, lectura de tarjetas bancarias
Conectividad y Hardware apple-homekit Controlar dispositivos domésticos inteligentes (luces, aire acondicionado, etc.)
Lenguaje Natural apple-nlp Detección de idioma, tokenización, etiquetado de partes del discurso, reconocimiento de entidades nombradas

Todos estos son frameworks nativos de iOS (Vision, Speech, NaturalLanguage, HealthKit, HomeKit, MapKit, WeatherKit, AVFoundation, etc.), que se ejecutan completamente en local sin necesidad de conexión a internet.

Reconocimiento de imágenes

Open Minis puede aprovechar las capacidades de OCR del iPhone, lo que significa que puede reconocer texto en tus imágenes. Así que puedes darle tus recibos de compras, hacer que extraiga el contenido y luego escribirlo en tu libro de contabilidad.

Estadísticas de salud

Puedes preguntarle directamente sobre tu actividad física diaria.

Manipular directamente Obsidian

Recuerda que mencioné que puede reconocer imágenes. Después del reconocimiento, podemos hacer que escriba directamente en nuestro Obsidian. Pero primero necesitamos cargar nuestro Obsidian, de lo contrario no sabrá dónde está Obsidian ni tendrá permiso. Específicamente, debes tocar “Montar carpeta externa” en la configuración. Consulta las imágenes para los pasos exactos. Después de eso, puedes volver a la conversación y hacer que procese y manipule tu carpeta de Obsidian.

Poner Open Minis en tu iPhone, combinado con la API barata de DeepSeek, significa que tienes un asistente de IA 24/7 por muy poco dinero—uno que puede reconocer imágenes, verificar datos de salud y manipular directamente Obsidian. Para un principiante que no programa, esta combinación es probablemente la solución de “agente personal” con la barrera de entrada más baja disponible.