RL RanceLee Tutorials
← Retour aux tutoriels

Open Minis : Un agent de poche gratuit 24h/24

Ces derniers temps, j’appelle DeepSeek le roi du rapport qualité-prix. Aujourd’hui, je l’ai utilisé pour jouer avec Hermes (un autre Agent) et j’ai consommé 260 millions de tokens pour moins de 3 $ – moins de 20 yuans – pratiquement gratuit. Et c’est très rapide. Avant, avec Codex, il fallait souvent attendre longtemps, assez longtemps pour que je puisse travailler sur d’autres vidéos entre-temps. V4 Flash me donne même l’impression de noyer l’écran, déversant les résultats à toute vitesse.

Bien sûr, en termes de capacités, Codex 5.5 est nettement plus fort. Mais pour ce genre d’outil Agent, les capacités de V4 Flash sont largement suffisantes – rapide, bon et économique.

Cependant, en l’utilisant, j’ai découvert un problème : je suis un peu exigeant sur ce point. D’un côté, je veux qu’il soit connecté à mon appareil principal pour pouvoir exploiter davantage de capacités ; si vous l’installez sur un VPS, il ne peut pas accéder à vos photos locales ni à votre Obsidian local. De l’autre côté, si je l’installe sur mon Mac, je ne veux pas le laisser tourner 24h/24 et 7j/7 – même si les Mac sont conçus pour fonctionner en continu.

Finalement, sur la recommandation d’imzhichen (le créateur derrière le compte public WeChat « Cœur de Joueur ») dans le groupe, j’ai découvert un Agent gratuit qui peut vous suivre 24h/24 : Open Minis.

Ce qui est génial, c’est qu’il tourne sur votre iPhone – vous avez toujours votre téléphone sur vous, il ne s’éteint jamais, et il peut accéder à vos photos, Obsidian, etc. C’est le conteneur Agent parfait !

Encore mieux, c’est un logiciel gratuit ; votre seule dépense est le coût des tokens pour DeepSeek.

Installation et configuration

Vous pouvez l’installer directement depuis l’App Store.

Après téléchargement, ouvrez l’application. Elle propose un guide simple en 1, 2, 3 étapes.

D’abord, appuyez sur « Ajouter un fournisseur », puis sélectionnez la première option « OpenAI / API compatible », puis appuyez sur « Clé API » en haut. Changez le nom du libellé en « DeepSeek », saisissez votre clé API dans le champ Clé API (si vous n’êtes pas sûr, reportez-vous au guide pour obtenir une clé API DeepSeek). Pour l’adresse API personnalisée, sélectionnez « https://api.deepseek.com », et n’oubliez pas de désactiver « Ajout automatique » en dessous. Une fois tout rempli, faites défiler vers le bas et appuyez sur « Ajouter un fournisseur d’IA ». Voilà, première étape terminée.

Deuxièmement, appuyez sur « Sélectionner les modèles », choisissez le premier, V4 Flash, puis appuyez sur Suivant.

Troisièmement, vous pouvez appuyer sur « Démarrer une conversation » pour commencer à discuter. Vous pouvez lui poser des questions directement, par exemple pour voir de quelles capacités il dispose. Voici la réponse que j’ai obtenue en lui demandant « Quelles capacités iPhone as-tu ? »

Voici une liste compilée des capacités natives iOS intégrées à Open Minis :

Catégorie Outil Capacité
Vision & Parole apple-vision Reconnaissance de texte OCR / QR code / code-barres
Vision & Parole apple-speech Reconnaissance vocale (enregistrement microphone / fichiers audio)
Vision & Parole apple-speak Synthèse vocale (TTS, multilingue)
Applications & Système apple-open Ouvrir des URLs, applications, pages de paramètres système
Applications & Système apple-device Informations sur l’appareil (modèle, système, batterie, etc.)
Applications & Système apple-clipboard Lire/écrire le presse-papiers
Applications & Système apple-notification Envoyer des notifications locales
Applications & Système apple-alarm Régler des alarmes et des minuteries
Données & Santé apple-healthkit Interroger et écrire des données de santé (pas, fréquence cardiaque, etc.)
Données & Santé apple-photos Gestion de la photothèque (importer, exporter, rechercher)
Données & Santé apple-calendar Calendrier et rappels (interroger, créer)
Données & Santé apple-reminders Gestion des rappels
Données & Santé apple-media Recherche dans la médiathèque et contrôle de la lecture
Données & Santé apple-player Lecteur audio/vidéo natif (lire, pause, etc.)
Localisation, Cartes & Météo apple-location Obtenir la position actuelle, géocodage inverse/direct
Localisation, Cartes & Météo apple-maps Rechercher des lieux, itinéraires, heure d’arrivée estimée
Localisation, Cartes & Météo apple-weather Météo actuelle, prévisions horaires/journalières, alertes météo
Connectivité & Matériel apple-bluetooth Bluetooth Low Energy (scanner, connecter, lire/écrire)
Connectivité & Matériel apple-nfc Lecture/écriture de tags NFC, lecture de cartes bancaires
Connectivité & Matériel apple-homekit Contrôler les appareils domotiques (lumières, climatisation, etc.)
Langage naturel apple-nlp Détection de langue, tokenisation, étiquetage morphosyntaxique, reconnaissance d’entités nommées

Tous ces éléments sont des frameworks natifs iOS (Vision, Speech, NaturalLanguage, HealthKit, HomeKit, MapKit, WeatherKit, AVFoundation, etc.), fonctionnant entièrement localement sans nécessiter de connexion Internet.

Reconnaissance d’images

Open Minis peut exploiter les capacités OCR de l’iPhone, ce qui signifie qu’il peut reconnaître le texte dans vos images. Vous pouvez donc lui donner vos tickets de caisse, lui faire extraire le contenu, puis l’écrire dans votre livre de comptes.

Statistiques de santé

Vous pouvez lui demander directement votre activité physique quotidienne.

Manipuler directement Obsidian

Vous vous souvenez que j’ai mentionné qu’il peut reconnaître les images ? Après reconnaissance, nous pouvons lui demander d’écrire directement dans notre Obsidian. Mais d’abord, nous devons charger notre Obsidian, sinon il ne saura pas où se trouve Obsidian et n’aura pas la permission. Concrètement, vous devez appuyer sur « Monter un dossier externe » dans les paramètres. Voir les images pour les étapes exactes. Ensuite, vous pouvez revenir à la conversation et lui faire traiter et manipuler votre dossier Obsidian.

Mettre Open Minis sur votre iPhone, associé à l’API bon marché de DeepSeek, vous donne un assistant IA 24h/24 pour très peu d’argent – un assistant capable de reconnaître les images, de vérifier les données de santé et de manipuler directement Obsidian. Pour un débutant qui ne code pas, cette combinaison est probablement la solution « Agent personnel » la plus accessible qui soit.