RL RanceLee Tutorials
← Zurück zu Tutorials

Open Minis: Ein kostenloser 24-Stunden-Taschenagent

Ich nenne DeepSeek in letzter Zeit den König des Preis-Leistungs-Verhältnisses. Heute habe ich es benutzt, um mit Hermes (einem anderen Agenten) zu spielen und 260 Millionen Tokens verbraucht, was mich weniger als 3 Dollar gekostet hat – weniger als 20 Yuan – praktisch kostenlos. Und es ist sehr schnell. Früher bedeutete die Verwendung von Codex oft langes Warten, so lange, dass ich zwischendurch an anderen Videos arbeiten konnte. V4 Flash gibt mir sogar das Gefühl, dass es den Bildschirm überflutet und schnell Ergebnisse ausspuckt.

Natürlich ist Codex 5.5 von den Fähigkeiten her definitiv stärker. Aber für diese Art von Agent-Tool sind die Fähigkeiten von V4 Flash mehr als ausreichend – schnell, gut und kosteneffizient.

Allerdings ist mir während der Nutzung ein Problem aufgefallen: Ich bin da etwas eigen. Einerseits möchte ich, dass es sich mit meinem Hauptgerät verbindet, um mehr Fähigkeiten nutzen zu können; wenn man es auf einem VPS installiert, kann es nicht auf lokale Fotos oder lokales Obsidian zugreifen. Andererseits möchte ich es nicht 24/7 auf meinem eigenen Mac laufen lassen – obwohl Macs für den 7×24-Betrieb ausgelegt sind.

Schließlich habe ich auf Empfehlung von imzhichen (dem Ersteller hinter dem WeChat-öffentlichen Account „Player’s Heart“) in der Gruppe einen kostenlosen Agenten entdeckt, der Ihnen 24/7 folgen kann: Open Minis.

Das Schöne daran ist, dass es auf Ihrem iPhone läuft – Sie haben Ihr Telefon immer dabei, es schaltet sich nie aus und kann auf Ihre Fotos, Obsidian usw. zugreifen. Es ist der perfekte Agenten-Container!

Noch besser: Es ist kostenlose Software; Ihre einzigen Ausgaben sind die Token-Kosten für DeepSeek.

Installation und Einrichtung

Sie können es direkt aus dem App Store installieren.

Nach dem Herunterladen öffnen Sie die App. Sie hat eine einfache 1-2-3-Schritt-Anleitung.

Tippen Sie zuerst auf „Add a Provider“, wählen Sie dann die erste Option „OpenAI / Compatible API“, tippen Sie dann oben auf „API Key“. Ändern Sie den Labelnamen in „DeepSeek“, geben Sie Ihren API-Schlüssel in das Feld API Key ein (wenn Sie unsicher sind, lesen Sie die Anleitung zum Erhalten eines DeepSeek-API-Schlüssels). Wählen Sie für die benutzerdefinierte API-Adresse „https://api.deepseek.com“ und denken Sie daran, unten „Auto Append“ auszuschalten. Wenn alles ausgefüllt ist, scrollen Sie nach unten und tippen Sie auf „Add AI Provider“. Das war Schritt eins.

Zweitens: Tippen Sie auf „Select Models“, wählen Sie das erste, V4 Flash, und tippen Sie dann auf Next.

Drittens: Sie können auf „Start a Conversation“ tippen, um mit dem Chatten zu beginnen. Sie können ihm direkt Fragen stellen, zum Beispiel um zu sehen, welche Fähigkeiten es hat. Unten ist die Antwort, die ich bekam, als ich fragte: „Welche iPhone-Fähigkeiten hast du?“

Hier ist eine zusammengestellte Liste der integrierten iOS-nativen Fähigkeiten von Open Minis:

Kategorie Tool Fähigkeit
Vision & Sprache apple-vision OCR-Texterkennung / QR-Code / Barcode-Erkennung
Vision & Sprache apple-speech Sprache-zu-Text (Mikrofonaufnahme / Audiodateien)
Vision & Sprache apple-speak Text-zu-Sprache (TTS, mehrsprachige Unterstützung)
Apps & System apple-open Öffnen von URLs, Apps, Systemeinstellungsseiten
Apps & System apple-device Geräteinformationen (Modell, System, Akku usw.)
Apps & System apple-clipboard Zwischenablage lesen/schreiben
Apps & System apple-notification Lokale Benachrichtigungen senden
Apps & System apple-alarm Alarme und Timer einstellen
Daten & Gesundheit apple-healthkit Gesundheitsdaten abfragen und schreiben (Schritte, Herzfrequenz usw.)
Daten & Gesundheit apple-photos Fotobibliothek verwalten (importieren, exportieren, suchen)
Daten & Gesundheit apple-calendar Kalender und Erinnerungen (abfragen, erstellen)
Daten & Gesundheit apple-reminders Erinnerungen verwalten
Daten & Gesundheit apple-media Mediathek-Suche und Wiedergabesteuerung
Daten & Gesundheit apple-player Nativer Audio-/Videoplayer (Abspielen, Pause usw.)
Standort, Karten & Wetter apple-location Aktuellen Standort abrufen, Rückwärts-/Vorwärts-Geokodierung
Standort, Karten & Wetter apple-maps Orte suchen, Navigationsrouten, voraussichtliche Ankunftszeit
Standort, Karten & Wetter apple-weather Aktuelles Wetter, stündliche/tägliche Vorhersage, Wetterwarnungen
Konnektivität & Hardware apple-bluetooth Bluetooth Low Energy (scannen, verbinden, lesen/schreiben)
Konnektivität & Hardware apple-nfc NFC-Tag lesen/schreiben, Bankkarten lesen
Konnektivität & Hardware apple-homekit Smart-Home-Geräte steuern (Lichter, Klimaanlage usw.)
Natürliche Sprache apple-nlp Spracherkennung, Tokenisierung, Wortarten-Tagging, Erkennung benannter Entitäten

All dies sind iOS-native Frameworks (Vision, Speech, NaturalLanguage, HealthKit, HomeKit, MapKit, WeatherKit, AVFoundation usw.), die vollständig lokal laufen, ohne dass eine Internetverbindung erforderlich ist.

Bilderkennung

Open Minis kann die OCR-Fähigkeiten des iPhones nutzen, d.h. es kann Text in Ihren Bildern erkennen. So können Sie ihm Ihre Einkaufsbelege geben, den Inhalt extrahieren lassen und dann in Ihr Kassenbuch schreiben.

Gesundheitsstatistiken

Sie können es direkt nach Ihrer täglichen Bewegungsaktivität fragen.

Obsidian direkt manipulieren

Erinnern Sie sich, dass ich erwähnt habe, dass es Bilder erkennen kann? Nach der Erkennung können wir es direkt in unser Obsidian schreiben lassen. Aber zuerst müssen wir unser Obsidian laden, sonst weiß es nicht, wo Obsidian ist und hat keine Berechtigung. Konkret müssen Sie in den Einstellungen auf „Mount External Folder“ tippen. Die genauen Schritte entnehmen Sie den Bildern. Danach können Sie zum Gespräch zurückkehren und es Ihr Obsidian-Verzeichnis verarbeiten und manipulieren lassen.

Open Minis auf Ihrem iPhone, kombiniert mit DeepSeek’s günstiger API, bedeutet, dass Sie für sehr wenig Geld einen 24/7 KI-Assistenten haben – einen, der Bilder erkennen, Gesundheitsdaten überprüfen und Obsidian direkt manipulieren kann. Für einen Anfänger, der nicht programmiert, ist diese Kombination wahrscheinlich die niedrigschwelligste „Personal Agent“-Lösung, die es gibt.