RL RanceLee Tutorials
← Zurück zu Tutorials

Hermes Erste Schritte: Clipping, Buchhaltung, Erinnerungen und WeChat

Im vorherigen Kapitel haben wir Open Minis behandelt, das einen Agenten in Ihr Telefon bringt. Dieses Kapitel schlägt eine andere Richtung ein und stellt einen Agenten vor, der eher einem „persönlichen Assistenten“ ähnelt: Hermes.

Ich war anfangs nicht sehr optimistisch, was Hermes betrifft. Nachdem ich OpenClaw verwendet hatte, wurde mir klar, dass ich nicht so viele Dinge hatte, die es für mich verwalten musste, und ich wollte kein Tool nur um des Tools willen nutzen.

Aber nachdem ich es eine Weile ausprobiert hatte, fand ich, dass Hermes sich ziemlich von den Tools unterscheidet, die ich zuvor verwendet habe.

Wie sich Hermes von anderen Tools unterscheidet

Aus meiner eigenen Erfahrung ist der Hauptanwendungsfall für Codex und Claude Code immer noch das Schreiben von Code. Man gibt ihnen ein klares Projekt, einen klaren Bug, eine klare Anforderung, und sie gehen hinein, ändern Dateien, führen Tests durch und beheben Probleme. Ihre Fähigkeit in diesem Bereich ist sehr stark.

Hermes hingegen ist eher wie ein persönliches Agenten-Tool, das Sie nach und nach kennenlernt, ähnlich wie ein persönlicher Assistent.

Sein Fokus liegt nicht darauf, eine einzelne, extrem komplexe Programmieraufgabe zu erledigen, sondern auf langfristigen Gesprächen mit Ihnen, dem Merken Ihrer Vorlieben, dem Verstehen Ihres Arbeitsablaufs und dem Destillieren wiederkehrender Prozesse in Skills. Wenn Sie das nächste Mal etwas Ähnliches tun, beginnt es nicht bei Null, sondern hilft Ihnen mit der gesammelten Erfahrung weiter.

Was OpenClaw betrifft, habe ich das Gefühl, dass es eher auf Projekt- oder Teammanagement ausgerichtet ist. Es kann sicherlich als persönlicher Assistent fungieren, aber es gibt mir nicht das Gefühl, „langfristig in Leben und Arbeit bei Ihnen zu bleiben“, wie Hermes es tut.

Natürlich ist dies nur mein persönlicher Eindruck, keine absolute Regel. Tatsächlich kann jedes der drei oben genannten Szenarien mit jedem dieser Tools bewältigt werden; sie unterscheiden sich nur darin, wie gut sie zu jedem Szenario passen.

Tool Wofür ich es bevorzuge Gefühl
Codex / Claude Code Code schreiben, Projekte ändern, Tests ausführen Stärkere technische Fähigkeiten, geeignet für klar definierte Programmieraufgaben
Hermes Langfristiger persönlicher Assistent, WeChat-Eingang, geplante Aufgaben, Gedächtnis und Skills Lernt Sie mit der Zeit besser kennen, geeignet für diese kleinen, aber wiederkehrenden persönlichen Arbeitsabläufe
OpenClaw Projektmanagement, Aufgabenaufteilung, Teamzusammenarbeit Eher ein Projekt-/Team-Management-Agent, nicht genau ein persönlicher Assistent

Wenn ich es in einem Satz zusammenfassen müsste:

Codex und Claude Code sind eher wie „Ich habe jetzt ein Projekt, komm und hilf mir dabei.“ Hermes ist eher wie „Bleib erstmal an meiner Seite und übernimm nach und nach meine Gewohnheiten und Arbeitsabläufe.“

Wofür ich Hermes derzeit hauptsächlich nutze

Ich werde nicht zuerst über die Installation sprechen, denn für die meisten Menschen ist die wirklich wichtige Frage nicht „Wie installiere ich es?“, sondern „Was kann es eigentlich für mich tun?“

Ich verwende Hermes derzeit für diese Arten von Dingen.

  1. Clipping.

Ich habe zuvor den offiziellen Web Clipper von Obsidian empfohlen, aber ich benutze ihn nicht mehr. Denn ich schicke die Webseite einfach direkt an Hermes, und es kann den Artikel für mich in Obsidian clippen.

Wenn es sich um ein Video von Bilibili oder YouTube handelt, lädt es es herunter, schickt es an KI zur Sprach-zu-Text-Umwandlung, korrigiert dann Tippfehler und entfernt Werbeinhalte. Wenn ich Obsidian öffne, sehe ich einen gut organisierten Artikel.

  1. Buchhaltung.

Viele Leute haben früher Shortcuts für die Buchhaltung verwendet, und ich nutze es immer noch als eine meiner Methoden, aber ich mag das Debuggen von Shortcuts wirklich nicht – es ist zu anstrengend.

Jetzt schicke ich die Buchhaltungsdetails einfach direkt in einem WeChat-Chat an Hermes, und es schreibt sie sofort in Notion. Aber ich sollte erwähnen, dass ich selbst eine kleine Plattform gebaut habe; sowohl Shortcuts als auch Hermes senden Befehle an meine Plattform.

Natürlich gibt es auch eine lokale Version dieser Buchhaltungsfunktion, die kein Notion benötigt. Darüber werde ich später einen eigenen Artikel schreiben.

  1. WeChat-Artikel schreiben.

Das Schreiben eines WeChat-Artikels umfasst fast 13 Schritte, darunter Themenauswahl, Handschrift, Bearbeitung, Veröffentlichung und mehr. Jetzt delegiere ich all diese Prozesse an Hermes, um sie Schritt für Schritt zu erledigen.

Auch wenn ich zuvor Claudian vorgestellt habe, ein großartiges Obsidian-KI-Tool, verwende ich tatsächlich Hermes, um Obsidian zu bedienen.

  1. Erinnerungen einstellen.

Ich bin ein intensiver Nutzer von TickTick, ich kann es täglich nicht missen, aber das Einrichten von Aufgaben in TickTick ist ziemlich umständlich.

Besonders wenn Ihre Aufgaben bestimmte Wochen Monate später oder alle paar Monate mittwochs und donnerstags betreffen, erfordert das Einrichten solcher Aufgaben mehrere Klicks. Jetzt kann ich einfach natürliche Sprache an Hermes senden und es im Hintergrund in TickTick einrichten lassen.

  1. Tägliche Berichte.

Jeden Morgen um 7:30 Uhr lasse ich es mir einen Nachrichtenbericht der letzten 12 Stunden senden. Außerdem arbeite ich als Aktienhändler, also lasse ich es nach Börsenschluss jeden Tag Marktinformationen zusammenstellen und einen täglichen Handelsbericht erstellen.

  1. Verschiedene andere kleine Aufgaben.

Hier zeigt Hermes eigentlich seine Stärken.

Viele Dinge sind einzeln klein, nicht wert, ein Programm dafür zu schreiben oder eine komplexe Software zu öffnen. Aber sie wiederholen sich täglich, wöchentlich, monatlich und werden nach und nach zu einer Belastung.

Das ist der Wert von Hermes: Es hilft Ihnen nicht nur, eine Aufgabe einmal zu erledigen; es übernimmt nach und nach diese wiederkehrenden kleinen Prozesse.

Warum DeepSeek V4 Flash und Hermes ein großartiges Paar sind

Nachdem DeepSeek V4 kürzlich herauskam, fand ich, dass DeepSeek V4 Flash und Hermes perfekt zusammenpassen.

Der Grund ist einfach: Viele Aufgaben in Hermes erfordern nicht die Intelligenz von Opus. Es löst nicht unbedingt extrem komplexe Programmierprobleme; es geht mehr um Clipping, Organisieren, Erinnern, Abfragen, Archivieren und Aufrufen von Tools.

Was diese Aufgaben brauchen, ist nicht „das intelligenteste Modell, das jedes Mal lange nachdenkt“, sondern Geschwindigkeit, niedrige Kosten und die Fähigkeit, langfristig zu laufen.

Die tatsächliche Erfahrung mit DeepSeek V4 Flash fühlt sich an, als würde es den Bildschirm scrollen; meine Lesegeschwindigkeit kann mit seiner Ausgabegeschwindigkeit nicht mithalten. Seine Intelligenz ist sicherlich nicht so hoch wie die von Opus 4.7, aber für Hermes ist es mehr als ausreichend.

Deshalb empfehle ich es jetzt: Hermes ist ein langfristiger Online-Assistent, und Modellkosten und Antwortgeschwindigkeit beeinflussen direkt, ob Sie bereit sind, es tatsächlich zu nutzen.

Installation und Konfiguration

Wenn Sie Hermes nur zum Laufen bringen wollen, besteht der minimale Pfad aus drei Schritten:

  1. Hermes installieren.
  2. Das Modell konfigurieren.
  3. Den WeChat- oder Feishu-Eingang einrichten.

Sie können sich später mit Befehlen, Gedächtnis, Skills und geplanten Aufgaben vertraut machen, wenn Sie sie benötigen.

Wie üblich ist die Installation von Hermes ein Einzeiler. Ich demonstriere es auf einem Mac.

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Nach der Installation können Sie es starten, indem Sie hermes irgendwo im Terminal eingeben. Beachten Sie, dass es im Gegensatz zu Claude Code oder Codex, egal ob Sie es starten oder nicht, tatsächlich im Hintergrund auf Ihrem Computer läuft.

Oh, und wenn Sie zuvor OpenClaw verwendet haben, bietet Hermes dankenswerterweise einen nahtlosen Migrationsbefehl. Geben Sie einfach dies ein. Nur als Hinweis.

hermes claw migrate

Wenn Sie nicht migriert haben, müssen Sie Hermes initial einrichten.

hermes model

Dieser Schritt fordert Sie auf, einen KI-Anbieter einzugeben. Ich empfehle DeepSeek; das rote Kästchen hebt die entsprechende Option hervor. Die oberste ist die offizielle DeepSeek. Geben Sie einfach Ihren API-Key ein und wählen Sie DeepSeek V4 Flash.

Das untere rote Kästchen enthält OpenCode Zen und OpenCode Go, die ich bereits vorgestellt habe.

Der Go-Plan ist eine Nutzungsmethode, die ich empfehle. Für 10 $ pro Monat erhalten Sie 60 $ Guthaben, und Sie können mit Alipay bezahlen und direkt aus China verbinden. Wenn Sie DeepSeek V4 Flash verwenden, werden Sie nie ausgehen.

Natürlich ist derzeit OpenCode Zen am meisten zu empfehlen, da es zeitlich begrenzt kostenloses DeepSeek V4 Flash anbietet. Kostenlos ist immer am besten.

Als Nächstes konfigurieren wir WeChat, damit Sie von WeChat aus mit ihm kommunizieren können. Ebenso können Sie auch Feishu konfigurieren.

hermes gateway setup

Am Beispiel von WeChat: Nachdem Sie es ausgewählt haben, erscheint ein QR-Code, den Sie mit Ihrem Telefon scannen können. Ich habe es bereits konfiguriert, daher kann ich es nicht demonstrieren und werde es überspringen.

Nach erfolgreicher Konfiguration haben Sie ein Chat-Fenster in WeChat, in dem Sie direkt kommunizieren können. Der wichtigste Befehl ist /new, mit dem Sie ein neues Gespräch beginnen können. Wenn Ihr vorheriges Gespräch lange gedauert hat, können Sie damit zu einem neuen wechseln.

Spezifische Nutzung

Sobald wir die beiden obigen Schritte konfiguriert haben, können wir es im Terminal verwenden.

Geben Sie einfach hermes im Terminal ein, um zu starten. Der Unterschied zu Codex und Claude Code besteht darin, dass Sie kein bestimmtes Verzeichnis eingeben müssen; Sie können es überall im Terminal eingeben. Sie gelangen immer in dieselbe Hermes-Instanz.

Ich sollte erwähnen, dass es hier eine ID gibt; Sie können dieses Gespräch später abrufen und mit dieser eindeutigen ID weiter chatten.

Zum Beispiel ist meine ID hier 20260514_224631_850142. Später kann ich einfach hermes -r 20260514_224631_850142 irgendwo im Terminal eingeben, um dieses Gespräch fortzusetzen und weiter zu chatten.

Wie man die benötigte ID unter vielen Gesprächen findet, behandeln wir später, nicht in diesem Kapitel.

Zurück zum Thema: Lassen Sie uns zunächst über einige wichtige Befehle sprechen.

Der erste ist /new, mit dem Sie ein neues Gespräch beginnen können. Obwohl Hermes ein integriertes Gedächtnissystem hat, das ihm hilft, historische Gespräche nachzuschlagen, kann das Besprechen verschiedener Themen im selben Gespräch die Leistung des Modells dennoch beeinträchtigen. Daher empfehle ich, ein Thema gründlich zu Ende zu bringen, bevor Sie ein neues Gespräch beginnen.

Der zweite Befehl ist /reasoning. Er verwaltet reasoning-bezogene Einstellungen, einschließlich Ihres Reasoning-Levels und ob der Reasoning-Prozess angezeigt werden soll.

Meine persönliche Angewohnheit ist es, den Reasoning-Prozess auszublenden. Für DeepSeek V4 Flash setze ich das Reasoning-Level auf xhigh.

Also geben wir /reasoning hide und /reasoning xhigh ein.

Nachdem Sie dies getan haben, können Sie unten fröhlich mit ihm chatten.

Das Einzigartige an Hermes ist, dass es nach Ihrem Chat intern Erinnerungen über Sie organisiert und Ihre Vorlieben und Neigungen lernt. Darüber hinaus werden einige Ihrer Operationen automatisch in Skills organisiert, und es wird diese Skills basierend auf Ihren Aktionen ändern.

Im Gegensatz zu OpenClaw oder Claude Code, bei denen Sie oft aktiv darum bitten müssen, einen relevanten Skill zu erstellen, ist Hermes eher so, dass es Ihre Arbeitsabläufe im Laufe der Zeit allmählich lernt.

Wer sollte Hermes verwenden

Wenn Sie nur möchten, dass KI Ihnen beim Schreiben von Code hilft, denke ich, dass Sie weiterhin Codex oder Claude Code verwenden können.

Aber wenn Sie viele wiederkehrende kleine Prozesse haben, wie Clipping, Buchhaltung, Erinnerungen, tägliche Berichte, Materialorganisation, Schreiben von WeChat-Artikeln, Synchronisieren von Obsidian, dann wird der Wert von Hermes deutlich.

Es hilft Ihnen nicht nur, eine Aufgabe einmal zu erledigen; es wird nach und nach zu einem Backend-Assistenten, der Sie immer besser versteht.

Natürlich gibt es eine Voraussetzung für diese Art von Tool: Sie müssen akzeptieren, dass es langfristig auf Ihrem Computer läuft und nach und nach auf Ihre Notizen, Chat-Eingänge und Arbeitsabläufe zugreift.

Daher schlage ich vor, am Anfang nicht zu viel zu übernehmen. Beginnen Sie mit risikoarmen Szenarien wie Clipping und Erinnerungen. Sobald Sie bestätigt haben, dass es Ihnen zuverlässig helfen kann, übergeben Sie nach und nach komplexere Prozesse.

Über das Programmieren

Ich möchte hier speziell erwähnen, dass Hermes zwar auch Programmierarbeit erledigen kann, aber kein Ersatz für Codex ist.

Ich habe dasselbe GPT-5.5-Modell mit auf High gesetztem Reasoning verwendet und sowohl Hermes als auch Codex dieselbe Aufgabe erledigen lassen. Codex war deutlich stärker.

Das ist normal. Codex ist als Programmieragent positioniert; es ist besser geeignet, in ein Projekt einzutauchen, um Code zu lesen, Code zu ändern, Tests auszuführen und Probleme zu beheben. Hermes‘ Stärke liegt nicht in der „stärksten Einzelsitzungs-Programmierfähigkeit“, sondern darin, „als Ihr langfristiger persönlicher Eingang und Kommandozentrale dienen zu können“.

Mein Ansatz ist es daher nicht, Codex durch Hermes zu ersetzen, sondern sie zusammenarbeiten zu lassen.

Ich habe hier zwei Methoden:

  1. Hermes kann Codex direkt vom Terminal aus aufrufen, sodass Sie es Aufgaben an Codex übergeben und dann die Ergebnisse selbst überprüfen lassen können.
  2. Ich starte Codex manuell und lasse Hermes eine Übergabedatei schreiben. Nachdem jede KI ihre Operationen durchgeführt hat, ändern sie die Übergabedatei, damit die andere sie lesen kann.

Ich habe gehört, dass einige Leute sogar Hermes OpenClaw bedienen lassen, da sie jeweils ihren eigenen Fokus haben.

Was das betrifft, hängt es davon ab, ob ich wieder anfangen werde, OpenClaw zu verwenden. Aber im Moment habe ich das Gefühl, dass Hermes ausreicht. Wenn ich das später tue, werde ich einen weiteren Artikel schreiben.

Zusammenfassung

Was wir in diesem Kapitel gelernt haben:

  1. Hermes‘ Positionierung: Es ist kein Ersatz für Codex oder Claude Code; es ist eher wie ein langfristiger Online-Assistent, der Sie nach und nach kennenlernt.
  2. Geeignete Szenarien: Wiederkehrende kleine Prozesse wie Clipping, Buchhaltung, Erinnerungen, tägliche Berichte, WeChat-Artikel-Workflows und Obsidian-Organisation sind am besten für Hermes geeignet.
  3. Modellauswahl: Viele Aufgaben in Hermes erfordern nicht das stärkste Modell; sie benötigen Geschwindigkeit, niedrige Kosten und langfristige Nachhaltigkeit, daher sind Modelle wie DeepSeek V4 Flash sehr geeignet.
  4. Minimaler Einführungspfad: Installieren Sie Hermes, konfigurieren Sie das Modell, richten Sie dann den WeChat- oder Feishu-Eingang ein, und Sie können loslegen.
  5. Nutzungsgewohnheiten: Verwenden Sie /new, um verschiedene Aufgaben zu trennen, verwenden Sie /reasoning, um Reasoning-Einstellungen anzupassen, und verwenden Sie Gesprächs-IDs, um vergangene Gespräche abzurufen.
  6. Programmiergrenzen: Hermes kann programmieren, ist aber nicht der stärkste Programmieragent. Es ist besser, es als Kommandozentrale zu verwenden, klare Programmieraufgaben an Codex zu übergeben, wobei Hermes die Ergebnisse überprüft und verbindet.

Wichtige Erkenntnisse:

  • Hermes‘ Wert liegt nicht in seiner Einzelaufgabenfähigkeit, sondern in seiner langfristigen Begleitung und Prozessakkumulation.
  • Es eignet sich zur Übernahme von fragmentierten, sich wiederholenden, toolübergreifenden kleinen Aufgaben.
  • Wenn Sie einen persönlichen Assistenten möchten, der sich Gewohnheiten merkt, Skills ansammelt und jederzeit von WeChat aus aufgerufen werden kann, ist Hermes dieser Form näher als ein reines Programmierwerkzeug.

Bonus: Für diejenigen, die es auf die nächste Stufe bringen möchten