RL RanceLee Tutorials
← Tutorialsへ戻る

Hermes 入門:クリッピング、家計簿、リマインダー、WeChat

前章では、スマホにエージェントを組み込むOpen Minisについて説明しました。本章では方向性を変え、「パーソナルアシスタント」に近いエージェント、Hermesを紹介します。

最初はHermesにあまり期待していませんでした。OpenClawを使ってみて、自分には管理してもらうことがそれほど多くないと気づき、使うためだけにツールを使いたくはなかったのです。

しかし、しばらく試してみると、Hermesはこれまで使ってきたツールとはかなり異なることがわかりました。

Hermesが他のツールとどう違うか

私の経験では、CodexやClaude Codeの主な用途は依然としてコードを書くことです。明確なプロジェクト、明確なバグ、明確な要件を与えると、それらはプロジェクトに入り、ファイルを修正し、テストを実行し、問題を修正します。この分野での能力は非常に高いです。

一方、Hermesは、徐々にあなたのことを知っていくパーソナルエージェントツールであり、どちらかというとパーソナルアシスタントのようなものです。

その焦点は、単一の非常に複雑なプログラミングタスクを完了することではなく、あなたと長期的な会話をし、あなたの好みを記憶し、ワークフローを理解し、繰り返し発生するプロセスをスキルに抽出することです。次回同様のことを行うとき、ゼロから始めるのではなく、蓄積された経験を活かして支援し続けます。

OpenClawについては、プロジェクトやチーム管理により向いていると感じています。もちろんパーソナルアシスタントとしても機能しますが、Hermesのように「長期的に生活や仕事に寄り添う」という感覚はありません。

もちろん、これはあくまで私個人の印象であり、絶対的なルールではありません。実際、上記の3つのシナリオはどれもこれらのツールで処理できます。ただ、各シナリオへの適合度が異なるだけです。

ツール 主に使う用途 印象
Codex / Claude Code コード作成、プロジェクト修正、テスト実行 エンジニアリング能力が高く、明確なプログラミングタスクに適している
Hermes 長期的なパーソナルアシスタント、WeChatエントリ、スケジュールタスク、記憶とスキル 時間とともにあなたを理解し、小さくても繰り返し発生する個人ワークフローに適している
OpenClaw プロジェクト管理、タスク分解、チームコラボレーション プロジェクト/チーム管理エージェントに近く、パーソナルアシスタントとは少し異なる

一言でまとめるなら:

CodexやClaude Codeは「今プロジェクトがあるから、手伝ってくれ」という感じ。Hermesは「まずはそばにいて、徐々に私の習慣やワークフローを引き継いでくれ」という感じです。

現在Hermesを主に使っている用途

まずインストールについては触れません。なぜなら、ほとんどの人にとって本当に重要なのは「どうやってインストールするか」ではなく、「実際に何ができるのか」だからです。

現在、Hermesを以下のようなことに使っています。

  1. クリッピング。

以前はObsidian公式のWeb Clipperを推奨していましたが、もう使っていません。なぜなら、ウェブページを直接Hermesに送るだけで、記事をObsidianにクリップしてくれるからです。

BilibiliやYouTubeの動画の場合は、ダウンロードしてAIに送り音声をテキスト化し、誤字を修正し広告コンテンツを除去します。Obsidianを開くと、きれいに整理された記事が表示されます。

  1. 家計簿。

以前は多くの人がショートカットを使って家計簿をつけていました。私もその方法の一つとして使っていますが、ショートカットのデバッグは本当に嫌いです。疲れます。

今はWeChatのチャットで家計簿の詳細を直接Hermesに送るだけで、すぐにNotionに書き込んでくれます。ただし、自分で小さなプラットフォームを構築していて、ショートカットとHermesの両方がそのプラットフォームにコマンドを送信していることをお伝えしておきます。

もちろん、Notionを必要としないローカル版の家計簿機能もあります。それについては後日、専用の記事を書きます。

  1. WeChat記事の作成。

WeChat記事の作成には、テーマ選び、手書き、編集、公開など、約13のステップがあります。今ではこれらのプロセスをすべてHermesに任せて、ステップごとに処理してもらっています。

また、以前Claudianという優れたObsidian AIツールを紹介しましたが、実際にはHermesを使ってObsidianを操作しています。

  1. リマインダーの設定。

私はTickTickのヘビーユーザーで、毎日欠かせませんが、TickTickでタスクを設定するのはかなり面倒です。

特に、数ヶ月後の特定の週や、数ヶ月おきの水曜日と木曜日といったタスクを設定するには、何度もクリックが必要です。今では自然言語でHermesに送信するだけで、バックグラウンドでTickTickに設定してくれます。

  1. 日報。

毎朝7時30分に、過去12時間のニュースレポートを送ってもらっています。また、私は株式トレーダーとして働いているので、毎日市場が閉まった後、市場情報をまとめて取引日報を作成してもらっています。

  1. その他さまざまな小さなタスク。

これこそがHermesの真骨頂です。

個々には小さく、プログラムを書いたり複雑なソフトウェアを開いたりする価値がないことが多いです。しかし、毎日、毎週、毎月繰り返され、徐々に負担になっていきます。

それがHermesの価値です。一度タスクを完了するのを助けるだけでなく、これらの繰り返し発生する小さなプロセスを徐々に引き継いでいきます。

DeepSeek V4 FlashとHermesが相性抜群な理由

最近DeepSeek V4がリリースされてから、DeepSeek V4 FlashとHermesは完璧な組み合わせだと気づきました。

理由は簡単です。Hermesの多くのタスクはOpusレベルの知能を必要としません。極めて複雑なプログラミング問題を解決するわけではなく、クリッピング、整理、リマインダー、クエリ、アーカイブ、ツール呼び出しなどが中心です。

これらのタスクに必要なのは、「毎回最も賢いモデルが長時間熟考すること」ではなく、スピード、低コスト、そして長期間稼働できることです。

DeepSeek V4 Flashの実際の使用感は、画面がスクロールしているかのようで、私の読む速度が出力速度に追いつきません。知能は確かにOpus 4.7ほど高くはありませんが、Hermesには十分すぎるほどです。

だからこそ今お勧めしています。Hermesは長期的に稼働するオンラインパーソナルアシスタントであり、モデルのコストと応答速度は、実際に使うかどうかに直接影響します。

インストールと設定

Hermesを動かすだけなら、最小限の手順は3ステップです。

  1. Hermesをインストールする。
  2. モデルを設定する。
  3. WeChatまたはFeishuのエントリを設定する。

コマンド、メモリ、スキル、スケジュールタスクについては、必要になったときに後で学べばよいでしょう。

いつものように、Hermesのインストールは一行で完了します。Macでデモします。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

インストール後、ターミナルでどこでも hermes と入力すると起動できます。Claude CodeやCodexとは異なり、起動するかどうかにかかわらず、実際にはコンピュータのバックグラウンドで動作していることに注意してください。

あ、それから、以前OpenClawを使っていた場合、Hermesはシームレスな移行コマンドを用意しています。これを入力するだけです。念のため。

hermes claw migrate

移行しなかった場合は、Hermesを初期設定する必要があります。

hermes model

このステップでは、AIプロバイダーを入力するよう求められます。DeepSeekをお勧めします。赤い枠で対応するオプションが強調表示されています。一番上が公式のDeepSeekです。APIキーを入力し、DeepSeek V4 Flashを選択するだけです。

下の赤い枠には、以前紹介したOpenCode ZenとOpenCode Goが含まれています。

Goプランは私がお勧めする利用方法です。月額10ドルで60ドル分のクレジットが得られ、Alipayで支払えて中国から直接接続できます。DeepSeek V4 Flashを使えば、クレジットが尽きることはありません。

もちろん、今最もお勧めなのはOpenCode Zenです。期間限定でDeepSeek V4 Flashが無料で使えるからです。無料が一番です。

次に、WeChatを設定して、WeChatから通信できるようにしましょう。同様に、Feishuも設定できます。

hermes gateway setup

WeChatを例にとると、選択後にQRコードが表示されるので、スマホでスキャンしてください。私はすでに設定済みなのでデモはできず、スキップします。

設定が成功すると、WeChatにチャットウィンドウが表示され、直接通信できるようになります。最も重要なコマンドは /new で、新しい会話を開始できます。前の会話が長くなった場合、これを使って新しい会話に切り替えられます。

具体的な使い方

上記2つのステップを設定すれば、ターミナルで使用できます。

ターミナルで hermes と入力するだけで起動します。CodexやClaude Codeとの違いは、特定のディレクトリに入る必要がなく、ターミナルのどこでも入力できることです。常に同じHermesインスタンスに入ります。

ここにIDがあることに触れておきます。後でこの会話を取得し、この一意のIDを使ってチャットを続けることができます。

例えば、ここでの私のIDは 20260514_224631_850142 です。後でターミナルのどこでも hermes -r 20260514_224631_850142 と入力するだけで、この会話を再開してチャットを続けられます。

多くの会話の中から必要なIDを見つける方法については、後ほど説明します。この章では扱いません。

さて、本題に戻り、いくつかの重要なコマンドについて説明します。

最初は /new で、新しい会話を開始できます。Hermesには過去の会話を検索するメモリシステムが組み込まれていますが、同じ会話で異なるトピックを議論するとモデルのパフォーマンスが低下する可能性があります。そのため、一つのトピックを徹底的に終えてから新しい会話を始めることをお勧めします。

2つ目のコマンドは /reasoning です。推論レベルや推論プロセスを表示するかどうかなど、推論関連の設定を管理します。

私の習慣では、推論プロセスを非表示にしています。DeepSeek V4 Flashでは、推論レベルを xhigh に設定しています。

そこで、それぞれ /reasoning hide/reasoning xhigh を入力します。

これを行った後、以下で快適にチャットできます。

Hermesのユニークな点は、チャット後に内部であなたに関する記憶を整理し、あなたの好みや傾向を学習することです。さらに、あなたの操作の一部は自動的にスキルに整理され、あなたの行動に基づいてこれらのスキルが修正されます。

OpenClawやClaude Codeでは、関連するスキルを作成するよう積極的に依頼する必要があることが多いのに対し、Hermesは長期間の使用を通じて徐々にあなたのワークフローを学習していくようなものです。

Hermesを使うべき人

AIにコードを書くのを手伝ってもらいたいだけなら、CodexやClaude Codeを引き続き使えばよいでしょう。

しかし、クリッピング、家計簿、リマインダー、日報、資料整理、WeChat記事作成、Obsidianの同期など、繰り返し発生する小さなプロセスが多くある場合、Hermesの価値が明らかになります。

一度タスクを完了するのを助けるだけでなく、徐々にあなたをよりよく理解するバックエンドアシスタントになります。

もちろん、この種のツールには前提条件があります。コンピュータ上で長期間実行され、徐々にあなたのノート、チャットエントリポイント、ワークフローにアクセスすることを受け入れなければなりません。

そのため、最初はあまり多くを任せすぎないことをお勧めします。クリッピングやリマインダーなどの低リスクなシナリオから始めてください。確実に役立つことを確認できたら、徐々に複雑なプロセスを任せていきましょう。

プログラミングについて

ここで特に言及しておきたいのは、Hermesはプログラミング作業もできますが、Codexの代替にはならないということです。

同じGPT-5.5モデルを推論レベルHighで使用し、HermesとCodexの両方に同じタスクを実行させました。Codexの方が明らかに強力でした。

それは正常です。Codexはプログラミングエージェントとして位置づけられており、プロジェクトに深く入り込んでコードを読み、修正し、テストを実行し、問題を修正するのに適しています。Hermesの強みは「単一セッションでの最強のプログラミング能力」ではなく、「長期的なパーソナルエントリポイントおよびコマンドセンターとして機能できること」です。

そのため、私のアプローチはHermesでCodexを置き換えるのではなく、連携させることです。

ここでは2つの方法があります。

  1. Hermesはターミナルから直接Codexを呼び出せるので、タスクをCodexに引き継がせ、その後結果を自身でレビューさせることができます。
  2. 手動でCodexを起動し、Hermesに引き継ぎファイルを書かせます。各AIが操作を実行した後、引き継ぎファイルを修正して相手が読めるようにします。

それぞれに焦点があるため、HermesにOpenClawを操作させる人もいると聞きました。

それについては、私が再びOpenClawを使い始めるかどうかによります。しかし今のところ、Hermesで十分だと感じています。もし後でそうしたら、別の記事を書きます。

まとめ

この章で学んだこと:

  1. Hermesの位置づけ: CodexやClaude Codeの代替ではなく、徐々にあなたを理解していく長期的なオンラインパーソナルアシスタントのようなもの。
  2. 適したシナリオ: クリッピング、家計簿、リマインダー、日報、WeChat記事のワークフロー、Obsidianの整理など、繰り返し発生する小さなプロセスに最適。
  3. モデル選択: Hermesの多くのタスクは最強のモデルを必要とせず、スピード、低コスト、長期的な持続可能性が求められるため、DeepSeek V4 Flashのようなモデルが非常に適している。
  4. 最小限の導入パス: Hermesをインストールし、モデルを設定し、WeChatまたはFeishuのエントリを設定すれば、すぐに使い始められる。
  5. 使用習慣: /new を使って異なるタスクを分け、/reasoning で推論設定を調整し、会話IDを使って過去の会話を取得する。
  6. プログラミングの境界: Hermesはプログラミングもできるが、最強のプログラミングエージェントではない。コマンドセンターとして使い、明確なプログラミングタスクをCodexに引き継ぎ、Hermesが結果をレビューしてつなぐのが良い。

重要なポイント:

  • Hermesの価値は単一タスクの能力ではなく、長期的な伴走とプロセスの蓄積にある。
  • 断片的で反復的な、ツールを横断する小さなタスクを引き継ぐのに適している。
  • 習慣を記憶し、スキルを蓄積し、WeChatからいつでも呼び出せるパーソナルアシスタントを求めるなら、Hermesは純粋なプログラミングツールよりもこの形に近い。

おまけ:さらに上を目指したい方へ