RL RanceLee Tutorials
← 튜토리얼로 돌아가기

Hermes 시작하기: 클리핑, 가계부, 알림, WeChat

이전 장에서는 휴대폰에 에이전트를 넣는 Open Minis에 대해 다뤘습니다. 이 장에서는 다른 방향으로, ‘개인 비서’에 더 가까운 에이전트인 Hermes를 소개합니다.

처음에는 Hermes에 대해 그다지 낙관적이지 않았습니다. OpenClaw를 사용해보니, 굳이 관리할 일이 그렇게 많지 않다고 느꼈고, 그냥 쓰기 위해 도구를 사용하고 싶지 않았습니다.

하지만 한동안 사용해보니 Hermes는 이전에 사용했던 도구들과는 상당히 다르다는 것을 알게 되었습니다.

Hermes가 다른 도구와 다른 점

제 경험상 Codex와 Claude Code의 주요 사용 사례는 여전히 코드 작성입니다. 명확한 프로젝트, 명확한 버그, 명확한 요구 사항을 주면, 그들은 들어가서 파일을 수정하고, 테스트를 실행하고, 문제를 해결합니다. 이 분야에서 그들의 능력은 매우 뛰어납니다.

반면 Hermes는 점차 사용자를 알아가는 개인 에이전트 도구에 더 가깝습니다. 일종의 개인 비서와 비슷합니다.

Hermes의 초점은 단일하고 극도로 복잡한 프로그래밍 작업을 완료하는 것이 아니라, 사용자와 장기적인 대화를 나누고, 선호도를 기억하며, 워크플로를 이해한 다음, 반복되는 프로세스를 Skills로 추출하는 데 있습니다. 다음에 비슷한 작업을 할 때, 처음부터 시작하지 않고 축적된 경험을 바탕으로 계속 도와줍니다.

OpenClaw의 경우, 프로젝트나 팀 관리에 더 중점을 둔 것 같습니다. 물론 개인 비서 역할도 할 수 있지만, Hermes처럼 ‘일과 생활에서 장기적으로 함께 한다’는 느낌은 주지 않습니다.

물론 이것은 제 개인적인 인상일 뿐, 절대적인 규칙은 아닙니다. 실제로 위에서 언급한 세 가지 시나리오는 모두 이 도구들로 처리할 수 있으며, 각 시나리오에 얼마나 잘 맞는지가 다를 뿐입니다.

도구 주로 사용하는 용도 느낌
Codex / Claude Code 코드 작성, 프로젝트 수정, 테스트 실행 엔지니어링 능력이 뛰어나며, 명확한 프로그래밍 작업에 적합
Hermes 장기 개인 비서, WeChat 진입점, 예약 작업, 메모리 및 Skills 시간이 지날수록 사용자를 더 잘 알게 되며, 작지만 반복되는 개인 워크플로에 적합
OpenClaw 프로젝트 관리, 작업 분해, 팀 협업 프로젝트/팀 관리 에이전트에 가깝고, 개인 비서와는 다소 거리가 있음

한 문장으로 요약하자면:

Codex와 Claude Code는 ‘지금 프로젝트가 있으니 와서 도와줘’에 더 가깝습니다. Hermes는 ‘먼저 내 곁에 있으면서 내 습관과 워크플로를 점차 맡아줘’에 더 가깝습니다.

현재 Hermes를 주로 사용하는 용도

설치에 대해 먼저 이야기하지는 않겠습니다. 대부분의 사람들에게 진정으로 중요한 질문은 ‘설치 방법’이 아니라 ‘실제로 나에게 무엇을 해줄 수 있는가’이기 때문입니다.

현재 Hermes를 이런 용도로 사용하고 있습니다.

  1. 클리핑.

이전에는 Obsidian의 공식 Web Clipper를 추천했지만, 더 이상 사용하지 않습니다. 이제는 웹페이지를 Hermes에 직접 보내면, Hermes가 기사를 Obsidian에 클리핑해 줍니다.

Bilibili나 YouTube의 동영상이라면, 다운로드하여 AI에 보내 음성을 텍스트로 변환한 후, 오타를 수정하고 광고 내용을 제거합니다. Obsidian을 열면 잘 정리된 기사를 볼 수 있습니다.

  1. 가계부.

많은 사람들이 이전에 Shortcuts으로 가계부를 작성했고, 저도 여전히 그 방법 중 하나로 사용하지만, Shortcuts 디버깅은 정말 싫어합니다. 너무 피곤하거든요.

이제는 WeChat 채팅에서 가계부 내역을 직접 보내면, 즉시 Notion에 기록합니다. 하지만 제가 직접 작은 플랫폼을 구축했다는 점을 언급해야겠네요. Shortcuts와 Hermes 모두 제 플랫폼으로 명령을 보냅니다.

물론 Notion이 필요 없는 로컬 버전의 가계부 기능도 있습니다. 이에 대해서는 나중에 별도로 글을 쓰겠습니다.

  1. WeChat 기사 작성.

WeChat 기사를 작성하려면 주제 선정, 필기, 편집, 게시 등 거의 13단계가 필요합니다. 이제 이 모든 과정을 Hermes에 위임하여 단계별로 처리합니다.

또한, 이전에 훌륭한 Obsidian AI 도구인 Claudian을 소개했지만, 실제로는 Hermes를 사용하여 Obsidian을 조작합니다.

  1. 알림 설정.

저는 TickTick을 많이 사용하며, 매일 없으면 안 되지만 TickTick에서 작업을 설정하는 것은 꽤 번거롭습니다.

특히 작업이 몇 주 후의 특정 주나, 몇 달마다 수요일과 목요일 같은 경우, 이러한 작업을 설정하려면 여러 번 클릭해야 합니다. 이제는 자연어로 Hermes에 보내기만 하면 백그라운드에서 TickTick에 설정해 줍니다.

  1. 일일 보고서.

매일 아침 7시 30분에 지난 12시간 동안의 뉴스 보고서를 보내도록 설정했습니다. 또한 저는 주식 트레이더로 일하기 때문에, 매일 장 마감 후 시장 정보를 취합하여 거래 일일 보고서를 작성하도록 합니다.

  1. 기타 다양한 소규모 작업.

이것이 바로 Hermes가 빛을 발하는 부분입니다.

개별적으로는 작은 일들이 많아 프로그램을 작성하거나 복잡한 소프트웨어를 열 가치가 없습니다. 하지만 매일, 매주, 매월 반복되면서 점점 부담이 됩니다.

이것이 Hermes의 가치입니다. 단순히 한 번 작업을 완료하는 것을 돕는 것이 아니라, 이러한 반복적인 소규모 프로세스를 점차 대신 처리해 줍니다.

DeepSeek V4 Flash와 Hermes가 잘 맞는 이유

최근 DeepSeek V4가 출시된 후, DeepSeek V4 Flash와 Hermes가 완벽한 조합이라는 것을 알게 되었습니다.

이유는 간단합니다. Hermes의 많은 작업에는 Opus 수준의 지능이 필요하지 않습니다. 극도로 복잡한 프로그래밍 문제를 해결하는 것이 아니라, 클리핑, 정리, 알림, 조회, 보관, 도구 호출 등이 주를 이룹니다.

이러한 작업에 필요한 것은 ‘매번 가장 똑똑한 모델이 오래 고민하는 것’이 아니라, 속도, 저비용, 장기 실행 능력입니다.

DeepSeek V4 Flash의 실제 사용 경험은 화면이 스크롤되는 듯한 느낌으로, 제 읽기 속도가 출력 속도를 따라잡지 못할 정도입니다. 지능은 확실히 Opus 4.7만큼 높지는 않지만, Hermes에는 충분합니다.

그래서 지금 추천하는 이유입니다. Hermes는 장기 온라인 개인 비서이며, 모델 비용과 응답 속도는 실제로 사용할 의향에 직접적인 영향을 미칩니다.

설치 및 설정

Hermes를 실행하려면 최소한 세 단계가 필요합니다.

  1. Hermes 설치.
  2. 모델 설정.
  3. WeChat 또는 Feishu 진입점 설정.

명령어, 메모리, Skills, 예약 작업 등은 필요할 때 나중에 배우면 됩니다.

평소와 같이 Hermes 설치는 한 줄로 끝납니다. Mac에서 시연하겠습니다.

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

설치 후 터미널에서 아무 곳에서나 hermes를 입력하여 시작할 수 있습니다. Claude Code나 Codex와 달리, 시작 여부와 관계없이 실제로 컴퓨터에서 백그라운드로 실행됩니다.

아, 그리고 이전에 OpenClaw를 사용한 적이 있다면, Hermes가 원활한 마이그레이션 명령어를 제공합니다. 다음을 입력하면 됩니다. 그냥 언급하는 것입니다.

hermes claw migrate

마이그레이션하지 않았다면, Hermes를 초기 설정해야 합니다.

hermes model

이 단계에서는 AI 제공자를 입력하라는 메시지가 표시됩니다. DeepSeek을 추천합니다. 빨간색 상자가 해당 옵션을 강조합니다. 맨 위에 있는 것이 공식 DeepSeek입니다. API Key를 입력하고 DeepSeek V4 Flash를 선택하면 됩니다.

아래 빨간색 상자에는 이전에 소개한 OpenCode Zen과 OpenCode Go가 있습니다.

Go 요금제는 제가 추천하는 사용 방법입니다. 월 10달러로 60달러 상당의 크레딧을 받을 수 있으며, Alipay로 결제하고 중국에서 직접 연결할 수 있습니다. DeepSeek V4 Flash를 사용하면 크레딧이 부족할 일이 없습니다.

물론 현재 가장 추천하는 것은 OpenCode Zen입니다. 한정 기간 동안 무료로 DeepSeek V4 Flash를 제공하기 때문입니다. 무료가 항상 최고입니다.

다음으로, WeChat에서 통신할 수 있도록 WeChat을 설정해 보겠습니다. 마찬가지로 Feishu도 설정할 수 있습니다.

hermes gateway setup

WeChat을 예로 들면, 선택하면 QR 코드가 나타나고 휴대폰으로 스캔할 수 있습니다. 이미 설정되어 있어 시연할 수 없으므로 건너뛰겠습니다.

설정이 완료되면 WeChat에 채팅 창이 생겨 직접 통신할 수 있습니다. 가장 중요한 명령어는 /new로, 새 대화를 시작할 수 있습니다. 이전 대화가 길어졌다면 이를 사용하여 새 대화로 전환할 수 있습니다.

구체적인 사용법

위의 두 단계를 설정하면 터미널에서 사용할 수 있습니다.

터미널에 hermes를 입력하여 시작하면 됩니다. Codex나 Claude Code와의 차이점은 특정 디렉토리로 이동할 필요 없이 터미널 어디에서나 입력할 수 있다는 것입니다. 항상 동일한 Hermes 인스턴스로 진입합니다.

여기에 ID가 있다는 점을 언급해야겠네요. 이 고유 ID를 사용하여 나중에 이 대화를 불러와 계속 채팅할 수 있습니다.

예를 들어, 여기 제 ID는 20260514_224631_850142입니다. 나중에 터미널 어디에서나 hermes -r 20260514_224631_850142를 입력하면 이 대화를 재개하여 계속 채팅할 수 있습니다.

많은 대화 중에서 필요한 ID를 찾는 방법은 이 장에서 다루지 않고 나중에 설명하겠습니다.

다시 주제로 돌아와서, 몇 가지 중요한 명령어에 대해 먼저 알아보겠습니다.

첫 번째는 /new로, 새 대화를 시작할 수 있습니다. Hermes에는 과거 대화를 조회하는 데 도움이 되는 내장 메모리 시스템이 있지만, 같은 대화에서 다른 주제를 논의하면 모델 성능이 저하될 수 있습니다. 따라서 새 대화를 시작하기 전에 한 주제를 완전히 마무리하는 것이 좋습니다.

두 번째 명령어는 /reasoning입니다. 추론 수준과 추론 과정 표시 여부를 포함한 추론 관련 설정을 관리합니다.

제 개인적인 습관은 추론 과정을 숨기는 것입니다. DeepSeek V4 Flash의 경우 추론 수준을 xhigh로 설정합니다.

따라서 각각 /reasoning hide/reasoning xhigh를 입력합니다.

이렇게 하면 아래에서 자유롭게 채팅할 수 있습니다.

Hermes의 독특한 점은 채팅 후 내부적으로 사용자에 대한 기억을 정리하여 선호도와 성향을 학습한다는 것입니다. 또한 일부 작업은 자동으로 Skills로 정리되며, 사용자의 행동에 따라 이러한 Skills를 수정합니다.

OpenClaw나 Claude Code에서는 관련 Skill을 만들도록 적극적으로 요청해야 하는 경우가 많지만, Hermes는 장기간 사용하면서 점차 사용자의 워크플로를 학습하는 방식에 가깝습니다.

Hermes를 사용해야 하는 사람

AI가 코드 작성을 도와주기만을 원한다면, 계속 Codex나 Claude Code를 사용해도 괜찮다고 생각합니다.

하지만 클리핑, 가계부, 알림, 일일 보고서, 자료 정리, WeChat 기사 작성, Obsidian 동기화 등 반복되는 소규모 프로세스가 많다면, Hermes의 가치가 드러납니다.

단순히 한 번 작업을 완료하는 것을 돕는 것이 아니라, 점차 사용자를 점점 더 잘 이해하는 백엔드 어시스턴트가 됩니다.

물론 이러한 유형의 도구에는 전제 조건이 있습니다. 컴퓨터에서 장기간 실행되고 점차 노트, 채팅 진입점, 워크플로에 액세스하는 것을 수용해야 합니다.

따라서 처음에는 너무 많은 것을 맡기지 않는 것이 좋습니다. 클리핑이나 알림과 같은 위험이 적은 시나리오부터 시작하세요. 안정적으로 도움을 줄 수 있다는 것을 확인한 후, 점차 더 복잡한 프로세스를 넘기십시오.

프로그래밍에 관하여

여기서 특별히 언급하고 싶은 것은, Hermes가 프로그래밍 작업도 할 수 있지만 Codex를 대체하지는 않는다는 점입니다.

동일한 GPT-5.5 모델을 사용하고 추론을 High로 설정한 후, Hermes와 Codex 모두에게 동일한 작업을 시켰습니다. Codex가 훨씬 더 강력했습니다.

정상적인 현상입니다. Codex는 프로그래밍 에이전트로 포지셔닝되어 있으며, 프로젝트에 깊이 들어가 코드를 읽고, 수정하고, 테스트를 실행하고, 문제를 해결하는 데 더 적합합니다. Hermes의 장점은 ‘가장 강력한 단일 세션 프로그래밍 능력’이 아니라 ‘장기 개인 진입점 및 명령 센터 역할’입니다.

따라서 제 접근 방식은 Hermes로 Codex를 대체하는 것이 아니라, 함께 작동하도록 하는 것입니다.

여기에는 두 가지 방법이 있습니다.

  1. Hermes는 터미널에서 Codex를 직접 호출할 수 있으므로, 작업을 Codex에 넘기고 결과를 자체적으로 검토하도록 할 수 있습니다.
  2. 수동으로 Codex를 시작하고 Hermes가 핸드오프 파일을 작성하도록 합니다. 각 AI가 작업을 수행한 후, 다른 AI가 읽을 수 있도록 핸드오프 파일을 수정합니다.

각각 초점이 다르기 때문에 어떤 사람들은 Hermes가 OpenClaw를 작동하도록 한다고 들었습니다.

그것은 제가 OpenClaw를 다시 사용하기 시작할지에 달려 있습니다. 하지만 지금은 Hermes로 충분하다고 느낍니다. 나중에 그렇게 된다면 다른 글을 쓰겠습니다.

요약

이 장에서 배운 내용:

  1. Hermes의 포지셔닝: Codex나 Claude Code를 대체하는 것이 아니라, 점차 사용자를 알아가는 장기 온라인 개인 비서에 가깝습니다.
  2. 적합한 시나리오: 클리핑, 가계부, 알림, 일일 보고서, WeChat 기사 워크플로, Obsidian 정리와 같은 반복적인 소규모 프로세스가 Hermes에 가장 적합합니다.
  3. 모델 선택: Hermes의 많은 작업에는 가장 강력한 모델이 필요하지 않습니다. 속도, 저비용, 장기 지속 가능성이 필요하므로 DeepSeek V4 Flash와 같은 모델이 매우 적합합니다.
  4. 최소 시작 경로: Hermes를 설치하고, 모델을 설정한 다음, WeChat 또는 Feishu 진입점을 설정하면 시작할 수 있습니다.
  5. 사용 습관: /new를 사용하여 다른 작업을 분리하고, /reasoning을 사용하여 추론 설정을 조정하며, 대화 ID를 사용하여 과거 대화를 불러옵니다.
  6. 프로그래밍 경계: Hermes는 프로그래밍을 할 수 있지만, 가장 강력한 프로그래밍 에이전트는 아닙니다. 명령 센터로 사용하여 명확한 프로그래밍 작업을 Codex에 넘기고, Hermes가 결과를 검토하고 연결하는 것이 좋습니다.

핵심 요점:

  • Hermes의 가치는 단일 작업 능력이 아니라 장기적인 동반과 프로세스 축적에 있습니다.
  • 단편적이고 반복적이며 도구를 넘나드는 소규모 작업을 대신 처리하는 데 적합합니다.
  • 습관을 기억하고 Skills를 축적하며 WeChat에서 언제든지 호출할 수 있는 개인 비서를 원한다면, Hermes는 순수 프로그래밍 도구보다 이 형태에 더 가깝습니다.

보너스: 한 단계 더 나아가고 싶은 분들을 위해