RL RanceLee Tutorials
← Voltar aos tutoriais

Hermes Primeiros Passos: Recortes, Contabilidade, Lembretes e WeChat

No capítulo anterior, abordamos o Open Minis, que coloca um Agente no seu celular. Este capítulo segue uma direção diferente e apresenta um Agente mais próximo de um “assistente pessoal”: o Hermes.

No começo, eu não estava muito otimista em relação ao Hermes. Depois de usar o OpenClaw, percebi que não tinha tantas coisas que precisava que ele gerenciasse para mim, e não queria usar uma ferramenta só por usar.

Mas depois de testá-lo por um tempo, descobri que o Hermes é bem diferente das ferramentas que usei antes.

Como o Hermes se Diferencia de Outras Ferramentas

Pela minha experiência, o principal uso do Codex e do Claude Code ainda é escrever código. Você dá a eles um projeto claro, um bug claro, um requisito claro, e eles entram, modificam arquivos, rodam testes e corrigem problemas. A capacidade deles nessa área é muito forte.

O Hermes, por outro lado, é mais como uma ferramenta de agente pessoal que vai te conhecendo aos poucos, algo como um assistente pessoal.

O foco dele não é concluir uma tarefa de programação única e extremamente complexa, mas sim ter conversas de longo prazo com você, lembrar suas preferências, entender seu fluxo de trabalho e então destilar processos recorrentes em Skills (Habilidades). Na próxima vez que você fizer algo parecido, ele não começa do zero; ele continua te ajudando com a experiência acumulada.

Quanto ao OpenClaw, sinto que ele é mais voltado para gerenciamento de projetos ou equipes. Ele certamente pode atuar como assistente pessoal, mas não me dá a sensação de “ficar com você na vida e no trabalho a longo prazo” como o Hermes faz.

Claro, isso é apenas minha impressão pessoal, não uma regra absoluta. Na verdade, qualquer um dos três cenários que mencionei pode ser tratado com qualquer uma dessas ferramentas; elas apenas diferem em quão bem se encaixam em cada cenário.

Ferramenta Para que prefiro usar Sensação
Codex / Claude Code Escrever código, modificar projetos, rodar testes Capacidade de engenharia mais forte, adequado para tarefas de programação bem definidas
Hermes Assistente pessoal de longo prazo, entrada pelo WeChat, tarefas agendadas, memória e Skills Te conhece melhor com o tempo, adequado para aqueles pequenos fluxos de trabalho pessoais recorrentes
OpenClaw Gerenciamento de projetos, divisão de tarefas, colaboração em equipe Mais como um agente de gerenciamento de projetos/equipe, não exatamente um assistente pessoal

Se eu tivesse que resumir em uma frase:

Codex e Claude Code são mais como “Eu tenho um projeto agora, vem me ajudar a fazer.” Hermes é mais como “Primeiro, fique ao meu lado e gradualmente assuma meus hábitos e fluxos de trabalho.”

Para que Uso o Hermes Atualmente

Não vou falar sobre instalação primeiro, porque para a maioria das pessoas, a pergunta realmente importante não é “como instalar”, mas “o que ele pode realmente fazer por mim”.

Atualmente, uso o Hermes para esses tipos de coisas.

  1. Recortes (Clipping).

Anteriormente, eu recomendava o Web Clipper oficial do Obsidian, mas não uso mais. Porque eu simplesmente envio a página web diretamente para o Hermes, e ele consegue recortar o artigo no Obsidian para mim.

Se for um vídeo do Bilibili ou YouTube, ele baixa, envia para IA fazer a transcrição de fala para texto, depois corrige erros de digitação e remove conteúdo de anúncios. Quando abro o Obsidian, vejo um artigo bem organizado.

  1. Contabilidade.

Muitas pessoas usavam Atalhos (Shortcuts) para contabilidade antes, e eu ainda uso como um dos meus métodos, mas realmente não gosto de depurar Atalhos — é muito cansativo.

Agora eu simplesmente envio os detalhes da contabilidade diretamente para ele em um chat do WeChat, e ele imediatamente os escreve no Notion. Mas devo mencionar que construí uma pequena plataforma própria; tanto os Atalhos quanto o Hermes enviam comandos para minha plataforma.

Claro, também existe uma versão local desse recurso de contabilidade que não requer o Notion. Escreverei um artigo dedicado sobre isso mais tarde.

  1. Escrever artigos para o WeChat.

Escrever um artigo para o WeChat envolve quase 13 etapas, incluindo seleção de tópico, escrita à mão, edição, publicação e muito mais. Agora delego todos esses processos para o Hermes lidar passo a passo.

Além disso, embora eu tenha apresentado anteriormente o Claudian, uma ótima ferramenta de IA para Obsidian, na verdade uso o Hermes para operar o Obsidian.

  1. Definir lembretes.

Sou um usuário pesado do TickTick, não consigo viver sem ele todos os dias, mas configurar tarefas no TickTick é bastante trabalhoso.

Especialmente quando suas tarefas envolvem semanas ou meses específicos no futuro, ou a cada poucos meses em quartas e quintas-feiras, configurar essas tarefas requer vários cliques. Agora posso simplesmente enviar linguagem natural para o Hermes e fazer com que ele as configure no TickTick em segundo plano.

  1. Relatórios diários.

Todas as manhãs às 7h30, peço para ele me enviar um resumo de notícias das últimas 12 horas. Além disso, trabalho como trader de ações, então após o fechamento do mercado todos os dias, peço para ele compilar informações do mercado e criar um relatório diário de negociação.

  1. Várias outras pequenas tarefas.

Na verdade, é aqui que o Hermes brilha.

Muitas coisas individualmente são pequenas, não valem a pena escrever um programa ou abrir um software complexo. Mas elas se repetem diariamente, semanalmente, mensalmente e gradualmente se tornam um desgaste.

Esse é o valor do Hermes: ele não apenas ajuda você a concluir uma tarefa uma vez; ele gradualmente assume esses pequenos processos recorrentes.

Por que DeepSeek V4 Flash e Hermes são uma Combinação Perfeita

Depois que o DeepSeek V4 foi lançado recentemente, descobri que o DeepSeek V4 Flash e o Hermes são uma combinação perfeita.

O motivo é simples: muitas tarefas no Hermes não exigem inteligência de nível Opus. Não se trata necessariamente de resolver problemas de programação extremamente complexos; é mais sobre recortar, organizar, lembrar, consultar, arquivar e chamar ferramentas.

O que essas tarefas precisam não é “o modelo mais inteligente pensando por muito tempo toda vez”, mas velocidade, baixo custo e capacidade de funcionar a longo prazo.

A experiência real com o DeepSeek V4 Flash parece que ele está rolando a tela; minha velocidade de leitura não acompanha a velocidade de saída dele. Sua inteligência certamente não é tão alta quanto a do Opus 4.7, mas é mais que suficiente para o Hermes.

É por isso que recomendo agora: o Hermes é um assistente pessoal online de longo prazo, e o custo do modelo e a velocidade de resposta afetam diretamente se você está disposto a realmente usá-lo.

Instalação e Configuração

Se você só quer colocar o Hermes para funcionar, o caminho mínimo são três etapas:

  1. Instalar o Hermes.
  2. Configurar o modelo.
  3. Configurar a entrada do WeChat ou Feishu.

Você pode aprender sobre comandos, memória, Skills e tarefas agendadas mais tarde, quando precisar.

Como de costume, instalar o Hermes é um comando único. Vou demonstrar em um Mac.

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Após a instalação, você pode iniciá-lo digitando hermes em qualquer lugar do terminal. Observe que, ao contrário do Claude Code ou Codex, quer você o inicie ou não, ele na verdade roda em segundo plano no seu computador.

Ah, e se você já usou o OpenClaw antes, o Hermes fornece um comando de migração perfeita. Basta digitar isso. Só mencionando.

hermes claw migrate

Se você não migrou, precisará configurar o Hermes inicialmente.

hermes model

Esta etapa pede que você preencha um provedor de IA. Recomendo o DeepSeek; a caixa vermelha destaca a opção correspondente. A primeira é o DeepSeek oficial. Basta inserir sua chave de API e selecionar DeepSeek V4 Flash.

A caixa vermelha abaixo contém OpenCode Zen e OpenCode Go, que apresentei anteriormente.

O plano Go é um método de uso que recomendo. Por US$ 10 por mês, você recebe US$ 60 em créditos, e pode pagar com Alipay e conectar diretamente da China. Se você usar DeepSeek V4 Flash, nunca vai acabar.

Claro, o mais recomendado agora é o OpenCode Zen, porque oferece DeepSeek V4 Flash gratuito por tempo limitado. Grátis é sempre melhor.

Em seguida, vamos configurar o WeChat para que você possa se comunicar com ele pelo WeChat. Da mesma forma, você também pode configurar o Feishu.

hermes gateway setup

Usando o WeChat como exemplo, depois de selecioná-lo, um código QR aparecerá e você poderá escaneá-lo com seu celular. Já configurei o meu, então não posso demonstrar e vou pular.

Após a configuração bem-sucedida, você terá uma janela de chat no WeChat onde poderá se comunicar diretamente. O comando mais importante é /new, que permite iniciar uma nova conversa. Se sua conversa anterior já durou muito tempo, você pode usar isso para mudar para uma nova.

Uso Específico

Depois de configurar as duas etapas acima, podemos usá-lo no terminal.

Basta digitar hermes no terminal para iniciar. A diferença do Codex e Claude Code é que você não precisa entrar em um diretório específico; pode digitar em qualquer lugar do terminal. Você sempre entrará na mesma instância do Hermes.

Devo mencionar que há um ID aqui; você pode recuperar esta conversa mais tarde e continuar conversando usando este ID único.

Por exemplo, meu ID aqui é 20260514_224631_850142. Mais tarde, posso simplesmente digitar hermes -r 20260514_224631_850142 em qualquer lugar do terminal para retomar esta conversa e continuar conversando.

Quanto a como encontrar o ID necessário entre muitas conversas, abordaremos isso mais tarde, não neste capítulo.

Agora voltando ao tópico, vamos primeiro falar sobre alguns comandos importantes.

O primeiro é /new, que permite iniciar uma nova conversa. Embora o Hermes tenha um sistema de memória embutido que o ajuda a consultar conversas históricas, discutir tópicos diferentes na mesma conversa ainda pode degradar o desempenho do modelo. Portanto, recomendo terminar um tópico completamente antes de iniciar uma nova conversa.

O segundo comando é /reasoning. Ele gerencia configurações relacionadas ao raciocínio, incluindo seu nível de raciocínio e se deve exibir o processo de raciocínio.

Meu hábito pessoal é ocultar o processo de raciocínio. Para o DeepSeek V4 Flash, defino o nível de raciocínio como xhigh.

Então inserimos /reasoning hide e /reasoning xhigh respectivamente.

Depois de fazer isso, você pode conversar feliz com ele abaixo.

O que é único no Hermes é que, depois que você conversa, ele organiza internamente memórias sobre você, aprendendo suas preferências e inclinações. Além disso, algumas de suas operações serão automaticamente organizadas em Skills, e ele modificará essas Skills com base em suas ações.

Ao contrário do OpenClaw ou Claude Code, onde muitas vezes você precisa pedir ativamente para ele criar uma Skill relevante, o Hermes é mais como se ele gradualmente aprendesse seus fluxos de trabalho ao longo do uso a longo prazo.

Quem Deve Usar o Hermes

Se você só quer que a IA ajude a escrever algum código, acho que pode continuar usando Codex ou Claude Code.

Mas se você tem muitos pequenos processos recorrentes, como recortes, contabilidade, lembretes, relatórios diários, organização de materiais, escrita de artigos para WeChat, sincronização do Obsidian, então o valor do Hermes se torna aparente.

Ele não apenas ajuda você a concluir uma tarefa uma vez; ele gradualmente se torna um assistente de back-end que te entende cada vez melhor.

Claro, há um pré-requisito para este tipo de ferramenta: você precisa aceitar que ele rode a longo prazo no seu computador e gradualmente acesse suas anotações, pontos de entrada de chat e fluxos de trabalho.

Então sugiro não assumir muito no começo. Comece com cenários de baixo risco, como recortes e lembretes. Depois de confirmar que ele pode ajudá-lo de forma confiável, gradualmente passe processos mais complexos para ele.

Sobre Programação

Quero mencionar especificamente aqui que, embora o Hermes também possa fazer trabalhos de programação, ele não substitui o Codex.

Usei o mesmo modelo GPT-5.5 com raciocínio definido como Alto, e pedi que tanto o Hermes quanto o Codex fizessem a mesma tarefa. O Codex foi significativamente mais forte.

Isso é normal. O Codex é posicionado como um agente de programação; ele é mais adequado para mergulhar em um projeto para ler código, modificar código, rodar testes e corrigir problemas. A vantagem do Hermes não é “capacidade de programação em sessão única mais forte”, mas “pode servir como seu ponto de entrada pessoal de longo prazo e centro de comando”.

Então minha abordagem não é substituir o Codex pelo Hermes, mas fazê-los trabalhar juntos.

Tenho dois métodos aqui:

  1. O Hermes pode chamar diretamente o Codex do terminal, então você pode fazer com que ele passe tarefas para o Codex e depois revise os resultados ele mesmo.
  2. Eu inicio o Codex manualmente e peço ao Hermes para escrever um arquivo de handoff. Depois que cada IA realiza suas operações, elas modificam o arquivo de handoff para a outra ler.

Ouvi dizer que algumas pessoas até fazem o Hermes operar o OpenClaw, já que cada um tem seu foco.

Quanto a isso, depende se vou começar a usar o OpenClaw novamente. Mas por enquanto, sinto que o Hermes é suficiente. Se eu fizer isso mais tarde, escreverei outro artigo.

Resumo

O que Aprendemos Neste Capítulo:

  1. Posicionamento do Hermes: Não é um substituto para o Codex ou Claude Code; é mais como um assistente pessoal online de longo prazo que gradualmente te conhece.
  2. Cenários Adequados: Pequenos processos recorrentes como recortes, contabilidade, lembretes, relatórios diários, fluxos de trabalho de artigos do WeChat e organização do Obsidian são mais adequados para o Hermes.
  3. Seleção de Modelo: Muitas tarefas no Hermes não exigem o modelo mais forte; elas precisam de velocidade, baixo custo e sustentabilidade a longo prazo, então modelos como DeepSeek V4 Flash são muito adequados.
  4. Caminho Mínimo de Integração: Instale o Hermes, configure o modelo, depois configure a entrada do WeChat ou Feishu, e você pode começar.
  5. Hábitos de Uso: Use /new para separar diferentes tarefas, use /reasoning para ajustar configurações de raciocínio e use IDs de conversa para recuperar conversas passadas.
  6. Limites da Programação: O Hermes pode fazer programação, mas não é o agente de programação mais forte. É melhor usá-lo como um centro de comando, deixando-o passar tarefas de programação claras para o Codex, com o Hermes revisando e conectando os resultados.

Principais Conclusões:

  • O valor do Hermes não é sua capacidade de tarefa única, mas sua companhia de longo prazo e acúmulo de processos.
  • Ele é adequado para assumir pequenas tarefas fragmentadas, repetitivas e que cruzam ferramentas.
  • Se você quer um assistente pessoal que lembra hábitos, acumula Skills e pode ser chamado a qualquer momento pelo WeChat, o Hermes está mais próximo dessa forma do que uma ferramenta de programação pura.

Bônus: Para Aqueles Ansiosos para Levar ao Próximo Nível