Hermes Desktop 桌面版实测 | 一招绕开"无法自定义API"的坑

本文是【大模型API中转站】系列篇。本系列致力于用最低的成本、最清晰的方法，帮你打通多模型 API 的任督二脉。建议先收藏，随用随查。

Nous Research 刚刚把它家的开源 AI Agent —— Hermes 做成了桌面应用（Hermes Agent v0.15.2，MIT 开源），支持 macOS / Windows / Linux 三端一键安装。这意味着你不用再折腾命令行环境，下载即用。但实测下来有一个绕不开的坑：桌面版当前无法在图形界面里直接填自定义 API（base_url + key），必须中断当前运行的模型、用 hermes model 手动重选一次才能生效。本文带你把它跑起来，并给出这个 bug 的稳妥规避姿势。

下载地址（官方）：https://hermes-agent.nousresearch.com/desktop

1. 开篇：我为什么需要这个方案

痛点：很多人想用 Hermes 接 Claude、GPT 这些主力模型，却卡在几个老问题上——

官方 API 注册难、网络不通，国内直连经常超时；
按量付费太贵，多模型分别开通账号、各管各的 Key，管理成本高；
Hermes 桌面版虽然号称"provider-agnostic、支持你自己的 endpoint"，但 GUI 里那个自定义 API 入口目前是残的——填了不生效，必须走命令行兜底。

场景：你是一个国内开发者 / 独立创作者，想用 Hermes 这种"一个 Agent 管全平台（Telegram、Discord、Slack、邮件、CLI）"的工具，统一接入你手上已有的中转 API（比如通过 4sapi 这类中转站拿到的 OpenAI 兼容 Key），结果在桌面版第一步就卡住了。

本文目标：给你一条"国内 → 中转 → Claude/GPT"在 Hermes Desktop 上的可行通路，附带完整配置步骤，并重点讲清楚如何绕开"无法在 GUI 自定义 API"这个 bug。

2. Hermes 到底强在哪：六大能力一次看懂

先别急着配置，得让你知道这玩意儿为什么值得折腾。Hermes 不是又一个套壳聊天框，它是 Nous Research 打磨的"会成长的 Agent"——一句官方 slogan 叫 "The Agent That Grows With You"。实测下来，它真正能打的地方有六块：

① Connect · 一个分身，活在所有平台。 这是我最想吹的一点。Hermes 不是只待在桌面窗口里，它能同时接管 Telegram、Discord、Slack、WhatsApp、Signal、邮件和 CLI——而且所有平台共享同一份记忆。你在 Slack 上交代的事，回头在 Telegram 上问它照样记得。一个 Agent，七个入口，再也不用在十个 App 之间复制粘贴上下文。

② Remember · 持久记忆 + 自动长技能。 它会记住你的项目、你的习惯，甚至把解决过的问题自动沉淀成可复用的"技能"。用得越久越顺手，越像一个真正懂你的老搭档，而不是每次都从零开始的金鱼脑。

③ Schedule · 自然语言定时，无人值守跑。 想让它每天早上 8 点给你出一份行业简报？每周自动备份？直接用大白话说一句就行，剩下的它通过网关在后台默默跑，不用你守着。

④ Delegate · 子 Agent 并发，任务翻倍。 Hermes 能开出一堆互相隔离的子 Agent，每个有自己独立的对话、终端和 Python RPC 脚本，互不抢上下文。复杂流水线拆给子分身并行处理，主线程一点不卡——这才是"一个人当一个团队用"。

⑤ Search · 不止聊天，能上网、能看图、能出图。 内置 Web 搜索、浏览器自动化、视觉识别、图像生成、文字转语音，还有多模型协同推理。一句话：它能真正"动手干活"，而不是只会嘴上说。

⑥ Experiment · 五种沙箱后端，安全隔离。 本地、Docker、SSH、Singularity、Modal 五选一，配合容器加固和命名空间隔离。想让它跑点有风险的代码？丢沙箱里随便造，炸了也伤不到你的主机。

一句话总结：它把"连接 + 记忆 + 定时 + 委派 + 上网 + 沙箱"打包进了一个开源（MIT）桌面应用里。 而这六块能力全都要靠底层大模型撑着——模型够强、够快、够便宜，Hermes 才能发挥到满血。

而这恰恰是关键：Hermes 越强，越吃模型。 它的多模型推理、子 Agent 并发、视觉与出图，每一项都在烧 token。如果你用官方按量付费，多平台 7×24 跑下来账单很可观；想又快又省，把模型这一层换成稳定的中转 API 才是正解。后面方案二会教你怎么把它接到 4sapi 这类 OpenAI 兼容中转上，一把 Key 喂饱上面所有功能。

3. 原理速览

Hermes 本身是"模型无关（provider-agnostic）"的，它不锁定任何一家。请求的真实流向是这样：

你的应用 / Hermes Desktop
        ↓
   中转服务（国内云服务器 / OpenAI 兼容网关）
        ↓
   Claude / GPT 官方 API

中转站这一层帮你处理了三件事：

格式转换：把 OpenAI 格式的请求转成 Claude 格式（反之亦然），让 Hermes 一套配置打通多模型；
身份验证：用中转分发的 Key 调用，避免官方 Key 直接暴露；
限流 / 计费：统一计量，多模型共用一个余额池。

Hermes 支持的 Provider 很全：Nous Portal、OpenRouter、OpenAI、z.ai/GLM、Kimi/Moonshot、MiniMax、Hugging Face…… 以及最关键的 "Your own endpoint"（自定义 OpenAI 兼容端点）。我们要用的就是最后这一条——把 endpoint 指向中转站（如 4sapi），就能用一把 Key 同时驱动 Claude、GPT、Gemini 等多家模型，省去逐个开户、各自充值的麻烦。

4. 方案

方案一：官方直连（Nous Portal）

最省事的路子是直接用官方的 Nous Portal。一条命令搞定 OAuth 登录、设定 Nous 为 Provider、并开启工具网关：

hermes setup --portal

Portal 自带 300+ 模型、统一订阅（Free / Plus / Super / Ultra 四档），还顺带把 Web 搜索、图像生成、TTS、云端浏览器都包了。适合不想折腾、能接受官方计费的人。

缺点：要海外支付、按 Portal 的定价走，国内访问 Claude/GPT 仍可能受网络影响，且无法用你已有的中转 Key 省钱。

方案二：中转站接入（重点，含 bug 规避）

如果你想接入自己的中转 API（OpenAI 兼容），就走这条。注意：桌面版 GUI 的自定义 API 表单当前有 bug，光在界面里填不生效，必须配合命令行手动重选模型。 下面是实测可行的完整流程。

1）环境准备

安装 Hermes Desktop：
- Windows：下载 Hermes-Setup.exe（Win10/11）
- macOS：下载 Hermes-Setup.dmg（macOS 12+）
- Linux：按官网终端命令安装
准备好你的中转 API：一个 OpenAI 兼容的 base_url 和一把 api_key。还没有的话，可以去 4sapi 注册一个——控制台里直接拿 OpenAI 兼容的 base_url 和 key，支持 Claude / GPT / Gemini 等主流模型共用一把 Key，国内可直连，正好喂给 Hermes 上面那六大功能。

2）先在 GUI 里走一遍（确认 bug）

打开桌面版，进入设置里的模型 / Provider 配置，选 "Your own endpoint / Custom"，填入 base_url 和 key。你会发现：保存后并不会真正切到你的自定义端点，对话仍然走默认模型或直接报错。这就是当前那个未修复的 bug——GUI 写入没有正确落到运行时配置。

3）中断运行 + 命令行手动重选（关键步骤）

正确的兜底姿势是绕过 GUI 表单，用命令行写配置并强制重选模型：

# 第一步：中断当前正在运行的 Hermes 模型
#   - CLI 里按 Ctrl+C，或直接发一条新消息打断
#   - 消息平台里发 /stop

# 第二步：把自定义端点写进配置（OpenAI 兼容）
hermes config set provider custom
hermes config set base_url https://4sapi.com/v1
hermes config set api_key sk-你的中转Key

# 第三步：手动重选模型，让配置真正生效
hermes model
#   在交互菜单里选 "Your own endpoint / Custom"，
#   再选择具体模型（如 claude-3-7-sonnet / gpt-4o 等）

核心原因：Hermes 的模型加载发生在 hermes model 这一步。GUI 改了配置但没触发重新加载，所以必须先中断、再用 hermes model 手动重选一次，新端点才会被真正挂载。

4）启动并测试

# 对话中临时切换 / 验证模型也可以用 slash 命令
/model custom:claude-3-7-sonnet

# 然后随便问一句，确认走的是你的中转端点

如果回复正常、计费走的是你中转账户的余额，就说明自定义 API 接通了。以后每次想换模型，对话里直接 /model provider:model 即可，不必再重启。

提示：在官方修复 GUI 表单之前，"中断 → hermes model 手动重选" 是唯一稳定的接入方式，记得收藏。

5. 成本与风险提示

成本构成：中转服务器/网关费用（如果自建）+ 中转站按量计费 + 官方模型实际消耗。用中转站的主要收益是多模型共用余额、省去多账号管理，以及国内可直连。考虑到 Hermes 的子 Agent 并发和多模型推理很吃 token，选一个计费透明、单价划算的中转（比如 4sapi）能把长期账单压下来不少。
数据隐私：请求会经过中转层，敏感数据（密钥、用户隐私、企业内部信息）传输前请评估是否脱敏，选可信的中转服务。
合规提醒：本文只讨论 OpenAI 兼容端点的正常接入与配置优化，不涉及绕过官方风控或违规用途。请遵守各模型厂商的使用条款。
生产环境：当前自定义 API 的 GUI bug 尚未修复，命令行兜底虽稳但属临时方案，不建议直接用于生产环境，等官方 release 修复后再上线更稳妥。

6. 总结与系列导航

一句话总结适用人群：想用 Hermes Desktop 统一管理多平台 AI Agent、又手握中转 API 想省钱的国内开发者和独立创作者——可以上，但记住"GUI 填 API 暂时无效，必须中断后用 hermes model 手动重选"这个坑。

如果你有更顺手的 Hermes 自定义 API 配置方法，或者发现官方已经修了这个 bug，欢迎在评论区分享你的方案，我会更新到文末。中转 API 推荐自取：4sapi。