跳到主要内容

集成

Hermes Agent 连接到外部系统,用于 AI 推理、工具服务器、IDE 工作流、程序化访问等。这些集成扩展了 Hermes 的能力和运行范围。

AI 提供商与路由

Hermes 原生支持多种 AI 推理提供商。您可以使用 hermes model 进行交互式配置,或在 config.yaml 中设置它们。

  • AI 提供商 — OpenRouter、Anthropic、OpenAI、Google 以及任何兼容 OpenAI 的端点。Hermes 会自动检测每个提供商的能力,例如视觉、流式传输和工具使用。
  • 提供商路由 — 对哪些底层提供商处理您的 OpenRouter 请求进行精细控制。通过排序、白名单、黑名单和明确的优先级排序,优化成本、速度或质量。
  • 故障转移提供商 — 当您的主要模型遇到错误时,自动切换到备份 LLM 提供商。包括主要模型故障转移以及用于视觉、压缩和网页提取的独立辅助任务故障转移。

工具服务器 (MCP)

  • MCP 服务器 — 通过模型上下文协议(Model Context Protocol)将 Hermes 连接到外部工具服务器。无需编写原生的 Hermes 工具,即可访问来自 GitHub、数据库、文件系统、浏览器堆栈、内部 API 等的工具。支持 stdio 和 SSE 传输,支持按服务器过滤工具,以及具备能力感知的资源/提示注册。

网页搜索后端

web_searchweb_extract 工具支持四种后端提供商,通过 config.yamlhermes tools 进行配置:

后端环境变量搜索提取爬取
Firecrawl (默认)FIRECRAWL_API_KEY
ParallelPARALLEL_API_KEY
TavilyTAVILY_API_KEY
ExaEXA_API_KEY

快速设置示例:

web:
backend: firecrawl # firecrawl | parallel | tavily | exa

如果未设置 web.backend,后端将自动从任何可用的 API 密钥中检测。通过 FIRECRAWL_API_URL 也支持自托管的 Firecrawl。

浏览器自动化

Hermes 包含完整的浏览器自动化功能,提供多种后端选项用于浏览网站、填写表单和提取信息:

  • Browserbase — 带有反爬虫工具、CAPTCHA 解决和住宅代理的管理云浏览器
  • Browser Use — 替代的云浏览器提供商
  • 通过 CDP 的本地 Chrome — 使用 /browser connect 连接到您正在运行的 Chrome 实例
  • 本地 Chromium — 通过 agent-browser CLI 的无头本地浏览器

有关设置和使用,请参阅 浏览器自动化

语音与 TTS 提供商

跨所有消息平台的文本转语音和语音转文本:

| 提供商 | 质量 | 成本 | API 密钥 | ||----------|---------|------|---------| || Edge TTS (默认) | 良好 | 免费 | 无需 | || ElevenLabs | 优秀 | 付费 | ELEVENLABS_API_KEY | || OpenAI TTS | 良好 | 付费 | VOICE_TOOLS_OPENAI_KEY | || MiniMax | 良好 | 付费 | MINIMAX_API_KEY | || NeuTTS | 良好 | 免费 | 无需 |

语音转文本支持三种提供商:本地 Whisper(免费,设备端运行)、Groq(快速云端)和 OpenAI Whisper API。语音消息转录可在 Telegram、Discord、WhatsApp 和其他消息平台工作。有关详细信息,请参阅 语音与 TTS语音模式

IDE 与编辑器集成

  • IDE 集成 (ACP) — 在 ACP 兼容的编辑器(如 VS Code、Zed 和 JetBrains)中使用 Hermes Agent。Hermes 作为 ACP 服务器运行,将聊天消息、工具活动、文件差异和终端命令渲染到您的编辑器内部。

程序化访问

  • API 服务器 — 将 Hermes 暴露为兼容 OpenAI 的 HTTP 端点。任何使用 OpenAI 格式的前端(如 Open WebUI、LobeChat、LibreChat、NextChat、ChatBox)都可以连接并使用 Hermes 作为后端,并利用其完整的工具集。

记忆与个性化

  • 内置记忆 — 通过 MEMORY.mdUSER.md 文件实现的持久化、精选记忆。代理维护着个人笔记和用户配置文件数据的有限存储,这些数据可以在会话之间保留。
  • 记忆提供商 — 插入外部记忆后端以实现更深层次的个性化。支持七个提供商:Honcho(辩证推理)、OpenViking(分层检索)、Mem0(云端提取)、Hindsight(知识图谱)、Holographic(本地 SQLite)、RetainDB(混合搜索)和 ByteRover(基于 CLI)。

消息平台

Hermes 作为网关机器人运行在 15 多个消息平台,所有平台都通过同一个 gateway 子系统进行配置:

有关平台比较表和设置指南,请参阅 消息网关概览

家庭自动化

  • Home Assistant — 通过四个专用工具(ha_list_entitiesha_get_stateha_list_servicesha_call_service)控制智能家居设备。当配置了 HASS_TOKEN 时,Home Assistant 工具集会自动激活。

插件

  • 插件系统 — 在不修改核心代码的情况下,使用自定义工具、生命周期钩子和 CLI 命令扩展 Hermes。插件从 ~/.hermes/plugins/、项目本地的 .hermes/plugins/ 和 pip 安装的入口点发现。
  • 构建插件 — 逐步指南,用于创建具有工具、钩子和 CLI 命令的 Hermes 插件。

训练与评估

  • RL 训练 — 从代理会话生成轨迹数据,用于强化学习和模型微调。支持具有可自定义奖励函数的 Atropos 环境。
  • 批量处理 — 并行运行代理处理数百个提示,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。