集成
Hermes 智能体通过集成连接到外部系统,用于 AI 推理、工具服务器、IDE 工作流、编程访问等。这些集成扩展了 Hermes 的功能和运行范围。
从这里开始
如果您只有时间设置一个集成,请设置 Nous Portal —— 一次 OAuth 登录即可覆盖 300 多个模型以及四个工具网关工具(网页搜索、图像生成、TTS 和浏览器自动化)。
AI 供应商与路由
Hermes 开箱即用地支持多个 AI 推理供应商。使用 hermes model 进行交互式配置,或在 config.yaml 中设置。
- AI 供应商 —— OpenRouter、Anthropic、OpenAI、Google 以及任何兼容 OpenAI 的端点。Hermes 会自动检测每个供应商的视觉、流式传输和工具使用等能力。
- 供应商路由 —— 精细化控制哪些底层供应商处理您的 OpenRouter 请求。通过排序、白名单、黑名单和显式优先级排序来优化成本、速度或质量。
- 备用供应商 —— 当您的主模型遇到错误时,自动切换到备用 LLM 供应商。包括主模型回退和用于视觉、压缩和网络提取的独立辅助任务回退。
工具服务器 (MCP)
- MCP 服务器 —— 通过模型上下文协议将 Hermes 连接到外部工具服务器。无需编写原生 Hermes 工具即可访问来自 GitHub、数据库、文件系统、浏览器堆栈、内部 API 等的工具。支持 stdio 和 SSE 传输、按服务器进行工具过滤,以及感知能力的资源/提示注册。
网页搜索后端
web_search 和 web_extract 工具支持四个后端供应商,通过 config.yaml 或 hermes tools 配置:
| 后端 | 环境变量 | 搜索 | 提取 | 爬取 |
|---|---|---|---|---|
| Firecrawl (默认) | FIRECRAWL_API_KEY | ✔ | ✔ | ✔ |
| Parallel | PARALLEL_API_KEY | ✔ | ✔ | — |
| Tavily | TAVILY_API_KEY | ✔ | ✔ | ✔ |
| Exa | EXA_API_KEY | ✔ | ✔ | — |
快速设置示例:
web:
backend: firecrawl # firecrawl | parallel | tavily | exa
如果未设置 web.backend,后端将根据可用的 API 密钥自动检测。自托管的 Firecrawl 也通过 FIRECRAWL_API_URL 支持。
浏览器自动化
Hermes 包含完整的浏览器自动化功能,支持多种后端选项,用于导航网站、填写表单和提取信息:
- Browserbase —— 托管云浏览器,配备反机器人工具、验证码解决和住宅代理
- Browser Use —— 替代云浏览器供应商
- 本地 Chromium 系列 CDP —— 使用
/browser connect连接到您正在运行的 Chrome、Brave、Chromium 或 Edge 浏览器 - 本地 Chromium —— 通过
agent-browserCLI 运行的无头本地浏览器
详情请参阅 浏览器自动化 的设置和用法。
语音与 TTS 供应商
跨所有消息平台的文本转语音和语音转文本:
| 供应商 | 质量 | 费用 | API 密钥 |
|---|---|---|---|
| Edge TTS (默认) | 良好 | 免费 | 无需 |
| ElevenLabs | 优秀 | 付费 | ELEVENLABS_API_KEY |
| OpenAI TTS | 良好 | 付费 | VOICE_TOOLS_OPENAI_KEY |
| MiniMax | 良好 | 付费 | MINIMAX_API_KEY |
| xAI TTS | 良好 | 付费 | XAI_API_KEY |
| NeuTTS | 良好 | 免费 | 无需 |
语音转文本支持六个供应商:本地 faster-whisper(免费,在设备上运行)、本地命令包装器、Groq、OpenAI Whisper API、Mistral 和 xAI。语音消息转录适用于 Telegram、Discord、WhatsApp 和其他消息平台。详情请参阅 语音与 TTS 和 语音模式。
IDE 与编辑器集成
- IDE 集成 (ACP) —— 在 ACP 兼容的编辑器(如 VS Code、Zed 和 JetBrains)中使用 Hermes 智能体。Hermes 作为 ACP 服务器运行,在您的编辑器内呈现聊天消息、工具活动、文件差异和终端命令。
编程访问
- API 服务器 —— 将 Hermes 暴露为兼容 OpenAI 的 HTTP 端点。任何使用 OpenAI 格式的前端——Open WebUI、LobeChat、LibreChat、NextChat、ChatBox——都可以连接并使用 Hermes 作为后端及其完整工具集。
记忆与个性化
- 内置记忆 —— 通过
MEMORY.md和USER.md文件进行持久化、整理的记忆。智能体维护有限的个人笔记和用户配置文件数据存储,这些数据跨会话保留。 - 记忆供应商 —— 接入外部记忆后端以实现更深层次的个性化。支持八个供应商:Honcho(辩证推理)、OpenViking(分层检索)、Mem0(云端提取)、Hindsight(知识图谱)、Holographic(本地 SQLite)、RetainDB(混合搜索)、ByteRover(基于 CLI)和 Supermemory。
消息平台
Hermes 在 27 个以上消息平台作为网关机器人运行,全部通过同一个 gateway 子系统配置:
- Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, 电子邮件, 短信, 钉钉, 飞书, 企业微信, 企业微信回调, 微信, BlueBubbles, QQ 机器人, 元宝, Home Assistant, Microsoft Teams, Microsoft Teams 会议, Microsoft Graph Webhook, Google Chat, LINE, ntfy, SimpleX, Open WebUI, Webhooks
请参阅 消息网关概述 获取平台比较表和设置指南。
家庭自动化
- Home Assistant —— 通过四个专用工具(
ha_list_entities、ha_get_state、ha_list_services、ha_call_service)控制智能家居设备。当配置了HASS_TOKEN时,Home Assistant 工具集会自动激活。
插件
- 插件系统 —— 无需修改核心代码即可扩展 Hermes,添加自定义工具、生命周期钩子和 CLI 命令。插件从
~/.hermes/plugins/、项目本地的.hermes/plugins/和 pip 安装的入口点中发现。 - 构建插件 —— 创建包含工具、钩子和 CLI 命令的 Hermes 插件的分步指南。
训练与评估
- 批量处理 —— 在数百个提示词上并行运行智能体,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。