跳到主要内容

功能概览

Hermes 智能体包含丰富的功能,远远超出基本的聊天范畴。从持久化记忆、感知文件上下文到浏览器自动化和语音对话,这些功能协同工作,使 Hermes 成为一个强大的自主助手。

核心功能

  • 工具与工具集 — 工具是扩展智能体能力的函数。它们被组织成逻辑工具集,可按平台启用或禁用,涵盖网络搜索、终端执行、文件编辑、记忆、委派等。
  • 技能系统 — 智能体可按需加载的知识文档。技能遵循渐进式披露模式以最小化 token 使用,并与 agentskills.io 开放标准兼容。
  • 持久化记忆 — 有界且经过筛选的记忆,在会话间持续存在。Hermes 通过 MEMORY.mdUSER.md 记住您的偏好、项目、环境以及它所学到的内容。
  • 上下文文件 — Hermes 自动发现并加载项目上下文文件(.hermes.mdAGENTS.mdCLAUDE.mdSOUL.md.cursorrules),这些文件塑造其在项目中的行为方式。
  • 上下文引用 — 输入 @ 后跟一个引用,即可将文件、文件夹、git diff 和 URL 直接注入消息中。Hermes 会内联展开引用并自动附加内容。
  • 检查点 — Hermes 在进行文件更改前会自动对工作目录创建快照,为您提供安全网,以便在出现问题时通过 /rollback 回滚。

自动化

  • 计划任务 (Cron) — 使用自然语言或 cron 表达式安排任务自动运行。任务可附加技能、将结果传递至任何平台,并支持暂停/恢复/编辑操作。
  • 子智能体委派delegate_task 工具会生成具有隔离上下文、受限工具集和独立终端会话的子智能体实例。默认运行 3 个并发子智能体(可配置)以实现并行工作流。
  • 代码执行execute_code 工具允许智能体编写 Python 脚本,以编程方式调用 Hermes 工具,通过沙盒 RPC 执行将多步骤工作流压缩为单个 LLM 轮次。
  • 事件钩子 — 在关键生命周期点运行自定义代码。网关钩子处理日志记录、警报和 webhook;插件钩子处理工具拦截、指标和防护措施。
  • 批处理 — 并行运行 Hermes 智能体处理数百或数千个提示,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。

媒体与网络

  • 语音模式 — 在 CLI 和消息平台之间实现完整的语音交互。使用麦克风与智能体交谈,听取语音回复,并在 Discord 语音频道中进行实时语音对话。
  • 浏览器自动化 — 支持多种后端的完整浏览器自动化:Browserbase 云、Browser Use 云、通过 CDP 的本地 Chrome 或本地 Chromium。导航网站、填写表单并提取信息。
  • 视觉与图像粘贴 — 多模态视觉支持。将剪贴板中的图像粘贴到 CLI 中,并让智能体使用任何支持视觉的模型对其进行分析、描述或处理。
  • 图像生成 — 使用 FAL.ai 根据文本提示生成图像。支持八种模型(FLUX 2 Klein/Pro、GPT-Image 1.5、Nano Banana Pro、Ideogram V3、Recraft V4 Pro、Qwen、Z-Image Turbo);可通过 hermes tools 选择其一。
  • 语音与 TTS — 在所有消息平台上提供文本转语音输出和语音消息转录,支持五种提供商选项:Edge TTS(免费)、ElevenLabs、OpenAI TTS、MiniMax 和 NeuTTS。

集成

  • MCP 集成 — 通过 stdio 或 HTTP 传输连接任何 MCP 服务器。无需编写原生 Hermes 工具即可访问来自 GitHub、数据库、文件系统和内部 API 的外部工具。包括每服务器工具过滤和采样支持。
  • 提供商路由 — 精细控制哪些 AI 提供商处理您的请求。通过排序、白名单、黑名单和优先级排序优化成本、速度或质量。
  • 备用提供商 — 当主模型遇到错误时,自动故障转移到备用 LLM 提供商,包括对辅助任务(如视觉和压缩)的独立故障转移。
  • 凭据池 — 将 API 调用分布在同一提供商的多个密钥上。在速率限制或失败时自动轮换。
  • 记忆提供商 — 插入外部记忆后端(Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover),以实现跨会话用户建模和个性化,超越内置记忆系统。
  • API 服务器 — 将 Hermes 暴露为 OpenAI 兼容的 HTTP 端点。连接任何支持 OpenAI 格式的前端 — Open WebUI、LobeChat、LibreChat 等。
  • IDE 集成 (ACP) — 在 ACP 兼容的编辑器(如 VS Code、Zed 和 JetBrains)中使用 Hermes。聊天、工具活动、文件差异和终端命令在编辑器内呈现。
  • RL 训练 — 从智能体会话生成轨迹数据,用于强化学习和模型微调。

自定义

  • 个性与 SOUL.md — 完全可自定义的智能体个性。SOUL.md 是主要身份文件 — 系统提示中的第一项 — 您可以按会话切换内置或自定义 /personality 预设。
  • 皮肤与主题 — 自定义 CLI 的视觉呈现:横幅颜色、旋转器图标和动词、响应框标签、品牌文本以及工具活动前缀。
  • 插件 — 无需修改核心代码即可添加自定义工具、钩子和集成。三种插件类型:通用插件(工具/钩子)、记忆提供商(跨会话知识)和上下文引擎(替代上下文管理)。通过统一的 hermes plugins 交互式 UI 管理。