引言
当你搜索 Hermes Agent 功能 时,真正想了解的是:它能做什么、能解决哪些问题。本文提供 Hermes Agent 的完整能力清单,包括 15 个内置工具 + 81 个技能 + 4 个消息平台 = 100 项能力,帮助你快速建立能力地图并规划试点。
若你关心套餐与部署方案,可先 查看方案;需要官方协助,请 联系我们。
🧠 核心能力(内置工具)
Hermes Agent 内置 15 个核心工具,覆盖日常开发、文件操作、系统交互等基础能力:
- Shell 命令执行 — 在沙箱环境中安全执行系统命令
- 文件读写 — 创建、编辑、搜索代码和文档
- 代码分析 — 语法解析、依赖分析、重构建议
- Web 搜索 — 实时搜索最新信息
- 网页抓取 — 提取和解析网页内容
- 图片理解 — 多模态视觉分析
- 代码执行 — Python/JavaScript 实时运行
- 数据库查询 — SQL 执行与结果分析
- API 调用 — RESTful/GraphQL 接口交互
- Git 操作 — 版本控制完整支持
- Docker 管理 — 容器构建与编排
- 进程管理 — 后台任务监控
- 环境变量 — 配置管理
- 定时任务 — Cron 调度
- Webhook — 事件触发
📡 连接的消息平台
Hermes Agent 支持 17 种消息平台,主要推荐以下 4 个:
| 平台 | 配置难度 | 特点 |
|---|
| 飞书/Lark | ⭐⭐⭐ | 企业首选,卡片交互,我们提供 Hermes Agent 飞书配置小助手 |
| Telegram | ⭐⭐ | 国际用户首选,Bot API 完善 |
| Discord | ⭐⭐ | 社区场景,丰富的集成能力 |
| 微信 | ⭐ | 配置简单但有封号风险 |
完整平台配置指南请参考:Hermes Agent 消息平台配置
🛠️ 技能库(81 个技能,18 个类别)
🤖 自主 AI 代理
将编码任务委派给专业 AI 代理:
| 技能 | 描述 |
|---|
| Claude Code | 委派编码任务给 Anthropic CLI 代理 |
| Codex | 委派编码任务给 OpenAI Codex CLI 代理 |
| OpenCode | 委派编码任务给 OpenCode CLI 代理 |
| Hermes Agent | 自身使用/扩展/配置完整指南 |
🎨 创意内容
生成各类创意内容和可视化:
| 技能 | 描述 |
|---|
| 架构图生成 | 专业暗色系系统架构图(HTML/SVG) |
| ASCII Art | 571 种字体 + cowsay + 图片转 ASCII |
| ASCII 视频 | 任意输入转彩色 ASCII 字符视频(MP4/GIF) |
| Excalidraw | 手绘风格流程图/架构图 |
| 创意发散 | 生成项目灵感 |
| Manim 视频 | 3Blue1Brown 风格数学动画 |
| p5.js | 交互式生成艺术/数据可视化/Shader |
| 网页设计系统 | 54 套生产级设计模板(Stripe/Linear/Vercel 等) |
| 歌曲创作 & AI 音乐 | Suno 音乐生成技巧 |
🔬 数据科学
| 技能 | 描述 |
|---|
| Jupyter Live Kernel | 状态式 Python 迭代探索 |
⚙️ DevOps
| 技能 | 描述 |
|---|
| Cron 时区 | 正确处理定时任务时区 |
| Webhook 订阅 | 外部事件触发代理运行 |
📧 邮件
| 技能 | 描述 |
|---|
| Himalaya | CLI 管理 IMAP/SMTP 邮件 |
🎮 游戏
| 技能 | 描述 |
|---|
| Minecraft 服务器 | 搭建 Mod 服务器 |
| Pokemon 自动玩 | 无头模拟器自动打游戏 |
🐙 GitHub
完整的 GitHub 工作流支持:
| 技能 | 描述 |
|---|
| 代码库分析 | LOC/语言构成统计 |
| GitHub 认证 | HTTPS/SSH/gh auth 自动设置 |
| 代码审查 | PR diff 分析 + inline 评论 |
| Issue 管理 | 创建/搜索/标签/关联 PR |
| PR 工作流 | 完整 PR 生命周期(分支→提交→CI→合并) |
| 仓库管理 | 克隆/创建/Fork/远程/Secrets/Release |
🍔 生活
| 技能 | 描述 |
|---|
| 附近搜索 | OpenStreetMap 找餐厅/咖啡馆等(无需 API) |
🔌 MCP 协议
| 技能 | 描述 |
|---|
| mcporter | CLI 调用任意 MCP 服务器工具 |
| Native MCP | 自动发现并注册 MCP 工具为原生 Hermes 工具 |
🎬 媒体
| 技能 | 描述 |
|---|
| GIF 搜索 | Tenor 搜索下载 GIF |
| HeartMuLa | 开源音乐生成模型(Suno 类) |
| Songsee | 音频频谱/特征可视化 |
| YouTube 内容 | 视频字幕提取→摘要/博客/结构化内容 |
🧪 ML/MLOps(20 个技能)
机器学习全生命周期支持:
| 类别 | 技能 |
|---|
| 音频生成 | AudioCraft |
| 微调 | Axolotl / TRL / Unsloth / PEFT |
| 量化 | GGUF 转换 |
| 推理 | vLLM / llama.cpp |
| 评估 | LM Eval Harness |
| 实验追踪 | Weights & Biases |
| 结构化输出 | Outlines / Guidance |
| 视觉模型 | CLIP / SAM / Stable Diffusion / Whisper |
| 分布式训练 | FSDP |
| 模型管理 | HuggingFace Hub |
| 提示工程 | DSPy |
| GPU 计算 | Modal GPU |
| 红队测试 | Obliteratus |
📝 笔记
| 技能 | 描述 |
|---|
| Obsidian | 读写搜索 Obsidian vault 笔记 |
📋 生产力
| 技能 | 描述 |
|---|
| Google Workspace | Gmail/Calendar/Drive/Sheets/Docs 集成 |
| 想法冰柜 | 结构化想法管理 + 定期盘点 |
| Linear | 项目管理 Issue CRUD |
| nano-pdf | 自然语言编辑 PDF |
| Notion | API 创建/搜索/更新页面和数据库 |
| OCR & 文档 | PDF/扫描件文字提取 |
| PowerPoint | 创建/编辑/解析 .pptx |
🔴 红队
📚 研究
| 技能 | 描述 |
|---|
| arXiv | 学术论文搜索检索 |
| Blogwatcher | RSS/博客监控 |
| 竞品调研 | 系统化竞品和市场分析 |
| SaaS 竞品调研 | SaaS/AI 产品专项调研 |
| 域名调研 | 关键词组合批量查域名可用性 |
| 技能发现 | 搜索发现 OpenClaw 技能 |
| LLM Wiki | Karpathy 风格持久知识库 |
| Polymarket | 预测市场数据查询 |
| 论文写作 | ML/AI 论文端到端写作管线 |
🏠 智能家居
| 技能 | 描述 |
|---|
| OpenHue | Philips Hue 灯光控制 |
📱 社交媒体
| 技能 | 描述 |
|---|
| Xitter | X/Twitter 发帖/搜索/互动 |
💻 软件开发
| 技能 | 描述 |
|---|
| Plan 模式 | 只规划不执行 |
| 代码审查流水线 | 预提交安全扫描 + 质量门 |
| 子代理驱动开发 | 按计划拆分任务并行实现 |
| 系统化调试 | 4 阶段根因分析(不瞎猜先理解) |
| 测试驱动开发 | RED-GREEN-REFACTOR 循环 |
| 写计划 | 多步骤任务的详细实施计划 |
🧠 特殊视角
| 技能 | 描述 |
|---|
| Dogfood | 系统化 QA 测试 Web 应用 |
Hermes Agent 聊天命令
Hermes Agent 聊天命令让助理在对话里保持可控:例如查看帮助、切换模型、加载技能、清理上下文、执行系统信息查询或搜索等。命令体系的意义在于降低培训成本——同事只要记住少量指令,就能完成常见操作。
更完整的命令清单可参考:Hermes Agent 聊天命令完整参考
Hermes Agent 服务端命令
Hermes Agent 服务端命令用于启动、停止、查看状态、查看日志、更新版本、管理技能与配置等。它解决的是「服务是否健康」的问题,而不是单条对话体验的问题。
更完整的 CLI 说明见:Hermes Agent 服务端命令完整参考
能力总计
| 类别 | 数量 |
|---|
| 内置工具 | 15 个 |
| 技能库 | 81 个 |
| 消息平台 | 17 个(主推 4 个) |
| 总计 | 100+ 项能力 🚀 |
落地建议
- 第一周:完成模型与密钥配置,跑通最小对话
- 第二周:接入飞书/Telegram 机器人,验证消息平台集成
- 第三周:用技能系统沉淀 3 个最高频使用场景
- 持续迭代:根据团队需求探索更多技能和自动化工作流
结论
Hermes Agent 功能 的核心不是「堆特性清单」,而是把模型、命令、技能、记忆、编排与消息平台串成一条可运营链路。无论你是开发者、运维人员还是团队管理者,都能在这 100+ 项能力中找到提升效率的切入点。
若你准备开始试点或扩容,请先 查看方案。对架构与安全有疑问,欢迎 联系我们。