1. 生产案例
- 清理节点

- 重启节点

- 删除异常 Pod

- 巡检集群

2. 两步快速配置
第一步,配置 mcp
将这段配置丢给 OpenClaw,OpenClaw 会帮你配置好。
| |
第二步,安装 skills
告诉 OpenClaw 安装一个 ops-mcp-server 的 skills。
| |
这样你就可以开始根据自己的需求,养殖一只运维用的 OpenClaw 了。
3. 怎么对接 OpenClaw
不仅要让 OpenClaw 长出手脚,能够执行具体的任务;还需要长出眼睛能观测系统的运行状态。
执行任务主要依赖于一些 SOP。有了这些标准操作流程,我们才能放心大胆地将执行环节交给 OpenClaw。可以参考之前的文章 你也可以这样落地 AI Agent - SOPS 篇 。
运维的观测,不仅仅是指标、日志、链路,还有事件,可以参考之前的文章 你也可以这样落地 AI Agent - 运维事件篇 。事件是一个更好的观测维度,事件伴随的是变更,而变更是稳定性最大的敌人、是最需要关注的维度。
这些能力,我们都通过 ops-mcp-server 导出给 OpenClaw。其实,不仅仅是导出给 OpenClaw,我们开发的一些 Vibe coding 的项目,也都是基于 ops-mcp-server。如果内部没有现成的能力层网关,使用 mcp server 对外提供统一的访问入口是一个非常不错的选择。
4. OpenClaw 的运维飞轮
OpenClaw 是一个具有自我进化能力的系统。为什么你会感觉 OpenClaw 越用越聪明,越来越懂你?因为 OpenClaw 在不断地循环于尝试处理、接受反馈、优化方法。几个来回之后,OpenClaw 很容易就能拿到一个不错的分数。
OpenClaw 需要一个飞轮。OpenClaw 需要知道运维对象的状态,需要能检查系统的状态,需要能修改系统状态,需要再次去确认运维对象的状态。而这些就是需要我们提供给 OpenClaw 的能力,可以是一个接口、一个脚本、一个 CLI 等。

如上图,如果能提供这些完整的能力给 OpenClaw,那么 OpenClaw 就会用飞轮给我们带来无限的可能性。
