当 AI Agent 遇上运维自动化:我的实践踩坑之路#
花了几天把 AI Agent 集成到日常运维里,踩了不少坑,记录下来供参考。
1. 为什么要用 AI Agent#
简单说就是:太累了。
天天手动处理重复的事务:
- 定时查邮件汇总
- 定时看 X 上的 AI 动态
- 定时检查服务状态
- 定时任务提醒
用脚本也能做,但每次加新需求都要改代码。换成 Agent 之后,用自然语言就能调整任务,方便很多。
2. 用的是啥#
核心是 OpenClaw,一个开源的 AI Agent 框架。
搭配的工具:
- MCP:扩展 Agent 能力,接了 Teambition、TickTick、智谱 GLM
- Cron:定时触发任务
- Telegram/Signal:接收消息和推送
3. 踩过的坑#
3.1 模型配置#
写配置的时候经常手滑:
- 模型名写成
claude-sonnet-4-6,实际应该是anthropic-local/claude-sonnet-4-6 - fallback 模型定义了但 provider 没配够
- 本地模型认证有时候抽风
解决方案:写完配置跑 openclaw status 检查一下。
3.2 Cron 任务#
定时任务看着简单,其实坑不少:
- agentTurn 类型任务必须带 model 字段,不带就报错
- systemEvent 类型不需要 model
- 任务超时设太短会中途卡死
3.3 MCP 服务#
- 配置文件路径要写绝对路径
- 调用格式用简化的 key=value 比 JSON 方便
3.4 Skills#
- 加载路径必须是绝对路径
- Skill 名字大小写敏感
4. 怎么用的#
举几个实际例子:
邮件汇总:每 4 小时跑一次,读取 Apple Mail 未读邮件,推送到大屏 + 发送到手机。
AI 资讯:定时刷 X (Twitter),用 bird CLI 抓 trends,归类整理后推送。
任务提醒:接了 TickTick MCP,定时检查逾期任务和今日待办,推送提醒。
5. 经验总结#
- 从小处着手:先跑通一个简单任务,再逐步加功能
- 配置要仔细:很多问题都是配置写错导致的
- 日志很重要:出问题先看日志,大部分错误信息很有用
- 善用 MCP:能力不够 MCP 来凑
6. 后续想法#
- 继续优化提示词,让 Agent 回答更准确
- 尝试接入更多服务
- 看看能不能用 Agent 做代码审查
有相关问题欢迎交流,一起踩坑一起进步。
