跳到正文
🔵 社区案例 — 基于社区验证案例改编 实战 开发工具

家庭服务器自动监控 + 自愈

OpenClaw 7×24小时盯着你的服务器,服务挂了自动重启,证书要过期了提前提醒,磁盘满了自动清理

⚔️ 难度 ★★★ 实战
⏱ 配置耗时 1小时
🎁 掉落 节省 1小时
📜 所需秘籍 tmux github
🦞 部署 可一键部署

🎯 做完你会得到

服务器不再需要你盯着,问题自动发现、自动修复、修复后通知你

🛠 需要什么

  • tmux
  • github

👤 适合谁

  • 在家里跑 NAS 或者服务器的技术用户
  • 不想半夜被服务挂掉叫醒的开发者
  • 想让服务器自动维护的人

⚡ 效果预览

服务挂了3分钟内自动重启,SSL 证书到期前30天提醒,磁盘超过80%自动清理日志

🔧 Step 0:先确认外部工具配置

⚠️ 本案例依赖外部工具(Telegram/Notion/飞书等),先确认已配置 👉 查看常用工具配置指南 →

解决什么问题

家庭服务器没有专职运维,出了问题只有你。服务半夜挂掉可能要到第二天才发现,SSL 证书过期了网站直接挂,磁盘悄悄满了某天突然什么都存不了……让 OpenClaw 帮你盯着,有问题自动处理,处理完告诉你。

最简上手:直接发这句话

帮我设置家庭服务器的自动监控。
服务器 IP 是 [你的服务器IP],SSH 用户名是 [用户名]。
需要监控:
1. 这几个服务是否在运行:[服务名列表]
2. 磁盘使用率(超过80%告警)
3. SSL 证书到期时间(提前30天提醒)

发现问题先尝试自动修复,修复完发消息给我说明情况。

完整配置步骤

第一步:配置 SSH 访问

先让 OpenClaw 能通过 SSH 连接你的服务器:

帮我设置服务器监控:
- 服务器:[IP地址]
- 用户:[用户名]
- SSH Key 路径:[~/.ssh/id_rsa 或其他]
先测试一下能否正常连接。

第二步:定义监控规则

监控规则:
服务检查(每5分钟):
- nginx:nginx -t 检查配置,systemctl is-active nginx
- docker 容器:确保所有 running 状态
- 数据库:检查连接是否正常

磁盘监控(每小时):
- 超过80%:清理30天前的日志文件
- 超过90%:立即通知我,等待指示

证书监控(每天):
- 检查所有域名的 SSL 证书到期时间
- 30天内到期:提醒我
- 7天内到期:每天提醒

第三步:设置自愈策略

自愈策略(按风险从低到高):
- 服务崩溃:先尝试 systemctl restart [服务名],失败了再通知我
- 磁盘满:只删除日志文件,不删任何数据文件
- 网络问题:ping 3次确认后再处理,避免误判
所有自动操作完成后,发消息告诉我发生了什么、我做了什么、结果如何

效果是什么

  • 服务挂了通常能在3-5分钟内自动恢复
  • 证书过期、磁盘满等问题提前发现
  • 不再需要手动写复杂的 cron 脚本
  • 所有操作有日志,出问题能追溯

注意事项

  • 自愈操作要保守,只做风险低的(重启、清日志),高风险操作(删数据)一定要你确认
  • 先在测试环境跑1-2天,确认监控规则准确再在生产环境用
  • SSH Key 权限要控制好,只给最小必要权限
  • OpenClaw 本身运行的机器要稳定,不能用同一台服务器监控自己
#服务器运维#自动监控#自愈#家庭服务器