🎯 做完你会得到
服务器不再需要你盯着,问题自动发现、自动修复、修复后通知你
🛠 需要什么
- tmux
- github
👤 适合谁
- 在家里跑 NAS 或者服务器的技术用户
- 不想半夜被服务挂掉叫醒的开发者
- 想让服务器自动维护的人
⚡ 效果预览
服务挂了3分钟内自动重启,SSL 证书到期前30天提醒,磁盘超过80%自动清理日志
🔧 Step 0:先确认外部工具配置
⚠️ 本案例依赖外部工具(Telegram/Notion/飞书等),先确认已配置 👉 查看常用工具配置指南 →
解决什么问题
家庭服务器没有专职运维,出了问题只有你。服务半夜挂掉可能要到第二天才发现,SSL 证书过期了网站直接挂,磁盘悄悄满了某天突然什么都存不了……让 OpenClaw 帮你盯着,有问题自动处理,处理完告诉你。
最简上手:直接发这句话
帮我设置家庭服务器的自动监控。
服务器 IP 是 [你的服务器IP],SSH 用户名是 [用户名]。
需要监控:
1. 这几个服务是否在运行:[服务名列表]
2. 磁盘使用率(超过80%告警)
3. SSL 证书到期时间(提前30天提醒)
发现问题先尝试自动修复,修复完发消息给我说明情况。
完整配置步骤
第一步:配置 SSH 访问
先让 OpenClaw 能通过 SSH 连接你的服务器:
帮我设置服务器监控:
- 服务器:[IP地址]
- 用户:[用户名]
- SSH Key 路径:[~/.ssh/id_rsa 或其他]
先测试一下能否正常连接。
第二步:定义监控规则
监控规则:
服务检查(每5分钟):
- nginx:nginx -t 检查配置,systemctl is-active nginx
- docker 容器:确保所有 running 状态
- 数据库:检查连接是否正常
磁盘监控(每小时):
- 超过80%:清理30天前的日志文件
- 超过90%:立即通知我,等待指示
证书监控(每天):
- 检查所有域名的 SSL 证书到期时间
- 30天内到期:提醒我
- 7天内到期:每天提醒
第三步:设置自愈策略
自愈策略(按风险从低到高):
- 服务崩溃:先尝试 systemctl restart [服务名],失败了再通知我
- 磁盘满:只删除日志文件,不删任何数据文件
- 网络问题:ping 3次确认后再处理,避免误判
所有自动操作完成后,发消息告诉我发生了什么、我做了什么、结果如何
效果是什么
- 服务挂了通常能在3-5分钟内自动恢复
- 证书过期、磁盘满等问题提前发现
- 不再需要手动写复杂的 cron 脚本
- 所有操作有日志,出问题能追溯
注意事项
- 自愈操作要保守,只做风险低的(重启、清日志),高风险操作(删数据)一定要你确认
- 先在测试环境跑1-2天,确认监控规则准确再在生产环境用
- SSH Key 权限要控制好,只给最小必要权限
- OpenClaw 本身运行的机器要稳定,不能用同一台服务器监控自己
#服务器运维#自动监控#自愈#家庭服务器
⚔️ 同类副本推荐 ⚔️