运维监控
大约 3 分钟
运维监控
页面导读
适用场景适合生产环境上线后巡检服务状态、定位故障、查看日志和维护定时任务。
前置条件已完成部署,具备服务器、容器、数据库和平台管理员权限。
检查对象后端、前端、MySQL、Redis、EMQX、时序库、ZLMediaKit、定时任务和业务日志。
验收点核心服务运行稳定,关键链路可用,日志可追踪,告警和工单能形成闭环。
一、每日巡检清单
| 检查项 | 检查内容 | 异常处理 |
|---|---|---|
| Web 页面 | 登录、首页、产品、设备页面可访问 | 查看 Nginx、后端和浏览器控制台 |
| 后端服务 | 进程或容器运行,日志无连续异常 | 查看后端日志并重启异常服务 |
| MySQL | 连接数、慢 SQL、磁盘空间 | 优化 SQL、扩容磁盘、清理日志 |
| Redis | 内存、连接、Key 过期策略 | 清理异常缓存,检查密码和网络 |
| EMQX | 客户端连接、认证、订阅、规则 | 检查认证接口和端口 |
| 时序库 | 写入、查询、磁盘占用 | 检查数据保留策略 |
| ZLMediaKit | 直播、回放、Hook、录像 | 检查媒体服务日志 |
| 定时任务 | 报表、维保、同步任务是否执行 | 查看任务日志和 Quartz 状态 |
二、常用命令
Docker 部署环境:
cd /var/data
docker-compose ps
docker ps
docker logs -n 300 java
docker logs -n 200 nginx
docker logs -n 200 emqx
docker statsLinux 服务检查:
free -h
df -h
top
ss -lntup三、平台内运维入口
| 入口 | 用途 |
|---|---|
| 系统监控 > 在线用户 | 查看当前在线登录用户 |
| 系统监控 > 操作日志 | 查看用户关键操作 |
| 系统监控 > 登录日志 | 查看登录成功、失败记录 |
| 系统监控 > 定时任务 | 查看和维护 Quartz 任务 |
| 运维管理 > 通知日志 | 查看通知发送结果 |
| 设备详情 > 设备日志 | 查看设备上报、下发和异常 |
| 视频中心 | 查看通道、流媒体、录像状态 |
四、业务链路巡检
每次上线或升级后,至少跑一遍最小业务链路:
- 登录后台。
- 新建或选择测试产品。
- MQTTX 模拟设备上线。
- 上报属性数据。
- 平台下发指令。
- 触发规则或告警。
- 发送通知。
- 生成工单或报表。
五、常见问题
页面可打开但接口报错
检查后端服务、Nginx 代理、接口前缀、登录 Token、后端日志和数据库连接。
设备大面积离线
检查 EMQX、MQTT 端口、认证接口、服务器网络、安全组和最近是否升级协议配置。
报表或维保没有自动执行
检查定时任务状态、服务器时间、Quartz 表、任务日志和集群环境是否重复或漏执行。
视频播放不稳定
检查 ZLMediaKit、带宽、浏览器协议兼容、摄像头网络和流媒体端口。
