内容纲要
前端收集
查看是否开启manager HA
manager页面 管理-manager高可用,如果出现未开启的提示,不要开启。

查看集群节点
manager页面 管理-节点,检查能否正确获取到所有节点的配置、ip是否正确。

查看tos健康情况
manager页面 管理-TOS,检查该服务是否健康

查看许可证状态
manager页面 管理-许可证,确认serverkey、过期时间及服务健康状态

查看guardian健康情况
manager页面 管理-Guardian,检查该服务是否健康

查看服务整体健康情况
manager首页

后端收集
manager节点收集
# 集群概况
kubectl get nodes;
kubectl get po -owide -n kube-system;
kubectl get po -owide|sort -nr -k 2
集群所有节点收集
# 服务概况
systemctl status transwarp-manager-agent;
systemctl status kubelet;
systemctl status haproxy;
systemctl status docker;
# 资源情况
free -g;
df -hT|head -n 20;