2008年11月26日星期三

Cluster节点切换的监控方法--基于系统日志

对于MS cluster环境,有时候需要对Cluster状态进行监控,下面给出了针对系统日志监控的参考数据


Event Source: ClusSvc
非活动节点重起:
N1非活动节点,N2活动节点

1. Node Mgr N2节点心跳找不到N1 1123
2. Node Mgr N2节点公网找不到N1 1123
3. Node Mgr N1节点从cluster中去除 1135
4. Node Mgr N2节点确定心跳线连接丢失×3 1124
5. Node Mgr N2节点重新通过心跳连接到N1 1122
6. Node Mgr N2节点通过公网连接到N1 1122
7. Node Mgr 确定N1节点在公网可用 1125
8. Node Mgr 确定N1节点在内网可用 1125
9. Startup/Shutdown N1节点加入cluster 1062
10. Event Logger 节点间时间差量 1202


手工切换过程

场景假设:
N1非活动节点,N2活动节点

1. Failover Mgr N1节点尝试上线win cluster 1200
2. Failover Mgr N2节点尝试下线win cluster 1203
3. Failover Mgr N2节点下线win cluster成功 1204
4. Failover Mgr N1节点上线win cluster成功 1201
5. Failover Mgr N2节点尝试下线sql cluster 1203
6. Resource Monitor N2节点下线Sql失败 1117
7. Failover Mgr N2节点上下线sql group 失败 1205
8. Failover Mgr N1节点尝试上线sql group 1200
9. Failover Mgr N1节点上线sql group成功 1201
10. Event Logger 统计N1、N2节点差量 1202

砖头:
在系统日志里检索到
Event Source: ClusSvc
Event ID: 1135, 1203
=>Cluster节点下线

在系统日志里检索到
Event Source: ClusSvc
Event ID: 1062, 1201
=>Cluster节点上线