11gR2 RAC: 修复了发生故障的Interconnect后,不会启动被排除节点的CSS

适用范围:

Oracle Database – Enterprise Edition – 版本从 11.2.0.2 到 11.2.0.3 [版本 11.2]
这个文章的内容适用于所有平台。
现象

[可能产生的现象]
修复了发生故障的Interconnect后,不会开始被排除节点的CSS

変更点

[可能发生的条件]
满足以下条件的话就可能发生。
-没有修复 Interconnect故障时

原因

[原因]
产品故障。
根本原因是发生Interconnect故障后的对策中,network interface的clean up处理后执行的一部分处理中出现了问题。
由此,即使成功clean up成功也会显示为失败,修复了Interconnect故障后,也不会开始已排查的节点中的CSS。

* 发生这种情况的特征
从ohas 中的 orarootagent.log 开始执行HAIP ,查看是否成功。如果通过ifconfig 查看到对应的HAIP无法分割时,那就是这种情况了。

* GI PSU 11.2.0.3.3中包含修正。

对策

[回避对策]

修复Interconnect故障时,请执行以下操作。

 

  1. 终止被排除的节点的 Grid Infrastructure。

注意)请在修复完成Interconnect故障之前执行。

 

请通过root用户执行。

GI_HOME/bin/crsctl stop crs -f

 

  1. 修复Interconnect故障

 

  1. 启动终止的 Grid Infrastructure

 

通过root用户执行。

GI_HOME/bin/crsctl start crs

 

终止被排除的节点的 Grid Infrastructure 之前,如果修复了Interconnect的话,用这个方法来处理就无法获得预期效果。修复完成时,请重启生存节点的OS来处理。

 

 

[发生故障后的对策]

以及修复完成Interconnect故障时,请通过以下方法来处理。

 

1) 拔出各节点的Private LAN,确认无法疏通节点之间的状态之后。

执行[回避对策]中的操作

 

2) 重启生存节点的GI

 

3) 上述方法无法恢复时,重启OS

 

* 1)方法无法成功时,会报告,请继续尝试之后的对策

 

Comment

*

沪ICP备14014813号-2

沪公网安备 31010802001379号