早上收到一个老客户其单位Oracle11G RAC节点1异常无法启动数据库,并且所有的应用程序无法连接数据库的CASE,于是我方远程客户DB服务器进行排查,发现RAC有很多资源启动失败:

问题现象:

1, Oracle 11g RAC集群中的节点1无法启动CRS服务,数据库也无法启动;

2, 当前Oracle 11g RAC数据库无法连接,TNS访问提示找不到正确的连接字符。

 

解决过程:

问题1:尝试手动启动RAC节点1的各项服务:crsctl start crs 

查看节点1的集群日志,发现有大量的磁盘访问报错:

Unable to discover any voting files, retrying discovery in 15 seconds

Unable to discover any voting files, retrying discovery in 15 seconds

Unable to discover any voting files, retrying discovery in 15 seconds

Unable to discover any voting files, retrying discovery in 15 seconds

Unable to discover any voting files, retrying discovery in 15 seconds

Unable to discover any voting files, retrying discovery in 15 seconds

Unable to discover any voting files, retrying discovery in 15 seconds

经过一段时间等待,最后节点1的集群服务启动失败,根据我方经验,此问题很可能是节点1与存储的连通性发生了故障,经与客户协商,建议客户更换其链路端口或接口介质,客户到达机房后,按照我方建议做了调整后,RAC节点1的服务正常启动,但此时虽然数据库启动了,但VIP,SCAN IP等资源仍然OFFLINE