HP ProLiant 服务器硬盘红灯的含义及注意事项


问题
硬盘灯显示为红色,是机器硬盘出故障吗?怎么样进一步的确定硬盘故障点及后续故障检测操作? 本文您为提供详细的指导。

解决方案
硬盘红灯通常是硬盘故障灯告警的表示(SCSI硬盘红灯可能被管理工具选中或者故障),提示硬盘可能已经出现异常情况或者故障,为了保证数据安全,首先建议尽可能备份重要数据,并且不要轻易插拔硬盘,避免误操作导致数据风险。

如果硬盘出现红灯告警,根据硬盘不同告警状态可以作初始判断和定位。硬盘指示灯状态定义参考如下图标:

SAS 和 SATA 硬盘 LED 指示灯状态
在线/活动LED灯(绿色)
故障/UID LED灯(红色/蓝色)
解释
亮,不亮,或者闪烁
交替亮红色和蓝色
硬盘故障,或者预告性故障报警;同时被管理工具选中
亮,不亮,或者闪烁
蓝色
硬盘状态正常,同时被管理工具选中
红色,规律性闪烁(1HZ)
预告性故障报警,硬盘需要更换
不亮
硬盘在线,非活动状态
规律性闪烁(1HZ)
红色,规律性闪烁(1HZ)
不要移除硬盘,移除硬盘可能终止当前操作导致数据丢失。 硬盘当前状态为参加阵列容量扩容或者迁移,同时有预告性故障报警。为使数据丢失风险降低到最低,不要移除硬盘直到扩容或迁移完成
规律性闪烁(1HZ)
不亮
不要移除硬盘,移除硬盘可能终止当前操作导致数据丢失 硬盘当前状态为重建,或者参加阵列容量扩容或者迁移
不规律性闪烁
红色,规律性闪烁(1HZ)
硬盘活动状态,同时有预告性故障报警,硬盘需要更换
不规律性闪烁
不亮
硬盘活动状态,当前有正常数据操作
不亮
红色
硬盘故障状态,控制器已将该硬盘置于离线,硬盘需要更换
不亮
红色,规律性闪烁(1HZ)
预告性故障报警,硬盘需要更换
不亮
不亮
硬盘状态为离线,热备盘或者没有配置到阵列中

*参考文档:HP ProLiant DL380 G6 Server Maintenance and Service Guide–June 2009 (Fourth Edition)

热插拔 SCSI 硬盘 LED 指示灯状态
活动LED
在线LED
故障LED
解释
亮,不亮或者闪烁
亮或者不亮
闪烁
预告性故障报警,硬盘需要更换
亮,不亮或者闪烁
不亮
硬盘在线,并且被配置到阵列中。
满足以下情况,可以更换该硬盘:硬盘被配置到冗余性阵列中并且所有硬盘都在线,有过预告性故障告警或者硬盘在扩容操作中。
亮,或者闪烁
闪烁
不亮
不要移除硬盘,移除硬盘可能终止当前操作导致数据丢失。
硬盘当前状态为重建中或者扩容操作
不亮
不亮
不要移除硬盘。
硬盘状态为被访问中。同时,1、没有被配置到阵列中。2、新更换的硬盘等待重建。3、设备启动过程中被检测到的硬盘。
闪烁
闪烁
闪烁
不要移除硬盘,移除非冗余性硬盘可能导致数据丢失。可能以下任一情况,1、作为阵列中的硬盘被阵列配置工具选中。2、硬盘判定为被HP SIM工具选中。3、硬盘固件升级中。
不亮
不亮
硬盘故障,并且已经离线,硬盘需要更换。
不亮
不亮
不亮
可能以下任一情况,1、硬盘未配置到阵列中。2、硬盘被配置到阵列中,但是作为新更换的硬盘没有开始重建或重建未完成。或者3、被配置为热备盘。
如果硬盘是连接到阵列卡控制器,可以更换该硬盘。

*参考文档:HP ProLiant DL380 Generation 4 Server Maintenance and Service Guide–June 2004 (First Edition)

如需要进一步确认故障,可收集HP ADU(HP Array Configuration Utility)报告分析,或将ADU报告发送给HP服务器工程师分析。

如设备在保修期内,可收集服务器序列号(serial number)和硬盘备件号(spare number),在设备旁拨打HP 800热线电话报修。

最安全的数据保护措施,即提前做好数据备份。