服务器型号:HPE DL380 GEN8
磁盘阵列: 2个逻辑盘(RAID1_OS盘,RAID5_DATA盘)

故障现象说明: ILO提示槽位4硬盘黄灯故障,
槽位5和槽位6的盘由于逻辑盘阵列降级下面也亮了红灯。这里只是一个警示作用。但是同事却把槽位5和槽位6的盘直接拔掉了。系统直接宕机,重启报文件系统错误

image-1726124013078

1.开机按F9,先进行逻辑盘修复
image-1726124301074
fb0b6ca3b0bdff4dc23208a30cd3b02
修复完成
80d2d9fac0e81c1db1976ad9c058a03
image-1726124453023
此时槽位5和槽位6的盘红灯已经消失,系统fstab自检也正常过了,万幸的是数据盘挂载目录查看文件也并无丢失,此时先赶紧买硬盘把槽位4的坏盘换掉。

2.由于槽位4的故障硬盘导致系统第二天又宕机
75c7db120836665a524cd08957b7fea
image-1726124840662

3.新盘到货后换掉坏盘,开始重建raid
image-1726124904122

4.raid重建完成后,/dev/sdb1 文件系统异常,系统进不去。
bca2a6a1900e1347cc7598cc05251c2

5.没辙了,先想办法进系统吧
输root密码后以读写的方式重新挂载根分区
mount -o remount rw /
然后vi /etc/fstab文件,将/dev/sdb1 注释掉。保存退出后,重启正常进入系统。

6.修复/dev/sdb1磁盘
fsck.ext4 -y /dev/sdb1
57aba1bf041ba07a663e7efa899fc26
修复完成
37ed41db3106ca14bd11c3ec4f3ce47
重启验证,/dev/sdb1 自动挂载正常。文件无丢失
fdbd5e9c0c11dc81fae0e0bc8decf17