Linux服务器磁盘阵列维护:Linux磁盘阵列维护实战
Linux磁盘阵列维护实战:软件RAID状态检查与硬盘更换
服务器运行久了,磁盘阵列难免会遇到故障。
对于使用软件RAID(如mdadm)的Linux服务器,掌握基本的维护操作能帮你快速恢复数据保护。
本文从零开始,带你完成磁盘阵列维护全流程。
认识软件RAID与mdadm工具
软件RAID通过Linux内核的md模块实现,不需要专门的硬件RAID卡。
管理命令是 mdadm。
适用场景:远程服务器、云主机、无硬件RAID卡的低成本机器。
准备工作:
- 确保系统已安装mdadm(CentOS:
yum install mdadm,Ubuntu:apt install mdadm) - 使用
lsblk查看磁盘设备名,如/dev/sda、/dev/sdb等 - 有root或sudo权限
检查当前阵列健康状况
维护的第一步是定期查看阵列状态。
执行以下命令:
cat /proc/mdstat
输出会列出所有RAID设备和运行状态。
正常输出示例:
Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid1 sda1[0] sdb1[1]
20970496 blocks super 1.2 [2/2] [UU]
关键信息:
[2/2]表示总磁盘数和活跃数[UU]表示所有磁盘正常;如果是[U_]则说明有一个磁盘故障
更详细的设备信息可以用:
mdadm --detail /dev/md0
加粗提醒:在输出中看到 removed、faulty、Failed 等字样时,需要立即处理。
处理故障磁盘:更换硬盘并重建阵列
假设发现 /dev/sdb 故障,系统已标记为 faulty。
操作步骤:
1. 标记故障盘并移除
mdadm /dev/md0 --fail /dev/sdb1
mdadm /dev/md0 --remove /dev/sdb1
查看状态确认移除成功:
cat /proc/mdstat
此时 [1/2] 或 [U_] 表示降级运行。
2. 物理更换硬盘或分区
如果是真实服务器,关机更换新硬盘;
虚拟机则添加新虚拟磁盘。
注意:新硬盘的分区大小和类型必须与故障盘一致。
使用 fdisk 或 parted 创建分区,ID=fd(Linux raid autodetect)或直接使用整块磁盘。
3. 将新盘加入阵列
mdadm /dev/md0 --add /dev/sdc1
(假设新盘为 /dev/sdc,分区为 /dev/sdc1)
此时阵列会自动开始同步重建。
可以通过以下命令查看进度:
cat /proc/mdstat
输出会显示类似:
md0 : active raid1 sdc1[2] sda1[0]
20970496 blocks super 1.2 [2/2] [UU]
[>....................] resync = 0.3% (65536/20970496) finish=10.1min speed=65536K/sec
耐心等待完成。
重建期间不要中断电源或重启。
高频问题与避坑说明
Q:重建过程中系统还能用吗?
A:可以正常使用,但磁盘读写性能会受影响,建议低负载时操作。
Q:新盘加入后重建一直卡在某个百分比怎么办?
A:检查新盘是否有坏道,或者使用 mdadm --detail /dev/md0 查看具体错误。也可能是分区不对齐,建议重新分区。
Q:如何设置开机自动组装RAID?
A:编辑 /etc/mdadm/mdadm.conf,执行 mdadm --detail --scan >> /etc/mdadm/mdadm.conf 并更新initramfs(update-initramfs -u 或 dracut -f)。
避坑清单:
- 不要在重建时操作故障盘(避免二次损坏)
- 不要用容量不同的盘组RAID(会导致最小容量限制)
- 更换盘之前务必备份重要数据
- 使用
smartctl检查新盘健康度
验证阵列健康与数据完整性
重建完成后,再次执行:
cat /proc/mdstat
确认 [UU] 状态。
然后检查文件系统:
fsck /dev/md0
如果文件系统无错误,挂载并检查数据:
mount /dev/md0 /mnt
ls -la /mnt
也可以模拟一次读写测试:
dd if=/dev/md0 of=/dev/null bs=1M count=1000
没有错误即表示阵列恢复正常。
结语
Linux软件磁盘阵列维护并不复杂,关键是养成定期查看 /proc/mdstat 的习惯,并掌握状态检查和硬盘更换命令。
如果你正在处理 Linux服务器磁盘阵列维护,建议先按本文步骤完整执行,再根据自己的环境做微调;
遇到异常时优先回看避坑和高频问题部分。