PA视讯PlayAce

服务器 2025-11-05

KunTai R622服务器硬盘外部配置

一、现网描述

1.1 环境描述


设备型号:KunTai R622

BMC芯片:1711版

BMC版本:(U82)3.03.00.23

BIOS 版本:(U75)1.88

CPLD版本:(U6076)6.03


二、故障描述

2.1故障现象

该局点近期报障现场多台服务器正常运行过程中突然出现硬盘告警,告警代码0x02000029 "The disk  has foreign configuration“,该局点前期已发现多次类似问题,需查明根因并解决。


三、问题分析

3.1排查思路

分析阵列卡日志,发现出现foreign告警之前,磁盘出现Command timeout 超时

出现问题后,磁盘在接收到读写请求时,响应为not ready(2/04/00)

c5a87f6ff736831460fa03fa0177aece.png

依据SCSI/SATA协议规范,2/04/00响应码表示磁盘未就绪,原因不可报告,表明磁盘内部出现协议错误

e8043b98508de0d19cc93c2c188eda0d.png

磁盘状态长时间异常引发Raid卡固件报错并自动触发复位,重新rescan磁盘

cc9608c843737f73b712b37cf5b09cc9.png

此时raid卡并未重新insert not ready磁盘,提示PD/VD missing at boot,检测到配置丢失时,重新rescan问题磁盘执行insert,磁盘此前配置为单盘RAID0 ,由于单盘RAID0机制特殊性,至此磁盘状态变更为foreign,需要手动操作导入

474d4f7bf7f63f9cc367b7b47f9970f6.png

硬盘厂商发布的硬盘4304固件版本说明中可找到此问题相关修复项,磁盘内部发生超时导致出现协议错误bug

040e2c4b7158f8c14df08a299e3af33e.png

3.2原因分析

根据以上日志分析结论,导致硬盘出现外部配置的原因为当前硬盘固件bug,硬盘本身并未故障,若固件不升级问题将不断有概率触发。顺利获得在服务器BMC管理页面导入外部配置可解决问题,如果导入外部配置无法成功则需更换硬盘。

与硬盘厂商沟通推荐升级的目标硬盘固件版本为4304,该硬盘固件4304版本的发布时间为2022/10/1



四、问题解决

4.1解决办法

升级硬盘固件版本至4304