当容纳刀片式服务器的 PowerEdge M1000e 刀片盘柜遇到问题时,机箱正面的 LCD 屏幕或机箱管理控制器 (CMC) 系统事件日志 (SEL) 上将显示错误消息。
一、CMC 状态屏幕错误消息
1、CMC Battery: Battery sensor for CMC, failed was asserted(CMC 电池:CMC 的电池传感器,出现故障)
CMC CMOS 电池缺失或没有电压。
2、CMC CPU Temp: Temperature sensor for CMC, failure event(CMC CPU 温度:CMC 的温度传感器,故障事件)
CMC CPU 温度超过临界阈值。
3、CMC Ambient Temp: Temperature sensor for CMC, failure event(CMC 环境温度:CMC 的温度传感器,故障事件)
CMC 环境温度超过临界阈值。
二、盘柜/机箱状态屏幕错误消
1、Chassis Fan presence: Fan sensor for Chassis Fan, device removed was asserted(机箱风扇 存在:机箱风扇的风扇传感器,设备已卸下)
卸下的风扇对于盘柜/机箱的正常冷却是必需的。
2、Power Supply Redundancy: PS Redundancy sensor for Power Supply, redundancy lost was asserted(电源冗余:电源的电源冗余传感器冗余丢失)
一个或多个电源设备 (PSU) 出现故障或已卸下,因此系统不再冗余。
3、电源冗余:电源的电源冗余传感器。非冗余:资源不足
一个或多个 PSU 出现故障或已卸下,并且系统电源不足,无法维持正常操作。服务器可能已断电。
4、Control Panel Temp: Temperature sensor for Control Panel, failure event(控制面板温度:控制面板的温度传感器,故障事件)
机箱/盘柜温度超过临界阈值。
5、CMCStand-alone: Micro Controller sensor for CMC, non-redundant was asserted(CMC 独立:CMC 的微控制器传感器,非冗余)
CMC 不再冗余。仅在备用 CMC 已卸下或出现故障时,此消息才会显示。
6、Chassis Eventlog CEL: Event Log sensor for Chassis Eventlog, all event logging disabled was asserted(机箱事件日志 CEL:机箱事件日志的事件日志传感器,所有事件日志记录已禁用)
当事件日志传感器处于禁用状态时,CMC 无法记录事件。当事件日志已满时,它会处于禁用状态。清除日志将重新启用事件日志记录。
7、Chassis Eventlog CEL: Event Log sensor for Chassis Eventlog, log full was asserted(机箱事件日志 CEL:机箱事件日志的事件日志传感器,日志已满)
机箱设备检测到只有一个条目可以在 CEL 满之前添加到 CEL。
8、Chassis Eventlog CEL: Event Log sensor for Chassis Eventlog, log almost full was asserted(机箱事件日志 CEL:机箱事件日志的事件日志传感器,日志几乎已满)
机箱事件日志已满 75%。
9、Power Supply Redundancy: PS Redundancy sensor for Power Supply, redundancy degraded was asserted(电源冗余:电源的电源冗余传感器,冗余降级)
一个或多个 PSU 出现故障或已卸下,系统无法再支持完整的 PSU 冗余。
三、风扇状态屏幕错误消息
Chassis Fan Status: Fan sensor for Chassis Fan, failure event(机箱风扇 状态:机箱风扇的风扇传感器,故障事件)
指定风扇的速度不足,无法为系统提供足够的冷却。
四、IOM 状态屏幕错误消息
1、I/O Module Status: Module sensor for I/O Module, transition to critical from less severe was asserted(I/O 模块 状态:I/O 模块的模块传感器,严重程度从较不严重转变为严重)
I/O 模块有故障。如果 I/O 模块热跳闸,则同样的错误也会发生。
2、I/O Module Status: Module sensor for I/O Module, transition to non-critical from OK was asserted(I/O 模块 状态:I/O 模块的模块传感器,严重程度从正常转变为不严重)
I/O 模块的结构不匹配或链路调整不匹配。
五、iKVM 状态屏幕错误消息
1、Local KVM Health: Module sensor for Local KVM, transition to non-recoverable was asserted(本地 KVM 运行状况:本地 KVM 的模块传感器,转变为不可恢复)
串行 RIP 或 USB 主机芯片出现故障。
2、Local KVM Health: Module sensor for Local KVM, transition to critical from less severe was asserted(本地 KVM 运行状况:本地 KVM 的模块传感器,严重程度从较不严重转变为严重)
USB 主机枚举或 OSCAR 失败。
3、Local KVM Health: Module sensor for Local KVM, transition to non-critical from OK was asserted(本地 KVM 运行状况:本地 KVM 的模块传感器,严重程度从正常转变为较不严重)
存在轻微故障,例如固件损坏。
六、PSU 状态屏幕错误消息
1、Power Supply PSU : Power Supply sensor for Power Supply, failure was asserted(电源 PSU :电源的电源传感器,故障)
PSU 出现故障。
2、Power Supply PSU : Power Supply sensor for Power Supply, input lost was asserted(电源 PSU :电源的电源传感器,输入丢失)
交流电源线已拔下或交流电源已断开。
七、M600/M605 的服务器状态屏幕错误消息
1、System Board Ambient Temp: Temperature sensor for System Board, warning event(系统主板环境温度:系统主板的温度传感器,警告事件)
服务器环境温度超过警告阈值。
2、System Board Ambient Temp: Temperature sensor for System Board, failure event(系统主板环境温度:系统主板的温度传感器,故障事件)
服务器环境温度超过故障阈值。
3、System Board CMOS Battery: Battery sensor for System Board, failed was asserted(系统主板 CMOS 电池:系统主板的电池传感器,出现故障)
CMOS 电池不存在或没有电压。
4、System Board Current Monitor: Current sensor for System Board, warning event(系统主板当前显示器:系统主板的当前传感器,警告事件)
电流超过警告阈值。
5、System Board Current Monitor: Current sensor for System Board, failure event(系统主板当前显示器:系统主板的当前传感器,故障事件)
电流超过故障阈值。
6、Voltage sensor for System Board, state asserted was asserted(:系统主板的电压传感器)
电压超出范围。
7、CPU Status: Processor sensor for CPU, IERR was asserted(CPU 状态:CPU 的处理器传感器)
CPU 出现故障。
8、CPU Status: Processor sensor for CPU, thermal tripped was asserted(CPU 状态:CPU 的处理器传感器,已热跳闸)
CPU 过热。
9、CPU Status: Processor sensor for CPU, configuration error was asserted(CPU 状态:CPU 的处理器传感器配置错误)
处理器类型不正确或位置不正确。
10、CPU Status: Processor sensor for CPU, presence was deasserted(CPU 状态:CPU 的处理器传感器,解除存在)
所需的 CPU 缺失或不存在。
11、System Board Video Riser: Module sensor for System Board, device removed was asserted(系统主板视频转接卡:系统主板的模块传感器,设备已卸下)
所需的模块已卸下。
12、Mezz B Status: Add-in Card sensor for Mezz B, install error was asserted(夹层卡 B 状态:夹层卡 B 的附加卡传感器,安装错误)
为 I/O 结构安装了不正确的夹层卡。
13、Mezz C Status: Add-in Card sensor for Mezz C, install error was asserted(夹层卡 C 状态:夹层卡 C 的附加卡传感器,安装错误)
为 I/O 结构安装了不正确的夹层卡。
14、Backplane Drive : Drive Slot sensor for Backplane, drive removed(背板驱动器 :背板的驱动器插槽传感器,驱动器已卸下)
存储驱动器已卸下。
15、Backplane Drive : Drive Slot sensor for Backplane, drive fault was asserted(背板驱动器 :背板的驱动器插槽传感器,驱动器出现故障)
存储驱动器出现故障。
16、System Board PFault Fail Safe: Voltage sensor for System Board, state asserted was asserted(系统主板 Pfault 故障安全:系统主板的电压传感器)
当系统主板电压不在正常水平时,将生成此事件。
17、System Board OS Watchdog: Watchdog sensor for System Board, reboot was asserted(系统主板操作系统看门狗:系统主板的看门狗传感器,重新启动)
iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为重新启动。
18、System Board OS Watchdog: Watchdog sensor for System Board, power off was asserted(系统主板操作系统看门狗:系统主板的看门狗传感器,电源已关闭)
iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为关闭电源。
19、System Board OS Watchdog: Watchdog sensor for System Board, power cycle was asserted(系统主板操作系统看门狗:系统主板的看门狗传感器,断言关闭电源后再重新打开)
iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为关闭电源后再重新打开。
20、System Board SEL: Event Log sensor for System Board, log full was asserted(系统主板 SEL:系统主板的事件日志传感器,日志已满)
SEL 设备检测到只有一个条目可以在 SEL 满之前添加到 SEL。
21、ECC Corr Err: Memory sensor, correctable ECC ( ) was asserted(ECC 可纠正的错误:内存传感器,可纠正的 ECC())
可纠正的 ECC 错误已达到临界值。
22、ECC Uncorr Err: Memory sensor, uncorrectable ECC ( ) was asserted(ECC 不可纠正的错误:内存传感器,不可纠正的 ECC())
检测到不可纠正的 ECC 错误。
23、I/O Channel Chk: Critical Event sensor, I/O channel check NMI was asserted(I/O 通道检查:严重事件传感器, I/O 通道检查 NMI)
在 I/O 通道中产生了严重中断。
24、PCI Parity Err: Critical Event sensor, PCI PERR was asserted(PCI 奇偶校验错误:严重事件传感器 PCI PERR)
在 PCI 总线上检测到奇偶校验错误。
25、PCI System Err: Critical Event sensor, PCI SERR ( ) was asserted(PCI 系统错误:严重事件传感器 PCI SERR())
设备检测到 PCI 错误。
26、SBE日志已禁用:事件日志传感器。可更正的内存错误记录已禁用
当记录太多的 SBE 时,将会禁用单位错误日志记录。
27、Logging Disabled: Event Log sensor, all event logging disabled was asserted(日志记录已禁用:事件日志传感器,所有事件日志记录已禁用)
所有错误日志记录已禁用。
28、CPU Protocol Err: Processor sensor, transition to non-recoverable was asserted(CPU 协议错误:处理器传感器,转变为不可恢复)
处理器协议已进入不可恢复的状态。
29、CPU总线PERR:处理器传感器。转变为不可恢复
处理器总线 PERR 已进入不可恢复的状态。
30、CPU Init Err: Processor sensor, transition to non-recoverable was asserted(CPU 初始化错误:处理器传感器,转变为不可恢复)
处理器初始化已进入不可恢复的状态。
31、CPU Machine Chk: Processor sensor, transition to non-recoverable was asserted(CPU 机器检查:处理器传感器,转变为不可恢复)
处理器机器检查已进入不可恢复的状态。
32、Memory Spared: Memory sensor, redundancy lost ( ) was asserted(备用内存:内存传感器,冗余丢失())
内存备用不再冗余。
33、Memory Mirrored: Memory sensor, redundancy lost ( ) was asserted(内存镜像:内存传感器,冗余丢失())
镜像内存不再冗余。
34、Memory RAID: Memory sensor, redundancy lost ( ) was asserted(内存 RAID:内存传感器,冗余丢失())
RAID 内存不再冗余。
35、Memory Cfg Err: Memory sensor, configuration error ( ) was asserted(内存 Cfg 错误:内存传感器,配置错误())
系统的内存配置不正确。
36、Mem Redun Gain: Memory sensor, redundancy degraded ( ) was asserted(内存冗余增益:内存传感器,冗余降级())
内存冗余已降级,但未丢失。
37、PCIE Fatal Err: Critical Event sensor, bus fatal error was asserted(PCIE 致命错误:严重事件传感器,总线致命错误)
在 PCI 总线上检测到致命错误。
38、Chipset Err: Critical Event sensor, PCI PERR was asserted(芯片组错误:严重事件传感器,PCI PERR)
检测到芯片错误。
39、Mem ECC Warning: Memory sensor, transition to non-critical from OK ( ) was asserted(内存 ECC 警告:内存传感器,严重程度从正常()转变为不严重)
可纠正的 ECC 错误超过正常值。
40、Mem ECC Warning: Memory sensor, transition to critical from less severe ( ) was asserted(内存 ECC 警告:内存传感器,严重程度从较不严重()转变为严重)
可纠正的 ECC 错误已达到临界值。
41、System Board POST Err: POST sensor for System Board, POST fatal error was asserted(系统主板开机自检错误:系统主板的开机自检传感器,开机自检致命错误 )