服务器无法从PXE启动的问题排查步骤

发布时间:2021-07-09 10:02

1.检查服务器ETH口对应的交换机接口是否为UP状态,如果为Shutdown状态,则服务器无法从DHCP服务器(cloudboot)获取IP地址。服务器获取到IP地址后的界面如下图所示:

2.检查服务器ETH口对应的交换机接口vlan是否与cloudbootvlan一致,如果vlan不一致,则同样无法通过局域网获取到IP地址。目前,各IDC机房部署的cloudboot服务器所属vlan都不一样。院前电信cloudbootvlan200,安溪机房的vlan101,徐州双线机房的vlan61,洛阳景安机房的vlan1

3.如果通过上述两个步骤确认交换机接口配置正常,且线路连通性也正常,则基本上可以排除网络方面的问题。接着,可以在cloudboot后台或者跳板机上ping服务器的IPMI IP地址。

如果IPMI IP不能被ping通,则需要现场检查服务器的IPMI配置是否正确,如果IPMI配置正常,则需要进一步排查服务器BMC问题或硬件问题(排除硬件问题可以尝试给服务器关机放电或拔插网口;处理BMC问题则更麻烦,可能需要刷BIOSIPMI固件)。

如果IPMI IP可以被ping通,则可以通过cloudboot服务器远程重启下BMC,看是否能够解决,重启BMC的命令为:

ipmitool -I lanplus -H  -U  -P  mc reset cold

4.如果重启BMC之后问题还没解决,可以进BIOS检查下PXE的网卡启动顺序(通常BIOS启动项里有至少2PXE网卡),确认序号小的PXE网卡启动顺序更优先即可。

5.如果上述操作依然无法解决服务器无法从PXE启动的问题,则需要进一步确认服务器的BMC是否正常。

本文导读