- 博客(7)
- 收藏
- 关注
原创 昇腾NPU HCCS无法访问
d) 确认固件版本是否在各个组件全部生效,命令是/usr/local/Ascend/driver/tools/upgrade-tool --device_index -1 --component -1 --version。c) 确认固件版本:是否大于等于7.1.0.6.220并且与驱动配套,命令是npu-smi info -t board -i NPUid ,配套的话回显Compatibility那行需要是OK。e) 查询命令错误写成npu-smi info -t hccs -i 0。
2025-04-30 10:35:03
295
原创 服务器升级内核后系统无法启动问题
根据当前实验室测试,在Raid卡低版本驱动与低版本固件版本下,升级系统内核版本,打开 Firmware device order参数,boot mode为IE以上,默认为stop on errors,BIOS检测到异常会停止启动;由于内核降级前无异常上报,仅在内核降级后上报该错误,说明与bios本身上报机制无关。属于兼容性版本配套问题,不属于驱动问题或固件问题任意一种,固件和驱动不配套的上报源为raid卡,raid卡固件自身判断当前驱动不符合配套关系,具体代码Broadcom原厂不予提供。
2025-04-11 10:21:05
1632
原创 Linux操作系统修改Emulex HBA卡超时时间
经定位,IO悬挂是由于HBA卡超时较长,在某些应用场景下,需要对I/O悬挂时间进行调整。查看配置文件中lpfc_nodev_tmo参数,查看该参数的值。在RHEL和Asianux中,配置文件为/etc/modprobe.conf。在SuSE中配置文件为/etc/modprobe.conf.local。2. 直接修改配置文件中lpfc_nodev_tmo参数的值(如果该参数不存在则新加)。如下:options lpfc lpfc_nodev_tmo=n (n为整数,建议10≤n≤60)4. 重启服务器生效。
2025-03-06 12:00:51
773
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人