装备测试项介绍
二次电源测试
通过ADM1166读取各二次电源电压值并显示出来,然后与AVS状态寄存器值比较(逻辑已预留AVS状态读取寄存器),如果各二次电压均在允许范围内测试通过。
本测试检测单板电压监控芯片ADM1166工作是否正常,二次电源给各芯片供电是否正常。
测试到的相关器件:
CPU<--->IIC总线<--->ADM1166
【命令行】
test power slot/subslot voltage status.
slot/subslot:被测槽位号
【示例】
[H3C-equipment]test power 4/0 voltage status
常见错误现象
可能出现部分电压测试失败
定位方法
1、确认确认问题某个单板的个例问题,如果是个例问题,则可能是单板硬件问题。
硬件定位方法
查看原理图ADM1166部分,找到对应电源实际测试电压,判断是否异常
排除对应二次电源输入、输出电压,VID等信号,是否异常
更换疑似故障二次电源验证。
Eeprom测试
构造一个BLOCK的数据包,数据包的每个字节内容为交替的0x55和0xaa,写入EEPROM中再读出进行比较。如果完全相同则测试成功,否则测试失败。
覆盖CPU到EEPROM芯片的IIC通道,EEPROM的存储单元
测试到的相关器件:
CPU<--->IIC总线<--->EEPROM
【命令行1】
test eeprom {slot/subslot | chassis} {block_number | all}
slot/subslot:被测槽位
chassis:测试机箱背板EEPROM
block_number:测试单个block
all:测试全部block
【示例1】
[H3C-equipment]test eeprom 4/0 all
【示例】
[H3C-equipment]test eeprom chassis 0
常见错误现象
读取和写入数据不一致。
定位方法
硬件定位方法
查看IIC信号是否正常,
检查eeprom芯片相关信号、阻抗是否正常
更换eeprom芯片验证
CPU压力测试
利用软件算法让CPU利用率达到最高,进行CPU拷机测试。
1)对于需要测试的CPU,进行拷机程序运算,主控板通过RPC通信查询各CPU状态是否OK,来判断CPU在运算过程中是否正常。拷机采用的算法是计算最短路径的dijkstra算法和计算最长匹配的patricia算法。这是嵌入式CPU通用测试系统MiBench里针对网络CPU进行测试的算法。
2)拷机程序dijkstra算法,主要用于计算邻接矩阵中任意两个结点的最短路径。邻接矩阵采用文件输入,维度为100×100。该输入数据打包在打包文件中。
3)拷机程序patricia算法,主要用于计算IP的最长匹配。输入数据为MiBench提供的测试集,一组数据约60000多个,也采用将输入数据打包在大包文件中的方式,命令行执行时,从大包文件中获取该数据文件。
测试到的相关器件:
CPU芯片
【命令行】
test cpu stability slot/subslot
slot/subslot:被测槽位号
【示例】
[H3C-equipment]test cpu stability 4/0
常见错误现象
定位方法
Cpu,内存相关信号检查
硬件定位方法
同1.6节
测试板卡电源和时钟,确认是否工作正常。
有内存条单板,更换内存条验证。
DDR颗粒单板,烧写特殊定位内存boot,根据失效数据线判断失效颗粒位置,
更换颗粒验证
若特殊boot无法定位,测试数据、地址线阻抗和反向电压,若有异常,更换对应颗粒
若均无异常,考虑更换CPU验证
内存在位测试
通过读每片内存内eeprom的0x2地址数据,判断读出的数据是否为0xb来判断内存是否在位。
测试到的相关器件:
内存条在位检测:CPU<--->IIC总线<--->内存条上eeprom
【命令行】
test ram slot/buslot status [sdram_number]
slot/buslot:被测槽位
sdram_number:内存条号
【示例】
[H3C-equipment]test ram 4/0 status 1
硬件定位方法
内存条是否插到位
交叉确认是否内存条问题
检查CPU与内存间的IIC信号是否异常。
光模块信息读取
通过光模块IIC读取光模块内部信息。
覆盖光口连接器与光模块间的IIC接口。
【命令行】
test optic slot/subslot getinfo {all | port_number} start_addr length
slot/subslot:被测试槽位
all:测试全部端口
port_number:测试单个端口
start_addr:起始地址
length:读取长度
【示例】
[H3C-equipment]test optic 4/0 getinfo all 0 1
常见错误现象
光模块在位状态不对
相同光模块读取信息不一致
定位方法
排查故障端口。
硬件定位方法
排查故障端口,检查连接器外观
测试对应网络阻抗以及上电后电平是否正常
检查IIC信号
更换相关器件验证