被浏览:7340
关注者:378
最佳回答:
装备测试项介绍
FLUX测试
Flux测试是ess中的发包测试,将同一芯片的所有面板口找出来,设置MAC环回,报文通过pcie发送到第一个端口,环回后转发到第二个口,之后依次转发,到最后一个端口上cpu进行比较统计;
对于网板测试,采用的是sdk提供的snake测试,测试方式是sfi mac环回,芯片自己发包比较统计,cpu不参与。
测试到的相关器件:
CPU发包<--->PCIE<--->MAC芯片<--->面板口》acke<--->面板口环回后转发到下一端口<--->(重复上面两步到每个芯片最后一个端口)<---> PCIE<--->CPU收包
【命令行】
test flux slot/subslot run packet-length packet-content
test flux slot/subslot stop
slot/subslot:被测槽位
run:开始测试
stop:停止测试
packet-length:报文长度
packet-content:报文内容
【示例】
[H3C-equipment]test flux 4/0 run 1514 555aaa
【示例】
[H3C-equipment]test flux 4/0 stop
常见错误现象
网板snake错误
[H3C-equipment]test flux 5/0 stop
@
start clock: 9:42:03 2016-04-10
unit 0 run_snake: OK
test error: unit 1 run_snake: Error
flages: 0x0
status: 13835058058070587396
value: 0x0
non_value: 0x0
unit 2 run_snake: OK
test result:fail
业务板端口未使能
[H3C-equipment]test flux 5/0 stop
@
start clock: 9:42:03 2016-04-10
Unit(0) Port(7) is not enable!
test result:fail
业务板测试丢包
Unit 0 port 1 txpackage number is 166332,rxpackage number is 166321
Unit 0 port 1注意这个并不是出问题的端口,这个只是报文发送的端口,unit是准确的
port tx rx rxdics rxerr stat pvid loop
0/1 ce1 166335 166335 0 0 up 701 mac
0/2 ce2 166335 166335 0 0 up 702 mac
0/3 xe3 166335 166324 0 0 up 703 mac
166335 166324 报文发送比接收多,端口环回丢包
0/4 xe4 166324 166324 0 0 up 704 mac
0/5 xe5 166324 166324 0 0 up 705 mac
0/6 xe6 166324 166324 0 0 up 706 mac
0/7 xe7 166324 166324 0 0 up 707 mac
0/8 xe8 166324 166324 0 0 up 708 mac
0/9 xe9 166324 166324 0 0 up 709 mac
0/10 xe10 166324 166324 0 0 up 710 mac
0/11 xe11 166324 166324 0 0 up 711 mac
0/12 xe12 166324 166324 0 0 up 712 mac
0/13 xe13 166324 166324 0 0 up 713 mac
0/14 xe14 166324 166324 0 0 up 714 mac
0/15 xe15 166324 166324 0 0 up 715 mac
0/16 xe16 166324 166324 0 0 up 716 mac
0/17 xe17 166324 166324 0 0 up 717 mac
0/18 xe18 166300 166300 0 0 up 718 mac
166324----166300 上一个口的接收比下一个口的发送多,报文丢在芯片内部
0/19 xe19 166300 166300 0 0 up 719 mac
定位方法
对于网板的snake失败,基本可以确认是芯片问题,需要启动bist测试确认一下具体模块;
业务板的报文丢在端口可以用bcm slot x chip x show/c看是否有crc;可以通过mac环回测试进一步确认复现;
报文丢在芯片内部需要参考丢包定位方法分析。
硬件定位方法
测试相关失效芯片电源和时钟,是否工作正常
收集dump信息dsc眼图等,方法参见1.1.3
根据眼图确实故障位置,方法参见1.1.3
测试相关链路阻抗,对比测试正常端口或正常单板,进一步确认失效位置
更换疑似失效位置处器件验证
单板重启信息记录获取
此测试项用来查询单板重启类型。单板在按键复位、看门狗复位、上电复位或其他软件复位后,会在高端内存中的(g_ulHighVirMemStart 0x00200:0xffffffffaf800200)处开始记录单板的重启类型。1-按键复位、2-看门狗、3-上电复位、4-其它。此命令用于定位单板启动过程中是否有多次重启现象。
测试到的相关器件:
CPU直接从ram中读取。
【命令行】
[H3C-equipment]test rebootreason 【slot/0】 get
[H3C-equipment]test rebootreason 【slot/0】 clear
test rebootreason slot/subslot {get/clear}
slot/subslot:被测槽位
get:获取单板重启信息
clear:清除记录
【示例】
[H3C-equipment]test rebootreason 4/0 get
@
The reboot number is 15, the last reason is SOFT
No:0 Reason:SOFT
No:1 Reason:SOFT
获赞:336
收藏:60
回答时间:2022-12-14 21:58:11