PTN常见故障处理.ppt_第1页
PTN常见故障处理.ppt_第2页
PTN常见故障处理.ppt_第3页
PTN常见故障处理.ppt_第4页
PTN常见故障处理.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/9/24,PTN常见故障处理,Page 2,目录,Tunnel/PW故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 3,常见故障定位流程,业务 Tunnel 链路,Page 4,故障定位信息收集,(1)该业务是创建后一直没有通,还是历史上通,突然间不通。 (2)该业务端到端的完整路径,包括源节点、目的节点、transt节点。 (3)完整的业务定位信息,包括业务ID,业务属性。 (4)业务的源宿端口信息。 (5)业务所在的Tunnel和PW信息。 (6)业务

2、涉及的保护信息。 (7)当前告警信息。 (8)各种相关性能计数(如业务涉及的端口性能计数,业务本身的性能计数等)。,Page 5,目录,Tunnel/PW故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 6,CES业务故障定位流程,Page 7,CES业务常见故障现象,Page 8,CES业务常见故障现象(续),Page 9,CES业务故障常见原因,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 原因2:处理板、接口板的接口接入的信号丢失或恶化。 原因3

3、:承载CES 业务的Tunnel 或PW 中断。 原因4:网元的同步时钟源级别丢失,或同步时钟源丢失。 原因5:承载CES 业务的PW 在单位时间内丢包数、错包数或抖动缓冲超过阈值。,Page 10,CES业务常见故障处理方法,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 1. 查询系统当前告警,是否有HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警,并确定上报告警的单板。 2. 参考告警和性能事件参考手册,处理HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警,排除故障。 原因2:处理板、接口板的接口接入的

4、信号丢失或恶化。 1. 查询系统是否有T_ALOS、UP_E1_AIS 或DOWN_E1_AIS 告警,处理T_ALOS、UP_E1_AIS 或DOWN_E1_AIS 告警。 2. 查询系统是否有R_LOS 告警,处理R_LOS 告警。 3. 查询系统是否有LASER_MOD_ERR、LSR_WILL_DIE、IN_PWR_ABN、TEM_HA 或LSR_BCM_ALM 告警,处理LASER_MOD_ERR、LSR_WILL_DIE、IN_PWR_ABN、TEM_HA 或LSR_BCM_ALM 告警。,Page 11,CES业务常见故障处理方法(续),原因3:承载CES 业务的Tunnel 或

5、PW 中断。 1. 查询系统是否存在MPLS_TUNNEL_LOCV 告警。若存在,处理MPLS_TUNNEL_LOCV 告警。 2. 查询系统是否存在PW_DOWN 告警。若存在,处理PW_DOWN 告警。 原因4:网元的同步时钟源级别丢失,或同步时钟源丢失。 1. 查询系统是否有SYNC_C_LOS 或LTI 告警,处理SYNC_C_LOS 或LTI 告警。 原因5:承载CES 业务的PW 在单位时间内丢包数、错包数或抖动缓冲超过阈值。 1. 查询系统是否有CES_LOSPKT_EXC、CES_MISORDERPKT_EXC 或CES_STRAYPKT_EXC 告警,处理CES_LOSPK

6、T_EXC、CES_MISORDERPKT_EXC 或CES_STRAYPKT_EXC 告警。 2. 查询系统是否有CES_JTRUDR_EXC 或CES_JTROVR_EXC 告警,处理CES_JTRUDR_EXC 或CES_JTROVR_EXC 告警。,Page 12,ETH业务故障定位流程,Page 13,ETH业务故障常见现象,Page 14,ETH业务故障常见原因,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 原因2:接收信号丢失。 原因3:以太网网口连接错误,端口协商失败。 原因4:端口配置了环回。 原因5:接口流量限值配置过低,源宿两端接口配置不一致。,Page

7、15,ETH业务常见故障处理方法,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 1. 查询系统当前告警,是否有HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警,并确定上报告警的单板。 2. 参考告警和性能事件参考手册,处理HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警。 原因2:接收信号丢失。 1. 查询系统是否有ETH_LOS 或ETH_AUTO_LINK_DOWN 告警,处理ETH_LOS 或ETH_AUTO_LINK_DOWN 告警。 2. 查询系统是否有R_LOS 告警,处理R_LOS 告警。 3

8、. 查询系统是否有LASER_SHUT 或LSR_WILL_DIE 告警,处理LASER_SHUT或LSR_WILL_DIE 告警。 4. 查询系统是否有MAC_FCS_EXC 告警,处理MAC_FCS_EXC 告警。,Page 16,ETH业务常见故障处理方法(续),原因3:以太网网口连接错误,端口协商失败。 1. 查询系统是否有ETH_LINK_DOWN 告警,处理ETH_LINK_DOWN 告警。 原因4:端口配置了环回。 1. 查询系统是否有LOOP_ALM 告警,处理LOOP_ALM 告警。 2. 查询系统是否有ETH_EFM_LOOPBACK 告警,处理ETH_EFM_LOOPBA

9、CK告警。 原因5:接口流量限值配置过低,源宿两端接口配置不一致。 1. 查询系统是否有FLOW_OVER 告警,处理FLOW_OVER 告警。 2. 查询系统是否有ETH_CFM_UNEXPERI 告警,处理ETH_CFM_UNEXPERI 告警。,Page 17,目录,Tunnel/PW故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 18,Tunnel故障定位流程,Page 19,Tunnel故障常见现象和原因,常见现象 MPLS Tunnel 创建失败,业务不

10、通。 MPLS Tunnel 故障,业务中断。 保护倒换失败,业务中断或出现丢包、误码。,常见原因 原因1:路由失败。 原因2:交叉创建失败。 原因3:Tunnel 所在的物理链路故障。 原因4:保护倒换失败。,Page 20,Tunnel常见故障处理方法,原因1:路由失败。 1. 对照网络规划,检查Tunnel 两端端口参数配置是否正确,例如端口IP。修正不正确的端口参数后,再次创建Tunnel。 2. 检查Tunnel 首末节点所在的网元间是否存在完整可达的链路。若不存在,修复链路中残缺或故障的部分。 3. 可选: 确认动态Tunnel 配置的“Route Constraint”条件和“C

11、olor”(亲和属性)是否正确。修正不正确的参数信息,具体操作请参见使用路径方式创建动态MPLS Tunnel 和FRR 保护。 4. 可选: 如果Tunnel 配置了带宽,检查链路带宽是否满足Tunnel 的要求。 原因2:交叉创建失败。 1. 检查网络中是否存在不同的网元使用相同的网段。如果存在,需要修改端口IP地址。 2. 检查Tunnel 是否配置了不兼容的保护特性。详细内容请参见版本说明书。 3. 查看Tunnel 所经过的网元或单板,确认已创建Tunnel 个数是否已经达到了最大值。如果是,需要重新规划或删除冗余的Tunnel。,Page 21,Tunnel常见故障处理方法(续),

12、原因3:Tunnel 所在的物理链路故障。 1. 查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或MP_DOWN 等告警,指示Tunnel 使用的物理链路故障。 2. 若存在,优先处理HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或MP_DOWN 告警。 3. 查看并处理系统中存在的下列告警:MPLS_TUNNEL_BDI、MPLS_TUNNEL_Excess、MPLS_TUNNEL_FDI、MPLS_TUNNEL_LOCV、MPLS_TUNNEL_MISMATCH、MPLS_TUNNEL_MISMERGE、MPLS_TUN

13、NEL_SD、MPLS_TUNNEL_SF、MPLS_TUNNEL_UNKNOWN 4. 检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异常情况。 原因4:保护倒换失败。 1. MPLS APS 保护倒换失败,参考保护故障处理。,Page 22,PW故障常见现象和原因,常见现象 PW 创建失败,业务不通。 PW 故障,业务中断或出现丢包、误码。,常见原因 原因1:LDP 会话创建失败,PW 创建不成功(动态)。 原因2:物理链路故障,LDP 会话失效。 原因3:PW 交叉建立失败。 原因4:PW 所在的Tunnel 故障。,Page 23,PW常见故障处理方法,原因1:LDP

14、 会话创建失败,PW 创建不成功(动态)。 1. 检查PW 两端网元是否配置了LDP 对等体。若未配置,需要重新配置LDP 对 等体。 2. 检查PW 两端参数是否配置正确。例如: “Control Word Use Policy”,是否一端配置为“Must Use”,另一端配置为“Nonuse”。 对Ethernet 业务,两端的“MTU”是否配置一致。 对CES 业务,两端的“RTP Head”、“Packet Loading Time”等参数是否配置一致。 原因2:物理链路故障,LDP 会话失效。 1. 检查PW 首末节点间物理链路是否正常,系统中是否存在HARD_BAD、LASER_M

15、OD_ERR、R_LOS 或ETH_LOS 等告警。 2. 若存在,优先处理HARD_BAD、LASER_MOD_ERR、R_LOS 或ETH_LOS告警。 3. 查询并处理系统中存在的PW_DOWN、PW_DROPPKT_EXC 或PW_EXC_TRAFFIC 告警。 4. 检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异常情况。,Page 24,PW常见故障处理方法(续),原因3:PW 交叉建立失败。 1. 查看PW 所经过的网元或单板,确认已创建PW 个数是否已经达到了最大值。如果是,需要重新规划或删除冗余的PW。 原因4:PW 所在的Tunnel 故障。 1. Tun

16、nel 故障,参考Tunnel故障处理。,Page 25,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 26,链路故障定位流程,Page 27,BTS 1,CES,CES,BTS 2,PTN,PTN,ETH链路告警排查,ETH,BTS 3,PTN,MPLS,PTN,PTN,MPLS,PTN,BSC,CoreNetwrok,PTN,BSC,10G/GE,GE/FE,STM-1,STM-1,10G/GE,ETH_LOS 光信号丢失,故障原因: (1)

17、光纤断;(2)光模块坏;(3)光衰减过大;,ETH_LINK_DOWN 网口连接故障,故障原因: 两端工作模式不一致,造成协商失败;电缆、光纤连接或者对端设备故障。,MAC_FCS_EXC 误码越限,故障原因: MAC层检测到误码越限;线路信号劣化;光纤性能劣化;光口不洁净,Page 28,BTS 1,CES,CES,BTS 2,PTN,PTN,SDH链路告警排查,ETH,BTS 3,PTN,MPLS,PTN,PTN,MPLS,PTN,BSC,CoreNetwrok,PTN,BSC,GE,GE/FE,STM-1,STM-1,GE/10GE,R_LOS 光信号丢失,故障原因: (1)断纤; (2

18、)线路衰耗过大; (3)对端站发送部分故障,线路发送失效;,R_LOC 时钟丢失,故障原因: (1)接收到的信号失效;(2)时钟提取模块故障;,R_LOF 帧丢失,故障原因: (1)接收信号衰减过大; (2)对端站发送信号无帧结构; (3)本板接收方向故障,Page 29,BTS 1,CES,CES,BTS 2,PTN,PTN,E1链路告警排查,ETH,BTS 3,PTN,MPLS,PTN,PTN,MPLS,PTN,BSC,CoreNetwrok,PTN,BSC,GE/10GE,GE/FE,STM-1,STM-1,GE/10GE,T_ALOS 信号丢失,故障原因: (1)E1/T1业务未接入;

19、 (2)DDF架侧E1/T1接口输出端口脱落或松动; (3)本站E1/T1接口输入端口脱落或松动; (4)单板故障; (5)电缆故障,ALM_E1RAI 远端告警指示,故障原因: 对端有告警;,Page 30,MLPPP故障定位流程,Page 31,MLPPP故障常见现象,Page 32,MLPPP故障常见原因,原因1:MP 组失效。 原因2:MP 组成员端口接收信号丢失。 原因3:高阶通道或低阶通道失效。 原因4:MP 组成员两端协议协商失败。 原因5:MP 组成员延时超过阈值。 原因6:业务通道误码超限。,Page 33,MLPPP常见故障处理方法,原因1:MP 组失效。 1. 查询是否存

20、在MP_DOWN 告警,参考告警和性能事件参考手册,清除MP_DOWN 告警。 原因2:MP 组成员端口接收信号丢失。 1. 检查MP 组各成员是否存在R_LOS、MS_AIS 或T_ALOS 告警,清除R_LOS、MS_AIS 或T_ALOS 告警。 原因3:高阶通道或低阶通道失效。 1. 检查MP 组各成员是否存在HP_SLM 或HP_UNEQ 告警。若存在,清除HP_SLM 或HP_UNEQ 告警。 2. 检查MP 组各成员是否存在TU_AIS_VC12 或TU_LOP_VC12 告警。若存在,清除TU_AIS_VC12 或TU_LOP_VC12 告警。,Page 34,MLPPP常见故

21、障处理方法(续),原因4:MP 组成员两端协议协商失败。 1. 检查MP 组各成员是否存在PPP_LCP_FAIL 或PPP_NCP_FAIL 告警。若存在,修改MP 组成员两端配置,清除PPP_LCP_FAIL 或PPP_NCP_FAIL告警。 原因5:MP 组成员延时超过阈值。 1. 检查MP 组是否存在MP_DELAY 告警,清除MP_DELAY 告警。 原因6:业务通道误码超限。 1. 检查MP 组各成员是否存在B1_EXC、B2_EXC、B3_EXC 或BIP_EXC 等告警,清除B1_EXC、B2_EXC、B3_EXC 或BIP_EXC 告警。,Page 35,目录,Tunnel故

22、障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 36,APS故障定位流程,Page 37,APS故障常见现象,Page 38,APS故障常见原因,原因1:APS 保护组两端配置不一致。 原因2:APS 保护组两端协议状态未激活。 原因3:光纤或电缆连接错误。 原因4:保护通道所在单板存在硬件类告警,无法发送APS 帧。 原因5:系统存在时钟类告警。 原因6:工作Tunnel 或保护Tunnel 故障。,Page 39,APS常见故障处理方法,原因1:APS 保护组两端

23、配置不一致。 1. 查询是否存在ETH_APS_PATH_MISMATCH 或ETH_APS_TYPE_MISMATCH 告警,参考告警和性能事件参考手册,清除告警。 原因2:APS 保护组两端协议状态未激活。 1. 检查APS 保护组是否存在ETH_APS_LOST 或ETH_APS_SWITCH_FAIL 告警,清除告警。 原因3:光纤或电缆连接错误。 1. 检查光纤或电缆连接是否正确,若不正确,重新连接光纤或电缆。,Page 40,APS常见故障处理方法(续),原因4:保护通道所在单板存在硬件类告警,无法发送APS 帧。 1. 检查APS 保护通道所在单板是否存在HARD_BAD、COM

24、MUN_FAIL 或BUS_ERR 等硬件类告警,若存在,清除告警后,查看APS 保护组是否能够正常倒换。 原因5:系统存在时钟类告警。 1. 检查系统是否存在TR_LOC、SYNC_C_LOS 或LTI 等时钟类告警, 若存在,清除告警后,查看APS 保护组是否能够正常倒换。 原因6:保护Tunnel 故障。 1. 检查工作Tunnel 或保护Tunnel 是否存在Tunnel 级别的告警,若存在,则该Tunnel 已失去保护能力,优先清除该Tunnel 存在的告警后,查看APS保护组是否能够正常倒换。,Page 41,LMSP故障定位流程,Page 42,LMSP故障常见现象,Page 4

25、3,LMSP故障常见原因,原因1:保护通道单板故障或单板离线,无法正常工作。 原因2:保护通道接收侧信号丢失或不可用。 原因3:线性复用段单双端模式不匹配。 原因4:K1、K2 字节失配或K2 字节失配。 原因5:保护通道接收信号中复用段B2 信号劣化或误码过量。,Page 44,LMSP常见故障处理方法,原因1:保护通道单板故障或单板离线,无法正常工作。 1. 查询系统当前告警,是否有HARD_BAD 或BD_STATUS 告警,并确定上报告警的单板, 参考告警和性能事件参考手册,处理HARD_BAD 或BD_STATUS 告警。 原因2:保护通道接收侧信号丢失或不可用。 1. 查询系统是否

26、有R_LOS 或R_LOF 告警,处理R_LOS 或R_LOF 告警。 2. 查询系统是否有MS_AIS 告警,处理MS_AIS 告警。 原因3:线性复用段单双端模式不匹配。 1. 查询系统是否有LPS_UNI_BI_M 告警,处理LPS_UNI_BI_M 告警。 原因4:K1、K2 字节失配或K2 字节失配。 1. 查询系统是否有K1_K2_M 或K2_M 告警,处理K1_K2_M 或K2_M 告警。 原因5:保护通道接收信号中复用段B2 信号劣化或误码过量。 1. 查询系统是否有B2_SD 或B2_EXC 告警,处理B2_SD 或B2_EXC 告警。,Page 45,LAG故障定位流程,P

27、age 46,LAG故障常见现象,Page 47,LAG故障常见原因,原因1:聚合组两端网元配置错误。 原因2:聚合组成员端口工作模式设置为半双工。 原因3:聚合组成员端口配置了环回。 原因4:聚合组成员端口连接故障或丢失。,Page 48,LAG常见故障处理方法,原因1:聚合组两端网元配置错误。 1. 查询当前告警,是否存在LAG_DOWN 或LAG_MEMBER_DOWN 告警。 2. 检查聚合组两端网元配置是否不一致,若不一致,修改两端网元配置一致后,查看告警是否清除。 原因2:聚合组成员端口工作模式设置为半双工。 1. 检查聚合组各成员端口的工作模式是否设置为半双工,若存在,修改端口工

28、作模式为全双工。 原因3:聚合组成员端口配置了环回。 1. 检查聚合组各成员端口是否存在LOOP_ALM 告警。若存在,重新设置端口的环回状态,清除LOOP_ALM 告警。 2. 检查聚合组各成员端口是否存在ETH_EFM_LOOPBACK 告警。若存在,禁止远端环回,清除ETH_EFM_LOOPBACK 告警。 原因4:聚合组成员端口连接故障或丢失。 1. 检查聚合组各成员端口是否存在ETH_LOS 或ETH_LINK_DOWN 告警, 若存在,参考告警和性能事件参考手册,清除告警。,Page 49,TPS故障定位流程,Page 50,TPS故障常见现象和原因,原因1:工作板故障,触发TPS

29、 保护倒换。 原因2:工作板硬复位,触发TPS 保护倒换。 原因3:人工下发强制倒换命令。 原因4:保护板不在位或故障。 原因5:同一TPS 保护组内其它工作板已发生TPS 保护倒换,无空余的保护板。,Page 51,TPS常见故障处理方法,原因1:工作板故障,触发TPS 保护倒换。 1. 查询当前告警,检查工作板是否存在HARD_BAD 等硬件类告警, 若存在,更换上报告警的单板。经过“等待恢复时间”后,业务将自动倒换回工作板。 原因2:工作板硬复位,触发TPS 保护倒换。 1. 在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。 2. 等待3 至5

30、分钟,当单板的工作状态转成绿色时,单板完成硬复位。 3. 再经过“等待恢复时间”后,业务将自动倒换回工作板,TPS 恢复原保护状态。 原因3:人工下发强制倒换命令。 1. 清除倒换,恢复原TPS 保护状态。,Page 52,TPS常见故障处理方法(续),原因4:保护板不在位或故障。 1. 查询当前告警,检查保护板是否存在BD_STATUS 告警或HARD_BAD 等硬件类告警, 若存在,参考告警和性能事件参考手册处理保护板的告警,或更换保护板。 原因5:同一TPS 保护组内其它工作板已发生TPS 保护倒换,无空余的保护板。 1. 查询本网元是否存在TPS_ALM 告警,若存在,说明已有其它工作

31、板触发了TPS 保护倒换,无空余的保护板。 2. 排除已触发TPS 保护倒换的工作板的故障,使保护板恢复保护状态后,确认是否可正常进行TPS 保护倒换,查看告警是否消除。,Page 53,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 54,时钟故障常见现象和原因,原因1:优先级表中业务板上的同步时钟源级别丢失。 原因2:同步时钟源丢失,网元的时钟处于不正常状态。 原因3:在SSM 模式下时钟源发生倒换,网元跟踪的时钟源也发生了倒换。 原因4:同步

32、时钟源的信号劣化。 原因5:外部时钟源丢失。 原因6:时钟进入非跟踪工作模式。 原因7:外部时间源丢失。,Page 55,时钟常见故障处理方法,原因1:优先级表中业务板上的同步时钟源级别丢失。 1. 查询系统是否有SYNC_C_LOS 告警,参考告警和性能事件参考手册,处理SYNC_C_LOS 告警。 原因2:同步时钟源丢失,网元的时钟处于不正常状态。 1. 查询系统是否有LTI 告警,处理LTI 告警。 原因3:在SSM 模式下时钟源发生倒换,网元跟踪的时钟源也发生了倒换。 1. 查询系统是否有S1_SYN_CHANGE 告警,处理S1_SYN_CHANGE 告警。 原因4:同步时钟源的信号

33、劣化。 1. 查询系统是否有SYN_BAD 告警,处理SYN_BAD 告警。 原因5:外部时钟源丢失。 1. 查询系统是否有EXT_SYNC_LOS 告警,处理EXT_SYNC_LOS 告警。 原因6:时钟进入非跟踪工作模式。 1. 查询系统是否有CLK_NO_TRACE_MODE 告警,处理CLK_NO_TRACE_MODE 告警。 原因7:外部时间源丢失。 1. 查询系统是否有EXT_TIME_LOC 告警,处理EXT_TIME_LOC 告警。,Page 56,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内

34、DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 57,带内DCN故障定位流程,Page 58,带内DCN故障常见现象和原因,常见原因 原因1:全网内的网元ID、网元IP 或者子网掩码存在冲突。 原因2:故障网元的带内DCN 端口未使能,或对接端口参数配置不一致。 原因3:故障网元与网管之间的物理连接中断。 原因4:接收信号丢失或接收光功率过低,无法提取DCN 报文。 原因5:单板故障。 原因6:DCN 穿越的第三方网络不健康,引入DCN 风暴或DCN 中断。 原因7:带内DCN 通道带宽配置过低。 原因8:故障网元主控板正在复位或发生了主备倒换,带内DCN 报文得不到响应。,

35、常见现象 网管与网元通信中断,网管上网元图标变灰色,网元脱管。 网管操作命令没有响应。若响应中断时间持续超过2 分钟,网管与网元通信中断。 网管查询信息部分丢失。,Page 59,带内DCN常见故障处理方法,原因1:全网内的网元ID、网元IP 或者子网掩码存在冲突。 1. 此原因一般由全网中新添加的网元引入。对照网元规划表,检查新网元的网元ID、网元IP、子网掩码的配置是否正确。 若配置错误,或与现有网元存在冲突,请正确配置新网元的参数。 原因2:故障网元的带内DCN 端口未使能,或对接端口参数配置不一致。 1. 检查是否存在光纤或电缆连接到默认使能DCN 的端口。如果没有,换用默认使能DCN

36、 的端口。 2. 检查链路两端的端口是否已使能DNC。如果没有,使能端口的带内DCN。3. 检查两端端口的参数配置是否一致,例如以太网端口的工作模式。如果不一致,修改参数配置使两端一致。 原因3:故障网元与网管之间的物理连接中断。 1. 检查故障网元的网线或光纤是否从端口中脱落。如果是,重新插上网线或光纤。 原因4:接收信号丢失或接收光功率过低,无法提取DCN 报文。 1. 检查网元的历史告警中是否存在R_LOS、ETH_LOS 或IN_PWR_ABN 等告警,清除相关告警。,Page 60,带内DCN常见故障处理方法(续),原因5:单板故障。 1. 查询单板的历史告警中是否存在HARD_BA

37、D 或TEMP_OVER 告警,若存在,更换上报告警的单板。 原因6:DCN 穿越的第三方网络不健康,引入DCN 风暴或DCN 中断。 1. 若带内DCN 通信穿越了第三方网络,需要检查第三方网络中是否存在端口环回、物理通道中断等故障。如果存在,需要立即排除第三方网络中的故障。 原因7:带内DCN 通道带宽配置过低。 1. 当端口配置的业务数量超过某一数目时,可能造成部分查询信息丢失,此时需要适当增大带内DCN 通道的带宽配置。 原因8:故障网元主控板正在复位或发生了主备倒换,带内DCN 报文得不到响应。 1. 观察主控板的PROG 指示灯是否处于绿灯闪烁状态,若是,则主控板正处于复位状态。等

38、PROG 指示灯常亮绿色时,主控板完成复位,DCN 将自动恢复连接。 2. 若DCN 未恢复响应,检查其它单板是否发生保护倒换,造成带内DCN 报文处于重路由状态。 3. 若存在单板发生保护倒换,等待DCN 完成重路由后,将自动恢复响应。,Page 61,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 62,网元ID 重复导致无法远程登录网元,现象:新建的PTN 网络中,NE01、NE02 和NE03 三个PTN 网元构成链形拓扑。可以从NE02远程登录到NE03,但从NE01 却无法远程登录NE03。 分析: 可能原因1:网元NE03 存在硬件故障导致DCN 不通。 可能原因2:网络配置错误。 处理步骤: 1、查询NE03 的相邻网元路由,发现NE03 的直连路由显示为NE01 和NE02 的网元ID。 2、复位NE03 后,故障依旧。 3、现场调查NE03,发现EFG2 单板的一个光口连接NE02,另一个原本应该是空余的光口,其L/A2 指示灯却在闪烁,证明该光口有数据正在传输。经询问,是客户自行将NE04 网元连接到NE03 上。 4、来到NE04 站点,登录

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论