网络kpi指标优化指导书_第1页
网络kpi指标优化指导书_第2页
网络kpi指标优化指导书_第3页
网络kpi指标优化指导书_第4页
网络kpi指标优化指导书_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

移动TD-LTE网络KPI指标优化指导书适用对象:TD LTE网优工程师摘要章节描述Error! Reference source not found. Error! Reference source not found.概述Error! Reference source not found. Error! Reference source not found.主要KPI指标介绍Error! Reference source not found. Error! Reference source not found.KPI指标监控流程Error! Reference source not found. Error! Reference source not found.KPI性能分析方法Error! Reference source not found. Error! Reference source not found.KPI优化分析专题Error! Reference source not found. Error! Reference source not found.结束语Error! Reference source not found. Error! Reference source not found.附录目录1概述12主要KPI指标介绍22.1指标的分类22.1.1按照网元对象分22.1.2按照统计时间粒度分22.1.3按照指标相关性分22.2接入类指标32.2.1RRC连接建立成功率32.2.2ERAB建立成功率42.3保持性指标52.3.1无线掉线率52.3.2ERAB掉线率(小区级)62.4移动性指标72.4.1切换成功率73KPI指标监控流程83.1KPI监控流程介绍83.2日常KPI监控流程93.3参数修改过程中KPI监控流程103.4ENodeB版本升级过程中的KPI监控113.5割接过程中的KPI监控124KPI性能分析方法124.1KPI性能分析方法124.1.1TOP N最坏小区分析法124.2KPI性能分析基本技能144.2.1KPI监控常用工具154.2.2KPI分析用到的工具154.3KPI优化分析过程165KPI优化分析专题195.1RRC建立成功率优化专题195.1.1RRC建立成功率的定义195.1.2RRC建立失败常见原因205.1.3优化措施215.2切换成功率优化专题235.2.1切换成功率的定义235.2.2切换失败常见原因245.2.3优化措施265.3KPI常见原因处理手段276结束语277附录287.1缩略语287.2参考资料30图目录图 1-1 KPI联合问题定位1图 3-1 日常KPI监控流程图9图 3-2 参数修改后KPI监控流程图10图 3-3 ENodeB版本升级KPI监控流程图11图 4-1 KPI优化分析流程图18图 5-1 RRC接入流程19图 5-2 TA接入统计分布21图 5-3 优化后RRC建立成功率22图 5-4 优化后无线掉线率22图 5-5 S1切换流程23图 5-6 EUTRAN邻接关系24图 5-7 同频同PCI配置25图 5-8 邻区错配25图 5-9 优化后切换成功率26表目录表 21 RRC连接建立成功率与质量等级4表 22 小区ERAB建立成功率与质量等级5表 23 业务掉话率与质量等级6表 24 分组域业务掉线率与质量等级7表 25 业务切换成功率与质量等级8表 41 TOP N最坏小区列表13表 51 掉话常见原因201 概述无线网络KPI是体现网络质量的直接体现,KPI监控也是我们发现问题的重要手段;KPI监控与优化主要集中在运维期间,网络问题不能靠用户投诉来解决,对一些异常的事件必须第一时间发现并提出相应解决方案,这样才能保证为用户提供良好的话音与数据业务。在网络建设初期主要是工程优化,由于用户少,工程质量等问题,在这个阶段的KPI优化没有太大的意义,关注点主要在RF调整上面,只要特别关注一下RRC 、ERAB 接入成功率、ERAB掉话率、RSSI指标即可;网络进入运维时期后,才是真正的KPI优化,也即是我们通常说的参数优化,通过各种参数的联合调整来降低某项指标,达到客户的要求。KPI数据来源于操作维护中心(OMC)的网管系统(NetNumen U31),对关键性能指标KPI数据进行分析,可得到各种指标的一个当前状态,这些指标的当前状态是评估网络性能的重要参考。当前我们关注的指标主要有网络保持性能、接入性能、移动性能、系统容量等;根据上述指标的当前值,判断并定位问题发生的区域、问题发生的范围、问题的严重程度;比如:某站点拥塞、某站点掉话率为10%、最坏小区比例、超忙小区比例、接入成功率、呼叫时延、切换成功率、重建立成功率等。关于KPI的分类,我们按照统计的来源将KPI分为业务KPI与网络KPI;业务KPI是指通过外场路测测得的KP数据,;网络KPI是指通过后台综合网管统计得到KPI数据;本文主要讨论的是网络KPI,通过网络KPI来发现网络问题。一般解决问题是通过后台KPI数据、告警数据、用户投诉、DT测试联合起来进行分析定位,最终给出解决方案。图 1-1 KPI联合问题定位2 主要KPI指标介绍KPI指标是通过ENB计数器的实现,通过后台网管定制统计出来的,能真实反映网络某项性能的情况,及时发现问题,使网络的风险降低。按照时间统计粒度分为:15分钟粒度、60分钟粒度、24小时粒度、周粒度、月粒度;按照统计对象分为小区级、ENB级。2.1 指标的分类2.1.1 按照网元对象分l 小区级指标l 小区对级指标l 天线PORT级指标l ENodeB级指标2.1.2 按照统计时间粒度分l 15分钟粒度l 30分钟粒度l 1小时粒度l 24小时粒度l 7天粒度l 月粒度2.1.3 按照指标相关性分l 保持性指标主要是包括ERAB掉话率,RRC掉话率、切换时掉话;l 接入类指标包括RRC连接建立成功率、ERAB指派成功率、无线接通率等等。l 移动性指标主要包括频内切换成功率、频间切换成功率、异系统硬切换成功率(LTE-2G、3G切换成功率)等等。l 资源类指标主要包括下行控制信道受限、CPU受限、业务信道受限、能承载的用户数、传输受限等等。l 系统容量类指标主要包括小区级、PS吞吐量等等。由于篇幅的限制,这里就每个类别里面的每个指标不一一叙述,可以参考随机文档性能指标参考.pdf,每个KPI指标实现的公式、相应计数器的定义、每个指标的分类、指标的取值范围等都可以在这里找到;对于单个的计数器定义与说明可以参考随机文档性能计数器参考.pdf,该文档主要阐述各计数器的定义及触发点;本章主要对一些常用的重点指标进行举例说明,同时也以表格的形式对每个指标进行了质量等级的划分,当指标质量等级为差时,就需要对该指标进行优化了,其余的指标用类似的方法可以自己来深入学习。本文以中移4G一期为背景,介绍当前外场较关心的接入,掉线,切换三大指标的定义和优化措施。所有指标定义以TD-LTE中移集团30个网管指标V1.0-502版本为基础。每个Counter取值采样点和Counter所代表的原因在性能计数器参考.pdf都有清晰的描述,在此不再一一介绍。2.2 接入类指标2.2.1 RRC连接建立成功率本指标反映eNodeB或者小区的UE接纳能力,RRC连接建立成功意味着UE与网络建立了信令连接。RRC连接建立,包括(如位置更新、系统间小区重选、注册等)的RRC连接建立。公式中分子和分母涉及的计数器都是RRC Connection Request消息中信元Establishment cause中的所有原因。分子是RRC连接建立成功次数,分母是RRC连接建立尝试次数。对外公式都采用成功+失败来表示请求,实际上也要参考或核对请求计数器。 公式定义:RRC连接建立成功率=RRC连接建立成功次数/ RRC连接建立请求次数*100% RRC建立连接成功率 KPI指标取值与质量等级表 21 RRC连接建立成功率与质量等级序号统计对象统计粒度取值范围质量等级1CLUSTER/Cell级24小时小于80%差2CLUSTER/Cell级24小时80%-98%良3CLUSTER/Cell级24小时大于98%优2.2.2 ERAB建立成功率本指标用于了解该小区内UE业务建立成功的概率,部分反映了该小区范围内用户发起的业务的感受度。比较准确的做法 :分子是ERAB建立成功次数,分母是ERAB建立尝试次数。E-RAB建立成功则是成功为用户分配了用户平面的连接。 公式定义:ERAB建立成功率=E-RAB建立成功数/E-RAB建立请求数*100% E-RAB 建立成功率 KPI指标取值与质量等级表 22 小区ERAB建立成功率与质量等级序号统计对象统计粒度取值范围质量等级1CLUSTER/Cell级24小时小于80%差2CLUSTER/Cell级24小时80%-98%良3CLUSTER/Cell级24小时大于98%优2.3 保持性指标2.3.1 无线掉线率无线掉线率反映了系统的业务通讯保持能力,也反映了系统的稳定性和可靠性。UE掉话是指由于异常原因被UE主动发起RRC释放的情况;公式统计的是异常原因的掉话率,现在归为正常释放的原因值包括:用户不活动(inactive)、操作维护干预、过载控制导致的释放、CCO、重定向,其他情况归为异常。 公式定义:无线掉线率=(eNB请求释放上下文数-正常的eNB请求释放上下文数)/初始上下文建立成功次数*100% 无线掉线率 KPI指标取值与质量等级表 23 业务掉话率与质量等级序号统计对象统计粒度取值范围质量等级1CLUSTER/Cell级24小时大于1.5%差2CLUSTER/Cell级24小时1%-1.5%良3CLUSTER/Cell级24小时0.4%-1%优2.3.2 ERAB掉线率(小区级)无线掉线率反映了系统的业务通讯保持能力,也反映了系统的稳定性和可靠性。本指标用于了解该小区内UE进行掉话的概率,部分反映了该小区范围内用户进行业务的感受度。掉话是指由于异常原因被ENB主动发起ERAB释放的情况;公式统计的是异常原因的掉话率,现在归为正常释放的原因值包括:用户不活动、操作维护干预、过载控制导致的释放、重定向、CCO等,其他情况归为异常。 公式定义ERAB掉线率= (切出失败的E-RAB数 +eNB请求释放的E-RAB个数 -正常的eNB请求释放的E-RAB数)/( 遗留E-RAB个数 +E-RAB建立成功数 +切换入E-RAB数 )*100% E-RAB掉线率 KPI指标取值与质量等级表 24 分组域业务掉线率与质量等级序号统计对象统计粒度取值范围质量等级1CLUSTER/Cell级24小时大于4.0%差2CLUSTER/Cell级24小时2.0%-4.0%良3CLUSTER/Cell级24小时小于2.0%优2.4 移动性指标2.4.1 切换成功率切换成功率是系统移动性管理性能的重要指标,切换过程不区分同频/异频。 公式定义:切换成功率=(eNB间S1切换出成功次数+ eNB间X2切换出成功次数+ eNB内切换出成功次数)/(eNB间S1切换出请求次数+ eNB间X2切换出请求次数+ eNB内切换出请求次数)*100% 切换成功率 KPI指标取值与质量等级表 25 业务切换成功率与质量等级序号统计对象统计粒度取值范围质量等级1CLUSTER/Cell级24小时小于90%差2CLUSTER/Cell级24小时90%-98%良3CLUSTER/Cell级24小时大于98%优3 KPI指标监控流程KPI监控的目的:第一时间发现影响业务及用户感受的网络异常事件并解决之;如:某个站点掉话率超过了50%,我们就要第一时间发现它,并找出解决问题的办法。鉴于KPI问题发现的及时性及重要性,我们须有一套合理的KPI监控机制及解决问题的流程。同时,需要有合适的监控工具、分析工具来配合工作。及时发现由于传输问题、资源拥塞、小区退服、干扰严重、NodeB硬件故障、ENODEB参数配置错误等引起的业务掉话; 我们对KPI监控大概分为四类:1.日常的KPI监控;2.参数修改过程中的KPI监控;3.ENODEB、NodeB版本升级过程中的参数修改;4.用户割接过程中的KPI监控。KPI日常监控是一项长期的工作,需要每天监控,形成例行的工作,并通过采用KPI日报方式进行汇报,日报的内容主要包括CS最坏小区、PS最坏小区、RRC连接成功率低的最坏小区、资源受限最坏小区等等;做到及时预警和解决问题。3.1 KPI监控流程介绍KPI监控主要有四类监控内容,分别为:日常KPI监控、参数修改过程中的KPI监控、ENodeB版本升级过程中KPI监控、用户割接过程的KPI监控。各项监控又有不同的监控内容,以及不同的输出形式;如日常KPI监控用日报的形式来体现,其他用KPI对比报告形式来体现;各类监控形式又根据处理的问题不同,提取的KPI指标采用的统计时间粒度也不同,粒度的选择按照问题定位的需要来决定。KPI日常监控是一个长期工作,最终以日报的形式输出,并且将各类最坏小区汇总后,以邮件的形式发给相关人员进行处理。3.2 日常KPI监控流程图 3-1 日常KPI监控流程图EMS导出全网粒度1天cell级数据用KPI工具筛选最坏小区输出Excel形式KPI日报参数问题交规划人员处理最坏小区分类问题处理小组对各类最坏小区分类、汇总、定位交网优人员处理交研发或用服处理用固定格式邮件发给相关人员覆盖问题设备/版本问题3.3 参数修改过程中KPI监控流程图 3-2 参数修改后KPI监控流程图3.4 ENodeB版本升级过程中的KPI监控图 3-3 ENodeB版本升级KPI监控流程图继续监控(15分钟粒度)执行工单升级到新的版本网络KPI监控(15分钟粒度)簇级KPI是否正常是否回退当前版本版本邮件和电话通知执行负责人正式word报告输出(指标修改前后小时粒度KPI对比一小时输出一次)是否否结束定位最坏小区,是否与版本升级有关系是3.5 割接过程中的KPI监控在整网割接替换其他厂家的网络中,比如香港的CSL网络,该网络是我们替换诺基亚的设备;当我们的网络优化好后,将现网的用户要逐步割接到我们网络,在每次割接过程中,用户会不断注册到我们的网络,在网络负荷增加的情况下,要密切关注KPI指标的变化;该监控流程、监控内容、监控方法、以及报告输出与上一节ENodeB版本升级过程中的监控是一样的,具体内容参考ENodeB版本升级时KPI监控一节内容。4 KPI性能分析方法4.1 KPI性能分析方法不同的网络问题有不同的性能分析方法,在掌握现网运行情况和存在的问题后,选择合适的一种或多种分析方法,常用的性能分析方法有: 1. TOP N最坏小区法:按照所关注的话务统计指标(如掉话率、连接成功率、切换失败率等),根据需要取忙时平均值或全天平均值,找出最差的N个小区,作为故障分析和优化的重点,也可以据此排定优化工作的优先顺序。2. 时间趋势图法:指标统计的趋势图是话务分析的常用方法,分析工程师可以按小时、天或周作出全网、Cluster或者单个小区的单个或多个指标的变化趋势图,从中发现话务统计指标的变化规律。3. 区域定位法:网络性能指标的变化往往发生在部分区域,由于话务量增长、话务模型变化、无线环境改变、少数基站故障或上下行干扰造成了这些区域的指标变差,从而影响到全网的性能指标,可以对比变化前后的网络性能指标,在电子地图上标出网络性能变化最大的基站或扇区,围绕问题区域重点分析。4. 对比法:一项话务统计指标往往受多方面因素的影响,某些方面改变,其他方面可能没有变化,可以适当选择比较对象,证实问题的存在,并分析问题产生的原因。看指标时,不能只关注指标的绝对数值是高是低,关心的应该是指标的相对高低情况。4.1.1 TOP N最坏小区分析法在KPI优化分析的整个过程中,TOP N最坏小区分析法是最有效的一个手段,贯穿与整个优化阶段;主要是通过对TOP N小区的关注,可以解决网络的主要问题;每天网络中都有可能发生一些异常的掉话事件,这些事件可能代表一类问题,解决了TOP N最坏小区的问题就可以解决这一类的问题,所以我们从TOP N小区着手是最好最直接的解决问题的办法之一。TOP最坏小区分析法适用与所有的指标优化分析,主要是根据一定的门限值选出TOP N最坏小区,这个门限的定义根据指标的不同而不同;N是最坏小区的个数,当最坏小区比较多且没有精力去关注的时候,可以将N的个数适当的减少,只关注最差的小区。TOP N小区分析方法主要有下面几个步骤:第一步:按照关注指标的条件筛选出TOP N小区;第二步:对TOP N小区进行健康性检查,检查最坏小区的 传输、单板问题,或者是不是由于某突发的外界事件造成,如恶劣天气、集会、节假日的高话务造成;第三步:检查小区无线参数配置、邻区、小区半径,与正常小区进行比较;第四步:导出与所关注指标关联最紧密的指标进行分析,从侧面来发现问题所在;例:某网络出现全网的切换成功率变差的情况,现在对切换成功率采用TOP N分析方法分析问题;详细操作可以参考如下案例:第一步:按照关注指标的条件筛选出TOP N小区;我们用 KPI分析功能筛选出TOP N小区(也可以用其他的工具选出,导出到EXCEL 排序),这里我们取切换失败次数高的个最坏小区;表 41 TOP N最坏小区列表开始时间结束时间ME ID名称YY-切换成功率分子YY-切换成功率分母切换失败次数2013-12-30 00:00:002013-12-31 00:00:000040_广州广州大桥南FE(40)1226424458121942013-12-28 00:00:002013-12-29 00:00:000040_广州广州大桥南FE(40)74031674993462013-12-29 00:00:002013-12-30 00:00:000040_广州广州大桥南FE(40)89671762586582013-12-30 00:00:002013-12-31 00:00:001484_广州周门丽安大厦FEprc(1484)2721526325422013-12-29 00:00:002013-12-30 00:00:000301_广州碧海大厦FE(301)4844693820942013-12-28 00:00:002013-12-29 00:00:001484_广州周门丽安大厦FEprc(1484)2424398615622013-12-28 00:00:002013-12-29 00:00:000301_广州碧海大厦FE(301)455857261168第二步:检查TOP N最坏小区的 、传输、硬件问题,或者是不是由于某突发的外界事件造成,如恶劣天气、集会、节假日的高话务造成;接下来对每个小区进行健康性检查,主要关注点在日常告警、BPL单板/RRU问题等等,经过检查发现这些站点的切换目标侧都无告警,但这些站点都出现切换过程中在目标侧准备失败的问题。第三步:检查小区无线参数配置、邻区、小区半径,与正常小区进行比较;1.小区状态问题:经过核查,没有问题。2.配置问题:小区参数配置,没有问题。3.telnet到前台发现BPL单板核2无法连接,怀疑单板故障。现场更换BPL单板后,问题解决。4.2 KPI性能分析基本技能掌握KPI统计工具及分析工具的应用:1.使用工具可以快速了解全网运行情况,快速的筛选出TOP N最坏小区列表;2.使用不同的分析工具可以多方位多维度的定位问题,迅速找到问题点;掌握信令流程和基本原理:l 异常定位分析中能够有的放矢,根据流程和基本原理能够迅速查找其他的相关指标进行辅助分析。l 熟悉流程和原理,可以把异常的KPI和网络问题(如覆盖问题、干扰问题等)有机关联,根据异常KPI大致确定问题的性质,从而选择相应分析工具进行深入分析。性能分析工作要求工程师掌握基本的信令流程,熟悉标准口的协议栈,了解产品实现有哪些相关算法;对于名目繁多的RRM算法,工程师至少要从概念上有所了解,如果分析的商用网络中包含部分算法,则需要对这些算法进行深入的学习。4.2.1 KPI监控常用工具l 网管工具NetNumenU31:统计KPI原始数据、告警数据、小区无线参数配置、地面参数配置;l KPI日报生成工具:对重要指标按某种条件进行分类,筛选出最坏小区;4.2.2 KPI分析用到的工具l CNO工具:CNO具有KPI分析功能,可以按照各种条件筛选最坏小区,并且指出该指标对应的计数器;该工具的使用方法参考ZXPOS CNO1-LTE 应用指导书或者软件帮助;l SignalTrace :跟踪ENB各接口信令;可以跟踪S1,X2口以及Uu口(和UE 的RRC层交互信令)的信令,查KPI问题最常用的就是RRC信令。能够进行ENB信令跟踪,这是对外场KPI优化及网优及维护人员的基本要求。该信令跟踪工具非常强大,用于KPI分析的主要是按照小区(UE_Cell)和按照IMSI(或GID)进行跟踪。前者可以跟踪多个用户的信令,后者只跟踪一个用户的信令,但如果RRC链接过程没有完成,则无法跟踪,主要是因为ENB只有在RRC链接过程完成后才能够从CN得到该用户的IMSI。该工具的使用方法参考TD-LTE(12.13.xx)网管网优常用工具及操作指导书_R1.3;l ENB关联日志:关联日志的应用场景一般是:出现异常且没有跟踪到RRC信令,可以通过关联日志进行异常时间上下文信令分析来定位。异常可以按照GID (或IMSI)和小区id来进行查询。关联日志的另一个应用是可以对各种异常进行汇总统计;l ENodeB LMT :ENodeB本地操作维护的工具,除具备OMCB的全部操作功能外,还可以提供更详细的小区,UE等信息采集。ENodeB的本地维护(LMT)系列工具包括EOMS,MTSl NodeB 异常探针: 在LTE商用局外场,ENodeB异常探针分析是监控基站运行状况的有效手段,ENodeB各模块在发现异常后会自动记录相关信息,便于定位问题。但此方法需要较专业的背景知识,即需要了解各单板及模块的功能和接口;现场人员如果不能做简单的分析,只要获取异常探针发给后方研发人员就可以。ENodeB上报的异常探针,存储在各自OMCB服务器上。NodeB异常探针分析,需要分别从不同的OMCB服务器FTP下载异常探针文件,再使用异常探针工具进行分析汇总。l CTS工具:CTS是端对端工具,可以按照IMSI进行深度信令跟踪,尤其可以跨MME边界进行跟踪,这样就非常适合对VIP用户的跟踪;如果采用SignalTrace进行跟踪,则需要多个ENODEB进行跟踪,比较麻烦。CTS可以跟踪内部网元之间的交互信令,可以跟踪S1口及Uu口的信令,这就是所谓的深度跟踪。其基本原理就是在CTS server上建立IMSI任务,将该IMSI任务送到CN前台,CN前台再通过和CN个模块及ENODEB约定好的接口送给各个模块,各模块收集到这个IMSI相关信令后通过前台汇总到CTS server上。上述的接口属于私有接口,所以,这个工具只能支持我们自己的CN和ENODEB(其他厂商的核心网需要进行对接)。CTS信令可以采用离线工具进行查看分析。该工具的使用可参考TD-LTE CTS信令跟踪工具使用指导手册l UE log: KPI指标的分析过程中,DT测试也是非常重要的辅助手段;很多问题,从网络侧的一些信令跟踪及trace常常无法定位问题,只有结合UE log才能最终分析定位。我们常用的路测软件有QXDM/APEX(QCAT),CNT/CNA等。 CNT/CNA都是网优常用路测软件,CNT/CNA的使用方法详见相应的帮助文档及网优工具部对外发布的说明文档。其中高通提供的QXDM及解析工具APEX(QCAT),功能非常强大,多年以来,为我们系统的稳定成熟及提高做出了重大贡献。4.3 KPI优化分析过程分析思路:KPI优化过程就是一个发现问题并解决问题的过程;运维阶段的KPI优化主要是从后台网管提取所关注的性能数据,对性能数据分类汇总,将汇总的值与局方的要求值进行比较,如果某个指标比局方要求的值低,那么就要对该指标进行重点的分析,找到影响该指标的因素并提出解决方案,最后输出报告给局方;如果指标比局方要求的高则不需要特别关注。KPI指标分析过程是一个从宏观到微观,从全局到局部的一个过程;1.第一步,从全网的角度来看重点指标的情况,如果没有什么问题则不用做何处理,否则要定位发生问题的ENB网元;2.第二步,对相应CLUSTER指标数据进行分析,找出指标有问题的CLUSTER;3.第三步,对问题CLUSTER下面的小区级指标进行分析,找出最坏小区或TOP N小区,如果该CLUSTER所有小区的指标普遍较低,这种共性的现象可能是由于参数设置造成,核查一下该CLUSTER下小区与正常CLUSTER下小区的无线参数配置是否一致; 4.第四步,综合最坏小区的KPI数据、告警数据、DT测试数据、用户投诉情况四类数据综合分析,提出解决方案。- 问题排除法:从网管的告警数据中可以直接检查该ENodeB,BPL板、传输的运行情况,如果问题存在明显的传输断链、硬件设备等,可以很快定位问题原因;- 突发事件关联:对大量站点出现的问题就需要考虑是否是由于突发事件造成;比如大型集会、恶劣天气、误操作等都会对网络指标造成影响,根据各自的程度深浅,影响的范围也有所区别;- 无线参数比较法:如果出现某些站点突然出现故障,还可以检查该小区无线参数的配置,与其它正常小区的无线参数配置是否一致,如果不一致则改为一致,因为该小区可能是由于无线参数被误改而造成指标下降;- 指标关联法:如果某指标较差,一定要看一下与之相关联的指标情况,往往从这些关联的指中能发现共同的问题;- 综合定位法:排除了以上几个原因后,运用DT数据、KPI数据、ENB信令分析等数据,综合分析指标问题,可以定位出小区的指标问题。图 4-1 KPI优化分析流程图5 KPI优化分析专题本章主要介绍如何从网管数据来分析指标问题,以及如何结合计数器来优化KPI的思路,每个专题详细的分析方法及案例见各专题优化指导书。5.1 RRC建立成功率本章主要从网管的角度来分析问题,通过参数的调整达到优化的目的。5.1.1 RRC建立成功率的定义从空口信令上看,RRC建立过程如下:图 5-1 RRC接入流程 、本流程图表述了RRC连接建立过程。包含了RRC连接建立成功,RRC连接建立被拒绝和RRC连接建立失败过程。l 采样点1:eNodeb接收到UE的RRC连接建立请求消息,进行采样统计。l 采样点2:eNodeb发送RRC连接建立消息,进行采样统计。l 采样点3:eNodeb接收到RRC建立完成消息,进行采样统计。l 采样点4:eNodeb发送RRC连接拒绝消息,进行采样统计。l 采样点5:eNodeb等待RRC连接建立完成消息定时器超时,采样统计。RRC建立失败常见原因表 51 掉话常见原因指标或计数器指标公式或计数器描述信息Cmt-Access类型RRC连接失败次数,定时器超时(次)Cmt-Access类型RRC连接失败次数,eNB接纳失败(次)Cmt-Access类型RRC连接失败次数,其他原因(次)Cmo-Signalling类型RRC连接失败次数,定时器超时(次)Cmo-Signalling类型RRC连接失败次数,eNB接纳失败(次)Cmo-Signalling类型RRC连接失败次数,其他原因(次)Cmo-Data类型RRC连接失败次数,定时器超时(次)Cmo-Data类型RRC连接失败次数,eNB接纳失败(次)Cmo-Data类型RRC连接失败次数,其他原因(次)ChighPriorityAccess类型RRC连接失败次数,定时器超时(次)ChighPriorityAccess类型RRC连接失败次数,eNB接纳失败(次)ChighPriorityAccess类型RRC连接失败次数,其他原因(次)Cemergency类型RRC连接失败次数,定时器超时(次)Cemergency类型RRC连接失败次数,eNB接纳失败(次)Cemergency类型RRC连接失败次数,其他原因(次)5.1.2 影响RRC接入成功率的因素影响RRU接入的主要因素如下,可在优化RRC成功率时参考1,基站故障2,基站参数,PRACH配置,最小接入电平设置,3,上行干扰,NI太高4,弱场接入,RRC无法完成。 弱场接入案例就某项目外场统计结果来看,RRC接入失败多发生在C(mo-Signalling类型RRC连接失败次数,定时器超时)即初始接入MSG5超时。现场在排除无线环境、NI、基站故障等异常的情况下,仍然发现不少基站存在MSG5超时的问题。查看版本默认配置的小区最小接入电平值(当前为-130dBm),怀疑此值设置过于宽松,容易造成远距离接入而导致MSG5超时。对经常发生MSG5超时的基站统计其TA,TA分布如下。图 5-2 TA接入统计分布为了保证接收侧(eNodeB侧)的时间同步,LTE提出了上行定时提前(Uplink Timing Advance)的机制。在UE侧看来,timing advance本质上是接收到下行子帧的起始时间与传输上行子帧的时间之间的一个负偏移(negative offset)。eNodeB通过适当地控制每个UE的偏移,可以控制来自不同UE的上行信号到达eNodeB的时间。对于离eNodeB较远的UE,由于有较大的传输延迟,就要比离eNodeB较近的UE提前发送上行数据。最终目的是当不同距离的UE接入同一eNodeB时,为了保证上行传输的正交性,避免小区内(intra-cell)干扰,eNodeB要求来自同一子帧但不同频域资源(不同的RB)的不同UE的信号到达eNodeB的时间基本上是对齐的。1TA=16Ts=16*32.55ns*/2=78m从以上统计可以看出,问题基站的TA都集中在TA14,20以后了,即14*78m=1092m。按照项目现场布局,属于远距离接入,且数量较多符合之前的猜想。对此,项目组决定统一修改小区最小接入电平值由-128dbm改为-120dbm,规避超远距离接入带来的MSG5超时问题同时降低掉话率。优化措施2013年12月11日对全网修改此参数后,RRC建立成功率和无线掉线率指标明显提升。图 5-3 优化后RRC建立成功率图 5-4 优化后无线掉线率 上行干扰案例提取TOP小区每小时的RRC建立成功率,与每小时粒度的NI相对比,观察是否RRC建立成功率低时,NI值升高。对比底噪值与RRC连接建立成功率可以发现,当100个RB计数器噪声之和超过-9000dBm之后,RRC连接建立成功率将明显下降。如果因干扰导致接入成功率突降,需要进行干扰排查 基站故障案例TDD西安陕西宾馆新办公楼3小区均出现RRC建立成功率低,核查发现基站出现故障。小区名称TDD西安陕西宾馆新办公楼TDDRRC连接建立成功率(百分比)39.43%RRC失败次数5575mt-Access类型RRC连接建立成功次数(次)7109mo-Signalling类型RRC连接建立成功次数(次)1706mo-Data类型RRC连接建立成功次数(次)39274highPriorityAccess类型RRC连接建立成功次数(次)0emergency类型RRC连接建立成功次数(次)0mt-Access类型RRC连接失败次数,定时器超时(次)1202mt-Access类型RRC连接失败次数,eNB接纳失败(次)897mt-Access类型RRC连接失败次数,其他原因(次)470mo-Signalling类型RRC连接失败次数,定时器超时(次)471mo-Signalling类型RRC连接失败次数,eNB接纳失败(次)2535网元反复出现如下告警,导致RRC连接建立成功率降低。网元告警级别告警码发生时间告警类型西安陕西宾馆新办公楼主要小区退出服务()2014-4-14 16:11服务质量告警严重RRU链路断()2014-4-14 16:14处理错误告警主要天馈驻波比异常()2014-4-14 16:02设备告警严重设备掉电()2014-4-14 16:11设备告警主要CPU过载严重告警()2014-4-13 11:15处理错误告警次要CPU过载告警()2014-4-13 11:12处理错误告警主要光口接收链路故障()2014-4-13 10:43通信告警主要单板处于初始化状态()2014-4-13 10:39处理错误告警严重软件运行异常()2014-4-13 10:39处理错误告警5.2 ERAB建立成功率ERAB建立失败较多时,首先核查基站有无影响业务的告警,如传输类,RRU类故障。如果没有告警,则需要继续分析失败原因。通过跟踪基站信令观察ERAB建立失败过程。起始时间小区名称TDDE-RAB建立成功率(百分比)初始的E-RAB建立失败次数,其他原因(个)2014-4-13TDD西安小寨ZT-XABO719TL-0(1)64.14%74332014-4-13TDD西安小寨ZT-XABO719TL-1(2)63.35%31602014-4-13TDD西安小寨ZT-XABO719TL-2(3)64.58%1395使用系统工具中的信令跟踪功能,跟踪UE级小区信令;查看ERAB建立失败原因,针对具体原因进行排查5.3 切换成功率优化专题5.3.1 切换成功率的定义切换分同频、异频切换,小区间、基站间切换。本章节以S1口基站间同频切换为例,其切换流程如下图 5-5 S1切换流程当eNodeB接收到从UE来的测量报告消息,根据消息进行判决,如果条件满足eNodeB间S1切换,则触发UE在eNodeB间切换过程。eNodeB发送切换请求消息给MME。目标eNodeB接收到MME的Handover Request消息,进入资源准备。如果资源准备成功,给MME回复Handover Request Acknowledge。如果资源准备失败,则给MME回复HandoverFailure。MME给源侧eNodeB发送Handover Preparation Failure,切换准备过程结束。源侧eNodeB接收到从MME来的Handover Command消息,则发起切换过程,给UE发送Handover Command(i.e. RRC Connection Reconfiguration)。目标侧eNodeB接收到UE的RRC重配完成消息后,发送Handover Notify消息给MME,指示UE已经成功切换到了目标小区。MME接收到Handover Notify消息后,给源eNodeB发送UE Context Release Command消息,切换过程成功结束。切换失败常见原因切换成功率统计点都是在切换出一侧进行统计,排查该指标时建议使用网管EUTRAN邻区关系对进行统计,通过该手段能及时发现切换出源侧和目标侧的问题,如在目标侧准备失败、在目标侧无法建立回源侧发起重建立、切换等待响应超时等。图 5-6 EUTRAN邻接关系5.3.2 切换成功率低处理思路切换过程中包含切换准备阶段,与切换执行阶段,2个阶段涉及到的因素各不一样,因此需要分开来处理。具体来说,切换准备失败问题,多由外部邻小区参数配置错误(邻区配置正确)或者切换准备目标基站故障引起。分类原因有换出准备失败次数,等待切换响应定时器超时(次)切换出准备失败次数,目标侧准备失败(次)切换出准备失败次数,其它原因(次)切换出准备失败次数,源侧发生重建立(次)切换执行失败,发生在切换命令下发后,终端执行时失败,与无线环境,邻区配置的合理性强相关。分类原因有源侧发生重建立(次)目标侧发生重建立(次)其它原因(次)RRC重配完成超时(次)分析切换失败,可定制测量类型为:LTEE-UTRAN邻接关系的KPI报表,统计每一个邻区对的切换情况。需要用到的计数器模板如下:对于整网切换成功率较低的网络,可以先按切换细分模板提出整网指标,分析切换准备与执行那个导致的失败次数较多,再按TOP小区针对分析处理。 切换准备失败处理切换准备失败需要提取切换准备相关的计数器分解,查看具体的准备失败原因。切换准备失败主要关注邻区参数的正确性。切换准备失败需要定期核查现网邻区数据,保证数据的有效与准确核查对象:1.现网中邻区参数配置错误的,如外部小区定义中与邻接基站定义不一致的;定期提取规划数据,进行核查2,现网中对异厂家站点邻区定义错误的,需定期索取异常家工参核查;现网中邻区基站ID错误的,即不存在于异厂家网管,也不存在与中兴网管中的邻区关系。需要删除这类邻区数据。3.定期核查现网中超远邻区关系。市区内暂以2.5KM为界,郊县不受此限制核查外部邻小区配置参数是否正确。核查规划参数配置表中ExternalEUtranCellTDD邻小区的相关配置参数,是否与邻接基站无线参数配置一致。推荐核查工具:健康卫士核查结果:切换准备失败原因为切换出准备失败次数,其它原因(次)时,需要详细分析。 切换执行失败处理切换执行阶段失败同样需要提取切换准备相关的计数器分解,查看具体的执行失败原因。l 切换出执行失败次数较多,且成功率为0的小区对,重点核查切换目标小区是否与周边站点同频同PCI,邻区配置是否合理,是否加了较远的站点为邻区,且与周边站点同PCI。l 切换出执行次数较多,有一定几率成功,有一定几率失败的邻区对,核查目标基站否存在上行干扰,如果存在上行干扰,即需要进行干扰排查。l 超级小区配置邻区,当主小区与辅小区邻区PCI相同时,只能配置超级小区主小区之间的邻区,不能配置主小区到辅小区的邻区。非超级小区也不能添加对辅小区的邻区。否则会造成切换执行失败。l 对于异频切换执行失败较多的站点,核查异频启动测量A2事件和A3事件配置是否合理。5.3.3 案例 切换准备失败案例两个小区(71129、71238)均为切换至昌平沙河东北ZL-2(0:460:00:71246:2)失败,失败原因均为切换准备时目标侧准备失败,而且绝大多数均为X2切换失败:切换准备失败信令跟踪:基站分布图失败原因是由于在做切换时,发送X2切换请求后,目标侧基站回复准备失败,拒绝原因是“未知的MME Code”,经核查发现是由于目标侧基站配置SCTP偶联时只配置了对一个MME,漏配了一个。把对相应MME的SCTP进行添加后,问题解决。 切换执行失败案例提取小区对级的切换指标,统计邻区对的切换成功率TDD西安外国语学院-ZLH-XABO436TL-2(3)小区切换至目标小区_1小区切换出执行成功率为0,核查该站外部邻区关系中(ExternalEUtranCellTDD)_1小区PCI为69。但该站ID在中兴网管中并不存在,在异厂家工参中也不存在,是错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论