基于世博应用的MSC POOL设备维护方式的研究与应用.doc_第1页
基于世博应用的MSC POOL设备维护方式的研究与应用.doc_第2页
基于世博应用的MSC POOL设备维护方式的研究与应用.doc_第3页
基于世博应用的MSC POOL设备维护方式的研究与应用.doc_第4页
基于世博应用的MSC POOL设备维护方式的研究与应用.doc_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于世博应用的msc pool设备维护方式的研究与应用二一年六月目录摘要5第1章引言61.1概述61.2msc pool技术原理简介6第2章msc pool设备重要参数的设置及相关问题的研究102.1msc pool重要参数及功能研究102.1.1msc pool关键参数102.1.2msc pool新增功能介绍122.2世博msc pool参数设置及功能开启情况132.2.1msc pool关键参数设置132.2.2msc pool新增功能开启情况142.3关于msc pool覆盖范围的研究152.3.1问题研究主体152.3.2研究结果分析152.4手机终端与nssf节点间适配问题的分析和解决152.4.1问题的研究主体152.4.2研究过程162.4.3研究结果分析172.5关于bsc/rnc不支持msc pool组网问题的解决建议182.5.1问题的研究主体182.5.2研究过程182.5.3研究结果分析192.6msc pool中某msc-s退服后对被叫业务的影响和解决建议202.6.1问题的研究主体202.6.2研究过程202.6.3研究结果分析212.7关于爱立信msc pool交换机模块反复重启问题的分析232.7.1问题的研究主体232.7.2研究过程232.7.3研究结果分析24第3章msc pool工程相关注意点253.1总体建设原则253.1.1msc pool建设原则253.1.2msc pool适用场景253.1.3msc pool建设方案253.1.4项目管理要求263.2新建msc pool263.2.1机型确定263.3端局改造入msc pool273.3.1改造基本流程273.3.2前期测试过程中发现的问题30第4章关于解决msc pool下指定用户向指定交换机迁移问题的设想314.1问题的发现314.2两种可行的替代方案324.2.1bsc修改参数法324.2.2微蜂窝法364.3探索新的解决方案364.3.1利用msc设备内部参数的解决方案364.3.2手机强制修改tmsi39第5章世博msc pool话务模型的研究405.1话务模型的定义以及研究话务模型的意义405.1.1话务模型的定义405.1.2研究话务模型的意义405.2世博msc pool话务模型与内环区域话务模型比较41第6章msc pool网络管理及维护方式的研究446.1msc pool维护手段使用情况分析446.1.1几种现网正在使用的msc pool维护手段446.1.2各类维护手段中存在的问题456.2msc pool网络维护新理念的探讨466.3msc重大故障时的统一处理流程47第7章结论与展望517.1结论517.2未来工作展望52摘要本项目的研究意在就msc pool技术应用到现网后,针对其组网和技术的新特性,就维护、保障和优化工作提出有针对性的维护解决方案,使网络维护优化工作能及时适应由于新技术引入所带来的变革,确保世博会期间的重点区域网络能安全、优质和平稳的运行。本项目立足于2008年试商用测试和世博msc pool工程,对将来msc pool组网技术大规模引入后在msc中重要参数设置等方面产生的变化进行更深入的研究和探讨,并对比其和传统网络的不同之处,为以后msc pool组网大规模展开提出相关参数设置的原则和方案。同时,我们对前期msc pool测试和组网过程中出现的问题进行了深入的分析,对今后msc pool组网的大规模推开具有较强的借鉴意义。此外,我们将探讨基于msc pool网络的msc 重大故障统一处理流程和用户迁移流程,并将其引入到世博保障工作中以及后续的日常维护工作中,提高维护工作的质量和效率。关键字:msc pool(交换机池)、设备维护、软交换、信令、爱立信第1章 引言1.1 概述2008年底,针对特大城市复杂网络环境中msc pool引入的策略问题,公司计划发展部研发中心曾经完成了科研项目,重点就msc pool网络优势、规划设计、工程实施等进行了深入而细致的分析论证,为公司msc pool的引入和建设做好了准备,解决了前期工作中可能出现的许多潜在风险和问题。如今,随着该新型组网结构在上海移动的正式商用,以及作为世博场馆的覆盖和服务网络,msc pool在上海核心网中正担负着越来越重要的作用。此时,如何做好msc pool商用之后的维护管理和质量优化工作,如何根据实际情况处理解决组网缺陷、完善网络结构,不仅对于确保公司网络安全稳定、完成世博重点通信保障有着重要的意义,更是保证全网向msc pool顺利演进的关键。基于这样的想法,运维中心在和公司兄弟部门前期科研成果的基础上,立足网络维护管理规范,通过深入研究msc pool实现原理和设备关键参数,结合现网应用实践,开展了此次“基于世博应用的msc pool设备维护方式的研究”,希望能够规范维护方式、提高维护效率,对今年世博msc pool乃至于未来全网msc pool的维护优化工作有所帮助。1.2 msc pool技术原理简介 msc pool组网理念msc pool组网结构是在3gpp ts23.236中进行规定的,规范定义了核心网控制节点mss以池组方式工作的机制,打破了以往bsc/rnc与mss之间一对一的控制关系。在3gpp前期定义的组网中,核心网延续了传统的树形网络结构,一个bsc/rnc只能被一个核心网节点控制,如果该核心网节点发生故障,其所管理的bsc/rnc就无法正常工作。而随着msc pool技术引入了“池区”(pool area)概念后,多个核心网节点就可以组成一个区域池。与以往一对一的控制关系不同,在msc pool内,每个bsc/rnc可以受控于池内所有的mss节点,故bsc/rnc下的终端用户可以注册到池内任意一个mss节点,换句话说,每个mss节点都同等地为池区内所有bsc/rnc覆盖的区域提供服务。通过引入msc pool技术,提供了一种避免点到多点的连接限制,从而达到网络资源共享的手段,如图1。图表 1 msc pool组网结构msc pool技术定义的初衷是为了引入虚拟运营商而制定的,msc pool技术既适用于分层的软交换网络结构(控制与承载分离),也适用于不分层的传统交换网络结构。msc pool技术在优化网络资源、合理分配话务、提高网络性能、保证网络安全、提高投资利用率等方面的许多优势使得这种组网方式成为未来电信网络发展的重要趋势之一。 msc pool实现机制msc pool的实现主要是基于bsc/rnc来完成的。池组内每个bsc/rnc中定义并保存了所有msc server的能力参数表,一般而言,这个参数由各个msc server的相对处理能力来确定,并可以由维护人员修改。能力参数表如表1所示,说明msc-s1/msc-s2/msc-s3的处理能力是msc-s4的2倍。表格 1 bsc/rnc定义能力参数表当新用户进入msc pool覆盖区域时,bsc/rnc根据定义的能力参数表、按照负载均衡的原则将用户的位置更新请求随机地分配给池组中的某一个msc server,保持池中每个msc server的负荷大致相当。在完成用户位置更新请求后,msc server给用户分配tmsi,这个tmsi里面携带了“网络资源标志(nri)”字段,标识了为用户服务的msc server节点编号,表明用户已经注册到池中特定的msc-server上。之后,无论用户在msc pool服务区域内如何移动,都将登记在该msc-server之下不会变动,而如果用户发起业务请求,bsc/rnc会根据请求消息中tmsi字段内的nri信息,将请求分配到对应的msc server进行处理,直到用户离开msc pool的服务区域。如图2。图表 2 bsc/rnc选择原理在msc pool组网模式下,一个池组区域中多个msc server节点可以整体看作是一个大容量的msc server,它所提供的覆盖与服务范围是所有单个节点覆盖服务范围的总和,因此可以有效减少msc间的位置更新、切换和重定位操作,减少与归属位置寄存器(hlr)之间的信令流量。 msc pool应用优势l 提供了网络级实时容灾备份机制采用msc pool组网时,在一个“池区”中所有的msc server之间都是互为备份的。当其中任何一个发生故障退出服务时,登记在故障msc下的用户只要发起业务请求,就会自动重新登记到pool内其它正常的msc上,实现了真正意义上的自动、实时容灾备份机制。l 避免网络资源的不均衡利用,提高投资利用率鉴于不同覆盖区域以及用户行为模式的巨大差别,网络各设备的话务高峰通常都出现在不同的时间,在一些设备经历话务高峰并因为负荷过高产生限呼的同时,可能另一些设备的负荷却很低,比如“潮汐效应”。msc pool的引入,可以有效均衡不同时段、不同区域话务高峰,克服话务分布不均对网络造成的冲击。只要合理配置msc pool的总容量,单个msc server就不会有拥塞的危险。对于突发的话务高峰、节假日和大型活动等也可从容应对,增强了网络的抗冲击能力。l 减少核心网信令开销,提高网络容量对于像上海这样拥有密集人口的发达城市,在传统组网方式下,每个msc的覆盖范围可能很小,msc间的位置更新和切换会非常频繁。msc pool的引入,扩大了msc的服务区域,使得原来msc间的位置更新和切换转化为msc内部、bsc/rnc间的位置更新和切换操作,因而可以大量减少msc和hlr间信令的开销,进一步提升msc/hlr的处理能力,提高网络实际容量。l 核心网与无线网的规划设计相对独立以往在进行核心网网络设计时,首先要划分msc各自的服务区,针对覆盖区域不同的用户话务模型进行单独设计,并且全部按照峰值话务来配置msc节点的容量。而采用msc pool组网后,网络规划将得到有效简化,只需要根据总的用户话务需求来设计池的总容量,用户会自动、均匀地分配到池内每个msc节点。核心网络的设计和容量需求不再受制于无线覆盖区域的具体情况,无线网和核心网扩容相对独立,可以实现最优化的无线网络单独规划、分布扩容,无需考虑某个特定msc的容量配置和端口限制。l 有助于集中化管理,降低运维成本核心网元的集中化配置和管理是降低运营成本的一条有效途径。msc pool中所有节点具有完全一致软件结构、参数设置和话务信令数据,在设备维护管理方面具有集中化、统一性的独特优势,能够有效提高运营效率,降低运维成本。第2章 msc pool设备重要参数的设置及相关问题的研究2.1 msc pool重要参数及功能研究:2.1.1 msc pool关键参数2.1.1.1 capcapcapacity values,容量因子。在nssf节点中进行定义的,爱立信bsc的cap值最大可以取到255,即cap的比值可以精细到255:254,现网取值为70:70。华为rnc仅支持cap的比值为1:1,故调整粒度的精细程度远不如爱立信bsc,建议华为对此问题进行改进。该参数主要用来表征msc pool中每一个msc的相对容量大小,从而决定了该msc在整个pool中分担用户的比例。在msc pool进行用户迁移时,cap可以指定所要进行用户迁移的比例,即msc迁移量。如下图所示:msci的用户数=capi/capcap的比值应等于msc用户数容量的比值,例如msc1和msc2的用户容量分别为50万和60万,则cap的比值应设定为5:6。2.1.1.2 tmsi和nri1、 tmsitmsi是一个由4个字节(octets)组成的临时标识,用来在一个msc覆盖区内唯一的标识一个用户。tmsi的基本概念在msc pool中没有大的变化,但其结构的变化和“nri”的引入带来了更多的信息。因此,pool中的msc必须打开tmsi分配功能。2、 nrinrinetwork resource identification,网络资源标识。用于在msc pool范围内标识msc。一个msc却可以分配一个到多个nri值,以起到负载灵活控制的目的。当nri长度为0时,即表示该msc不开启msc pool功能;而当nri长度为最大值10时,即表示一个msc pool中最多能包含1024个msc。nri使用tmsi中的23到14这十个比特位。集团公司其设置有以下统一要求: nri长度统一为7位,如图3,每个nri值的具体规划如下: 23bit:预留,缺省值为“0”。为今后省际间相邻pool的nri分配冲突或扩容预留; 21-22bit位:省内自行按四色原理规划,保证pool间nri不重复; 17-20bit位:pool内区分每个msc-s的标识。图表 3 nri设计 四色原理分组: 000xxxx :包含14个nri,取值为215;(0和1建议不用,防止池组外手机携带该相同nri接入池组,导致负荷分配不均); 001xxxx :包含16个nri,取值为1631; 010xxxx :包含16个nri,取值为3247; 011xxxx :包含16个nri,取值为4863 。那么,一个msc应设置几个nri才比较合理呢?由上图可知tmsi字段中可用于用户分配的部分一共19位,即一个nri可分配的用户数为219=524288。现网msc的vlr容量为60万,若pool中有3个msc,考虑到冗余倒换时增加的用户,即vlr容量达到90万,此时需设置2个nri才就能使tmsi容量大于vlr容量。2.1.1.3 paging参数paging的方式没有改变,仍分为两种:lac paging和global paging。启用msc pool组网后,考虑单个msc控制的所带bsc非常多,覆盖范围较大。为减少msc负荷,建议在msc pool内启用lac paging的方式。 2.1.1.4 msc状态标识(mode参数)池组中msc的状态是由nssf节点中的参数mode来标识的,决定了msc在msc pool中的可用性。不同机型的mode参数不同。在爱立信nssf节点(bsc)中mode参数可以有:active、inactive、reselect、barred。分别体现了nssf节点对msc-s的各种不同的控制模式。2.1.1.5 proxy mscproxy msc负责转发pool外msc发来的lu消息,设置错误将导致hlr负荷升高。设置原则为pool内每个msc均设置为proxy,保存pool内其他msc的nri信息。mscvlraddrproxy mscg784-86134414883233464-8613441490343547g874-86134414903435474-8613440490383945g884-86134414883233464-86134404903839452.1.2 msc pool新增功能介绍2.1.2.1 proxy mscproxy msc(代理msc)即在3gpp协议规范中的default msc(默认msc)。proxy msc可通过爱立信指令人工定义,代理pool内部msc和pool外不支持“增强型协作vlr”的msc进行消息转发和通信。proxy msc通过nri识别pool内部各个msc,从而转发消息。2.1.2.2 neighboring msc groupsneighboring msc groups爱立信特有软件功能,即相邻切换组。在与msc pool有相邻关系的msc上定义。简化相邻的msc和pool内msc的切换流程。2.1.2.3 msc selection假设用户从原先登记的池外非msc pool组网的区域,漫游到msc pool覆盖区域内,那么msc selection功能就会启用。msc selection在3gpp协议中被称为nnsf,即非接入层节点选择功能。概括的说,它是一种为用户选择msc为其服务的功能。当ms进入msc pool服务区后,ms像pool中的bsc发出位置更新请求消息,其中带有用户原来的tmsi和lai。bsc从tmsi中解析出nri,将nri和存储在bsc中的nri与msc的对应关系表进行对比,发现这个nri不属于自己pool中的任何一个msc。这是bsc会启用nnsf功能,将这条位置更新请求消息按照cap参数所设定的比例关系和round robin算法,发送到pool中的某个msc,由该msc接受位置更新请求。此后,该ms将会一直登记在此msc中,直到它下一次漫游出pool前。由此可见,用户从pool外位置更新到pool内,最关键的一个环节是由bsc启用nnsf功能进行核心网节点选择。其他流程和非pool组网下的跨msc位置更新流程基本一致。2.1.2.4 msc re-selectionmsc re-selection是一种为用户重新选择msc为其服务的功能。在网络侧强制已完成msc selection的用户改变所登记的msc。2.2 世博msc pool参数设置及功能开启情况2.2.1 msc pool关键参数设置:2.2.1.1 cap值设置现网世博msc pool端局中,nssf节点为bsc/rnc。上面设置的cap值为三个msc-s(g78/g87/g88)均分。nssf节点cap值各交换机比例g78g87g88bsc870070111bsc870170111bsc880070111bsc880170111bsc880270111bsc781470111bsc781570111rnc1b71111rnc1b91111rnc1b011112.2.1.2 tmsi & nri现网世博msc pool端局中,为防止tmsi不够分配,因此每个msc-s上都设置3个nri,长度均为7位。具体设置见下表: 网元nri长度对应的nri值g787383945g877323346g8873435472.2.2 msc pool新增功能开启情况:2.2.2.1 proxy msc目前世博msc pool中3个msc-s都设置成为该msc pool中的proxy msc,并在proxy table中加入pool内其他两个端局vlr地址及其nri值。具体设置为:网元vlraddr对应的nriv值g784-86134414883233464-8613441490343547g874-86134414903435474-8613440490383945g884-86134414883233464-86134404903839452.2.2.2 neighboring msc groups 该功能仅针对爱立信软交换而言,其他交换机不具备该功能。上海世博msc pool外相邻爱立信端局上开启该功能。2.2.2.3 msc selection & msc re-selection 该功能在上海世博msc pool的nssf节点上均已开启。2.3 关于msc pool覆盖范围的研究2.3.1 问题研究主体:主要研究msc pool覆盖区域对关键指标的影响。研究对象:2008年12月割接调试的msc pool g73-g75。区域规模:原g58下9个基站。试点区域为浦东外高桥港区,同时该区域下用户具有密度低、移动少的特性。2.3.2 研究结果分析:通过实验网3天的运行,发现由于此次msc pool外区域都由不支持nssf功能的g1800 bsc覆盖,引起了用户在双频之间频繁的位置更新和切换。另一方面,msc pool优势的体现依赖于pool内大量用户反复移动的网络模型,如同时覆盖工作区域和住宅区域的情况。而此次选取的,区域小、与其他lac边界多,导致区域内位置更新数量、切换数量、小区sdcch信道试呼次数及话务量,并没有如预期那样减小,反而出现了大幅增长的情况。并未体现msc pool在用户移动时降低网络负荷与开销的优势。通过以上分析可以看出,虽然原理上msc pool的组成有利于位置更新、切换和小区sdcch信道试呼等一系列移动性指标的下降。但由于实验局所选区域的错误,反而导致了这些指标的上升。由此可见,msc pool外围机型的匹配以及覆盖区域的选择,对发挥msc pool的优势具有决定性作用。2.4 手机终端与nssf节点间适配问题的分析和解决2.4.1 问题的研究主体手机终端与个别nssf节点间的配合问题研究。研究对象:手机终端(展讯芯片)和nnsf节点(华为rnc)。具体问题:在进行2/3g融合msc pool组网测试中,根据集团公司在中国移动2、3g融合msc pool试点测试规范-v1.1.0(以下简称“测试规范”)中提到的展讯芯片手机无法使用部分msc pool功能,对展讯芯片手机进行了专门的测试和分析。2.4.2 研究过程:规范要求msc pool中的nnsf网元(rnc)必须具有从终端上报的idnns字段中解析出相应nri值的功能。但中国移动2、3g融合msc pool试点测试规范-v1.1.0中,第9页的“测试要求”描述道:由于“目前部分3g终端idnns中相应的字段始终为0”,“因此,现网rnc上进行特殊配置,使此类3g终端在pool内时始终注册在特定的msc server上”。(如下截图)至此,我们总结归纳集团公司对展讯芯片问题终端的理解:它认为“部分终端(展讯芯片)上报idnns相应的routing parameter字段始终为0”,并提出“rnc对该类终端,预先设置pool内某个msc server与routing parameter0相对应”的要求。然而,展讯芯片问题终端表现的实际情况与中国移动msc pool试点建设方案的描述有所不同,因为展讯芯片问题终端上报idnns相应的routing parameter并不是等于0。实际上,联想终端td800(td.base_dm_tdr1.2.0001,展讯芯片)的问题本质是: “其rrc initial direct transfer消息结构中,future coding值等于0(如下图)”,该消息的intradomainnasnodeselector ie下的later字段更多时候填写future coding0x0000。2.4.3 研究结果分析:由于展讯芯片测试终端并不是按测试规范所描述的“部分终端(展讯芯片)上报idnns相应的routing parameter字段始终为0”;因此,测试规范中提出的“rnc对该类终端,预先设置pool内某个msc server与routing parameter0相对应”的要求,也就无法对展讯芯片问题终端进行相应的支持和验证。可见,在msc pool网络中,终端是否能够登记到msc pool上,取决于手机终端上发消息的标准化,还取决于nssf功能节点针对非标准化终端的普遍适用性。nssf节点必须保证在无法识别nri参数的情况下,触发手机进行pool内位置登记。这就需要维护人员通过日常用户报障,及时发现此类终端,对nnsf节点做相应的改造。2.5 关于bsc/rnc不支持msc pool组网问题的解决建议2.5.1 问题的研究主体研究对象:上海现网大量存在的、不支持msc pool功能的bsc在msc pool的兼容性。 西门子bsc和世博msc pool的兼容性研究具体问题:上海现在大量存在不支持msc pool功能的bsc,例如西门子bsc。当这些bsc下挂在某一个msc pool内的msc-s上,是否能完全与msc pool相融合。2.5.2 研究过程:在msc pool1-1的试运行过程中,原本有g77、g78、g87、g88共4个爱立信msc,pool中的bsc除了爱立信bsc外,还有两个暂时不支持msc pool功能的西门子ebsc,也挂在了g77下。这样,g77就同时带有支持msc pool功能的爱立信bsc和不支持msc pool功能的西门子ebsc。经过一段时间运行,发现g77下产生“吸尘效应”,即带有ebsc的g77的用户数不断增长,并且和其他3个msc的差值有不断扩大的趋势。经过分析,发现这主要是由于g77下没有nssf功能的ebsc导致的。登记在ebsc(不支持pool功能)的无线覆盖范围用户,漫游到支持nssf功能的bsc下,nssf会根据其该它tmsi中携带的nri进行msc-s的指派。但由于该用户原本登记在g77下,因此其nri将始终指向msc77。也就是说只有是曾经登记在g77上ebsc的用户,一旦漫游到msc pool内区域,都将被指派到g77上登记。2.5.3 研究结果分析:msc pool下bsc对应的lac需要设置具体属性来区分bsc是否为nssf节点。那些不支持pool功能的bsc对应的lac属性应定义成“non-pool aware”的,而支持pool功能的bsc对应的lac属性定义成“pool aware”的。由此,当msc-s接收到位置更新请求时,首先检查tmsi中包含的nri是否与本msc中定义的nri一致。然后检查位置更新请求中,前一个位置的lac属性,和目标位置的lac属性。如果是从“non-pool aware”或“unknown”更新到“pool aware”时,msc就下发“null-nri + nb-lai”,触发手机再产生一次位置更新请求。由于此时tmsi中包含的是null-nri,从而支持pool功能的bsc将按容量因子选择pool内一个msc,这样就避免了固定地将位置更新请求发往msc77而产生的用户数不均衡。2.6 msc pool中某msc-s退服后对被叫业务的影响和解决建议2.6.1 问题的研究主体实验对象:msc pool中某msc-s退服对用户业务的影响具体问题:在msc-s不同退服场景下,用户被叫的影响。用户是否会在1个周期性位置更新后所有用户将完成重分配并可以接收所有的话务、服务。2.6.2 研究过程:在周期性位置更新之前(periodic lu period)或任意相关的mo transaction之前手机用户做被叫: 如果故障msc成员又重新恢复投入正常工作 (例如,系统启动),而且相关的vlr数据库没有被清空,则用户被叫不受影响。 如果故障msc成员又重新恢复投入正常工作 (例如,系统启动),但是相关的vlr数据库被清空,则用户在vlr的数据可以通过map_restore_data来从hlr恢复,并可以通过触发global paging使得手机正常接收被叫。如下图所示: 如果故障msc成员仍未能恢复正常,则被叫将失败。如下图所示:2.6.3 研究结果分析: 基本概念: 主用msc (primary msc)primary msc是用户通过正常位置更新所登记的池组内msc成员。它与buddy msc一同配合工作,用于需要时将用户登记到shadow vlr中并复制用户所在的lai信息并在必要时从shadow vlr或许相关lai信息。 合作msc (buddy msc)针对每个池组内的用户,buddy msc是另一个池组内保存有其lai信息的关联msc。并且,当其主用msc故障期间用户做被叫时将用户重分配到buddy msc。同样,它也与primary msc协同工作,用于为特定用户提供lai信息。 shadow vlrbuddy msc包含了一个额外的vlr数据库。这个额外的vlr 数据库用于从主用primary msc中复制其vlr数据 (imsi,lai等),这个vlr数据库叫做shadow vlr。 解决思路: hlr和msc池组成员之间建立物理冗余路由,即以buddy msc作为原msc的备用路由。在stp信令转接点应该定义二选路由,以使terminating transaction可以在primary msc故障退服时自动路由到buddy msc (使用新的ssn=129)。msc_amsc_bshadow vlr msc_a msc_cshadow vlr msc_b buddy for msc_abuddy for msc_b 使用专门设计来解决被叫恢复问题的利与弊分析对于常规软交换组成的msc池组网络,以上的msc池组成员故障时对手机被叫的操作完全遵循3gpp规范,并在3gpp会议上得到全世界绝大多数运营商和设备供应商的认可。但是,msc pool成员故障时可能无法做被叫确实不容回避的事实,故使用专门的设计来解决这一问题也是有理可循的。然而,使用这一设计所付出的代价也是不能忽视的。 利(a) 使得msc池组成员故障时手机被叫“不受影响”。 弊(a) 大大增加信令交互量,并使得网络信令非常复杂(例如:备份vlr数据的信令、冗灾时额外的寻呼、鉴权等相关信令等)。违背了msc池组设计用于减少信令量的初衷。(b) 池组内部网络结构复杂(vlr相关数据两两互为备份)。(c) 增加池组内部成员中的负荷量和资源使用量。可能因负荷过高引起设备雪崩效应而大量宕机(增加资源负荷处理额外信令,以及vlr既要存储作为主用msc的用户数据又要存储作为备用msc用户数据)。(d) 相比实际作用(仅保障一小部分被叫),实现复杂开发成本高。(e) 由于实现复杂,增加了现网出现新的后续关联问题的风险。鉴于被叫恢复功能存在许多弊端无法避免,因此,我们建议暂时不要加载被叫恢复功能补丁,确保交换机稳定运行。2.7 关于爱立信msc pool交换机模块反复重启问题的分析2.7.1 问题的研究主体研究对象:上海msc pool内msc78局具体问题:2010年1月29日,上海msc pool内msc78局,分别在5点27分、9点36分、11点04分和19点02分发生四次系统自动大启动,并且在之前各有两个系统小启动。事件代码都为“h0008 h03a5 h265b h0000 h0000”,表明在mtmsian软件功能块中发生了“pointer too large” 的软件错误。在系统自动小启动不能清除此类软件错误时,系统采用自动大启动进行恢复。 2.7.2 研究过程:根据我们的调查分析,认为此次软件故障的原因是:当一个原注册在msc78的手机漫游出pool,hlr向msc78发送“cancel location”消息。msc78收到消息后,要释放这个手机的vlr资源。当在将这个手机对应的tmsi从工作列表链出时,出现错误,原因为指针过大,从而引起启动。当使用命令mgnde删除nriv127的时候,在regulatec和regulatecr软件信号间接受到了新的tmsi分配请求。虽然127这个nri已经被标记为“deleted”,但由于软件错误新的mtmsian软件单元还是被分配给了这个nri。这些软件单元进入了工作列表,并导致工作列表错误。从而可能会导致启动。命令regulatec用于执行命令的软件模块向cp申请用于命令处理的负荷,在目前低负荷的情况下会立即得到批准,批准的命令就是regulatecr。当第一次启动发生后,由于有关工作列表的某些变量和软件记录未能被启动清除。当用户数增长到一定数量,并且使用到工作列表中被破坏的软件记录时,导致启动反复发生。 问题处理过程如下:1. 从bsc侧将原注册在msc78中的用户,迁移到pool内其它msc中;2. 采用initial loading的方法,在msc78中将被破坏的软件变量和软件记录进行清理;3. 当vlr中用户注册数开始增长后,观察系统用户数的变化情况,观察系统运行状况,确认系统工作正常;4. 在bsc侧从pool内其它msc中,迁移部分用户进入msc78,同时持续观察这用户数的变化情况,观察系统运行状况,确认系统工作正常;5. 当msc78中vlr中用户注册数增长到约11万后,超过之前启动发生后msc78的用户数,停止用户迁移过程,观察用户数的变化情况,观察系统运行状况,确认系统工作正常;6. 进行后续清理工作,包括告警处理,恢复数据,系统备份等;2.7.3 研究结果分析:msc pool内的数据库环环相扣,当出现数据库紊乱时极有可能对整个交换机系统带来严重后果。往往需要使用initial loading等初始性操作进行故障恢复。第3章 msc pool工程相关注意点3.1 总体建设原则:3.1.1 msc pool建设原则1. 各公司按照“统一规划,分步实施”的原则,统一规划msc pool部署方案,综合考虑实施效果、建设成本等因素分阶段逐步实施。2. 现阶段在同厂家核心网设备(msc server、mgw)间部署msc pool,组成msc pool的msc server节点数量原则上应不小于3台。3.1.2 msc pool适用场景1. 潮汐效应明显,网络忙时话务分布不均衡的地区以及节假日和平日话务容量差异较大的区域,通过部署msc pool降低设备峰值负荷、提高设备利用率。2. 局间切换多,信令负荷高的区域,td无线覆盖不连续并且2g、td互操作频繁的区域,通过部署msc pool提升系统整体性能、缩短位置更新时延以及提高切换成功率。3. 在大型集会等网络实时容灾要求高的区域,以及单局点容量较大的地区,通过部署msc pool实现msc实时容灾备份,提高网络可靠性。3.1.3 msc pool建设方案1. 进行msc pool的规划时,应按照2g、td融合的msc pool考虑,接入msc pool的无线覆盖区域应尽量连续。2. 实际部署时应根据设备支持情况选择nnsf(非接入层节点选择功能)节点方案,优选bsc/rnc代理nnsf,同一个msc pool内原则上不得同时使用bsc/rnc代理nnsf和mgw代理nnsf两种方式。3. nri(网络资源标识)长度统一设置为7位,pool内不同msc server的nri值及相邻的不同msc pool之间nri值不能重复;省际边缘的msc pool nri的前两位由总部统一分配。4. msc pool内各节点应采用ip承载,并遵循中国移动现有话路网及信令网网络组织原则。5. 各公司应利用msc pool本身的特点,通过合理规划实现msc实时容灾备份功能,原则上不得另外配置冗余备份容量。6. 对同一交换机上不同计费区的计费采用虚拟msc id实现。实施msc pool后的网管改造要求另行印发。3.1.4 项目管理要求1. msc pool建设按照省管项目管理,涉及msc pool网络建设的相关设备统一纳入集中采购范畴采购。2. 各公司应按照本指导意见要求,抓紧安排落实相关工作,尽快制定本公司的msc pool建设方案,并报总部计划部备案。3.2 新建msc pool:3.2.1 机型确定: 在机型确定上,必须选择支持msc pool功能的核心网和无线设备。且必须按照集团公司要求,通过请根据金桥现场爱立信软交换工程实际进度对如下几个节点进行重点把控(包括今后其他工程):1、时间:确定设备安装地点,但货未到之前。 要求:向业务领导局或厂商收集该设备的相关资料,对设备系统结构进行通读,完成维护作业计划制定。 目标:工程期间必须3人以上熟悉系统结构和维护作业计划,割接前所有今后可能参与维护设备的人员都必须了解系统结构并能独立完成维护作业计划。2、时间:系统上电后初次启机 要求:现场至少安排1名人员参与系统上电后初次启机,在厂商指导下完成系统重启流程编写,组织相关维护人员根据流程独立进行启机操作。后期在割接入网前组织相关维护部结合重要参数配置和检查再进行一次演练。 目标: 割接前至少有3人以上具备在应急抢修过程中进行独立启机的能力。3、时间:系统重要参数配置 要求:现场至少安排1名人员专门跟随厂商进行重要参数设置,要求我方维护人员尽可能在厂商工程师的指导下自行进行基本参数配置,期间完成对系统的重要参数整理工作并由业务领导局进行确认,整理后的资料能对系统的参数的功能,配置方法,初始默认值,建议值进行详细说明。 目标:至少有2名维护人员能熟悉掌握所有重要参数的作用和配置。4、时间:局数据制作 要求:现场至少有1名固定人员全程参与局数据配置,并在厂商的指导下掌握各部分局数据的配置和修改,同时协同业务领导局根据该网元的局数据设置原则,对所有的路由和局数据进行全面核查。核查完后完成该设备的局数据制作操作手册编写,根据手册组织相关维护人员在割接前进行局数据操作演练。 目标:所有日班以上人员必须能够熟练进行局数据操作。3.3 端局改造入msc pool 根据集团公司和上海公司计划发展部的规划,在上海世博会闭幕后,上海大规模的现网msc pool改造工作即将展开。为了更好地把控改造流程,避免各种由改造引发的网络安全隐患,本部分内容将以前期的msc pool试验网改造测试为基础,对涉及现网msc pool改造的一些关键流程进行全面的梳理和总结,为后期的改造工作铺好路,确保msc pool改造万无一失。3.3.1 改造基本流程1. 准备工作(1) 目前,现网非msc pool端局的和它的相邻端局之间的话务依然由tdma承载,按照msc pool实施要求,此部分是要在改造之前完成到端局话务的voip改造。 (2) 改造端局需提前加载msc-s pool的补丁包。约需要一天晚上完成补丁包加载,完成补丁的加载,需要进行话务拨打测试。(3) 需提前对改造端局下的bsc/rnc对msc pool的支持情况进行梳理。不支持msc pool功能的bsc/rnc不能割入pool。2. server入pool(1) 测试前,核心网设备、bsc、rnc都已升级至msc pool所需版本。 msc = r12.1 mgw =r4 bsc =r12 oss = r4 msc server 完成voip的改造 msc server已完成td common core补丁包的装载(2) 测试主要步骤:序号实施步骤具体实施记录1厂商、网管准备改造dt2msc单节点改造入msc pool1、 所有设备健康检查、数据备份;2、mss上msc pool功能开关打开,创建pool特有数据;3、修改mgw上相关数据,如vmgw等4、mss和mgw之间创建sigtran、m3ua等连接并激活;5、修改mss上相关局数据,如到b局路由数据等6、检查设备状态,确认正常7、各个网元数据备份 (3) 测试后组网情况 该步骤结束后,新入pool的msc为msc pool中的两个端局,及核心网已经完成组pool动作。此时,新入pool端局下的bsc/rnc上未开启任何pool的功能。由于上海采用的是bsc/rnc支持nnsf功能,因此对于无线网来说仍只归属于单一端局,不受其他端局控制。 (4) 测试项具体验证结果a. b1/b2局入pool完成;b. pool中各msc与各mgw间的m3ua信令可达;c. pool中各msc中新定义的mgw状态为 “available”;d. pool中各mgw中新定义的vmgw的状态为 “enabled”;e. 新入pool的msc server的pool相关功能已打开;f. 该阶段实施步骤中dt及log,以及各步所需时间已记录;g. 拔打测试验证话务建立正常,未受核心网网络变动影响。3. bsc/rnc入pool(1) 测试主要步骤序号实施步骤具体实施记录1厂商、网管准备改造dt2msc单节点改造入msc pool1、所有设备健康检查、数据备份;2、改造msc中的有关msc pool功能的参数以及nri值的复查,确保各功能参数设置正确;3、bsc和rnc中定义到非归属端局的信令路由;4、针对第3步,改造mss上增加相关数据(信令路由、切换小区等局数据),并确认激活,状态正常;5、msc、bsc、rnc相应调整,使用户迁移达到均衡。5、bsc/rnc调整原归属端局的a口/iu-cs电路,重分配到两个归属msc上,mgw同时做相应修改;6、a口/iu口占用检查,拨打测试,统计查看,确认各设备运作正常,业务正常,msc pool功能正常。7、清除垃圾数据,各个网元数据备份8、检查各网元状态,业务状态,用户均衡性等检查9、清除垃圾数据,各个网元数据备份3.3.2 前期测试过程中发现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论