TBF掉线率提升优化分析思路(华为)
1 概述
GSM数据业务掉话性能(保持性)KPI分析主要是分析网络掉话率。由于目前GPRS网络没有实现小区切换,完全是手机自主重选小区,若在数据传输中进行小区重选必然造成掉话,只是由于TBF传输时间原本较短(平均2~3秒),因此掉话率虽比语音系统相对要高一些,但对业务的影响较小,客户的感知也不明显。分组掉话率与小区的无线质量、话务量、手机的行为都有密切的相关,需要结合各种可能的因素进行具体分析。
本文以XX市BSC203为例,通过对该BSC内TBF掉话率高的小区进行分析,以解决下行TBF掉线率为主,引入TBF掉话率的解决思路。希望能对各位能够有一定的启发作用。
2TBF掉线率公式的含义
2.1 下行TBF掉线率公式
下行TBF掉线率公式
([A9306:N3105溢出导致下行EGPRS TBF异常释放次数]+[A9106:N3105溢出导致下行GPRS TBF异常释放次数])/([A9302:下行EGPRS TBF建立成功次数]+[A9102:下行GPRS TBF建立成功次数])*{100}
含义:由公式可得下行TBF掉线率的分子为N3105溢出导致释放的次数,N3105测量指标统计的是一个测量周期内,小区因N3105溢出导致下行异常EGPRS/GPRS TBF释放次数。如果该值较高,可能是因为小区的无线质量不好。
N3105测量点
在下行EGPRS/GPRS TBF传输过程中,BSC会周期性地附带RRBP标志的数据块,用以预留块资源让MS回应PACKET DOWNLINK ACK/NACK消息,确认下行数据的接收情况。 在一定时间内(BSC内定时器),如果BSC在指定的预留块上收到了该MS响应的PACKET DOWNLINK ACK/NACK消息时,计数器N3105会复位;否则,计数器N3105就会加一,并且BSC会重发附带RRBP标志的数据块。如果计数器N3105溢出,BSC发起下行EGPRS/GPRS TBF释放流程。 由于MS无响应导致下行EGPRS/GPRS TBF异常释放的过程如图1所示。每当N3105溢出时,如测量点A,统计值“N3105溢出导致下行异常EGPRS/GPRS TBF释放次数”加一。
[attach]190843[/attach]
图表 1 N3105溢出导致下行EGPRS/GPRS TBF正异常释放
影响:TBF异常释放的原因有多个方面,如动态PDCH信道被CS业务抢占,MS发起小区更新等原因,但此N3105溢出导致的下行TBF释放次数关注的是无线质量导致的TBF掉话,如果该值较高,可能是因为小区的无线质量不好。
2.2上行TBF掉线率公式
上行TBF掉线率公式
([A9206:N3101溢出导致上行EGPRS TBF异常释放次数]+[A9006:N3101溢出导致上行GPRS TBF异常释放次数]+[A9007:N3103溢出导致上行GPRS TBF异常释放次数]+[A9207:N3103溢出导致上行EGPRS TBF异常释放次数])/([A9202:上行EGPRS TBF建立成功次数]+[A9002:上行GPRS TBF建立成功次数])*{100}
含义:由公式可得下行TBF掉线率的分子为N3101和N3103溢出导致释放的次数之和,N3101和N3103指标统计的是一个测量周期内小区因N3101和N3103溢出导致上行异常EGPRS/GPRS TBF释放的次数。如果该值较高,可能是因为小区的无线质量不好。
N3101测量点
在上行传输过程中,BSC会为每一个接入的MS预留上行块资源,并指配合法的USF来调度这些上行块资源,并在该MS帧听的下行数据块中附带该USF消息,用以指示MS在相应的上行数据块上传数据。在一定时间内(BSC侧起定时器),如果BSC发现在为该MS预留的块资源上收到了有效的上行数据块,则计数器N3101复位;否则N3101加一,并且BSC会通过POLLING REQUEST消息重新为该MS调度上行块资源。如果计数器N3101溢出,该上行EGPRS TBF会被BSC释放。
由于MS无响应导致TBF异常释放的过程如图2所示。每当N3101溢出的时候,如测量点A,统计值“N3101溢出导致上行EGPRS TBF异常释放次数”加一。
[attach]190844[/attach]
图表 2 N3101溢出导致上行EGPRS TBF异常释放
N3103测量点
在上行EGPRS TBF的倒计数过程中,BSC接收到上行RLC数据块(CV = 0)时,它会发送PACKET UPLINK ACK/NACK (FAI = 1)的消息来发起上行EGPRS TBF的释放流程。在一定时间内(BSC侧起定时器),如果BSC在指定给MS的上行块资源上收到MS发送的PACKET CONTROL ACKOWNLEDGEMENT消息确认该上行EGPRS TBF正常释放,表明该上行EGPRS TBF已经正常释放,并且计数器N3103复位;否则,N3103加一,并且BSC会重发PACKET UPLINK ACK/NACK(FAI = 1)消息再一次发起上行EGPRS TBF的释放流程。如果计数器N3103溢出,该上行EGPRS TBF会被BSC释放。
在上行释放过程中由于MS无响应导致TBF异常释放的过程如图3所示。每当N3103溢出的时候,如测量点A,统计值“N3103溢出导致上行EGPRS TBF异常释放次数”加一。
[attach]190846[/attach]
图表 3 N3103溢出导致上行EGPRS TBF异常释放
从N3101和N3103的测量点分析来看,N3101和N3103的溢出导致上行TBF异常释放,主要都是从检查TBF链路的质量入手来分析,这与下行TBF掉线率的优化方法相同,下文将主要从下行TBF掉线率优化方法入手,介绍一般下行TBF掉线率的优化手段。
3分析和优化方法
3.1下行TBF掉线率
由下行TBF掉线率公式可得,其分子为N3105溢出导致下行EGPRS TBF异常释放次数,所以解决TBF掉线率,主要就是减少因N3105溢出导致下行EGPRS TBF异常释放的次数。所谓的N3105就是监听下行TBF链路质量一个计数器,如果下行TBF由于计数器溢出而导致异常释放,那就意味着链路是异常的,如果N3105的溢出率很高,那意味着传输链路的质量可能不好,这样就需要检查TBF链路的质量,包括G-Abis链路质量和无线空中接口质量,另外基站硬件和用户手机性能也会对该指标有一定的影响,特别是基站显隐性故障需要特别的关注。
对于N3105如果该参数值设置过小,网络侧对下行链路异常的容忍度过低,将导致TBF被频繁的释放。
如果该参数值设置过大,将导致可能已经出现异常的TBF,(例如MS自身行为导致它已经不能接收网络当前小区的消息,网络侧仍然给该MS分配无线资源。)却迟迟不能被网络侧主动释放,导致系统资源的浪费。
因此需要针对现网实际情况(比如空口质量较差,传输链路质量不稳定,手机自身行为等都会导致N3105溢出),适当调整该参数值,确保下行TBF不会由于N3105的频繁溢出而导致异常释放。目前XX市BSC203该值已设置为最大值(10)
下图为下行TBF掉线率优化思路:
[attach]190849[/attach]
3.2 G-Abis链路是否存在问题
G-Abis口链路是指PCU到BTS之间的传输,G-Abis口链路失步或G-Abis口链路出现闪断等传输问题,都可能会导致下行TBF掉线。
通过计算G-Abis口误帧率来初步判断G-Abis口的传输情况,公式如下:
G-Abis口误帧率=(接收校验错帧的个数+接收失步帧的个数)/(发送有效帧的个数+发送空帧的个数)
1、正常情况下误帧率都小于10e-5,即万分之一,相当于每个信道平均4分钟有一个错帧。此时链路质量较好,手机能稳定进行数据传输。
2、传输链路较差时误帧率大于10e-4(千分之一),链路已相当不稳定,容易出现失步现象,失步帧比率也明显上升,由于传输误帧的突发性,受到影响的手机容易出现速率下降、传输延迟变长甚至出现掉话掉网等现象。
由于实际运营中传输往往是租用线路(例如微波卫星等),不受移动运营商直接控制,因此误帧率在千分之五以下就可以接受了。若发现某小区信道误帧率长期偏高,认定为传输问题,需要检查传输线路改善网络。
相关话统:
KPI指标
| 小区级
|
G-Abis口误码
|
【G-Abis口性能测量】->【BSC分组指配性能测量】->
接收失步帧的个数
接收校验错帧的个数
发送有效帧的个数
发送空帧的个数
|
图表 5 G-Abis口质量相关话统
下表是是对XX市BSC203一周的G-Abis口误码率进行的分析
CELL
| G-Abis误码率
| 最大TBF掉线率
|
LSGSPC_金鼎大酒店(M)0
| 7.14%
| 14.367
|
LSBSPC_木如居委会2
| 1.90%
| 10.993
|
LSGSPC_军区大院2
| 0.65%
| 5.331
|
LSBSPC_雪神宫1
| 0.65%
| 7.75
|
LSBSPC_雪神宫2
| 0.61%
| 2.891
|
图表 6 XX市BSC203一周的G-Abis口误码率
例如:LSGSPC_金鼎大酒店(M)0与LSBSPC_木如居委会2的 G-Abis口误帧率较高,这有可能是导致该站下行TBF掉线率高的原因。
3.3 分析空口是否正常
UM口的问题一般来说有上下行链路平衡问题、干扰问题和过覆盖问题,当然这些都是表象,可由话务统计来体现,具体的原因还需要进行具体的定位。以下是就分析这些指标与TBF掉线率的关系。
3.3.1 上下行不平衡小区载频排查
一个优良的系统应在设计时做好功率预算,使覆盖区内的上行信号与下行信号达到基本平衡。否则,如果上行信号覆盖大于下行信号覆盖,小区边缘下行信号较弱,容易被其它小区的强信号“淹没”,甚至出现弱覆盖现象;如果下行信号覆盖大于上行信号覆盖,MS将被迫守候在该强信号下,但上行信号太弱,话音质量不好,可能会造成手机切换失败,甚至掉话。平衡并不是指绝对的相等,通过Abis接口上的MR,可以判断上下行是否达到平衡。
BSC收到的MR中包含上行接收电平和下行接收电平。用下行接收电平减去上行接收电平,再减去参数“X”,根据结果的dB值划分1~11共11个等级,并统计各个等级内的MR个数。当上下行平衡等级为1或者11的比例超过50%,可认为该载频上下行不平衡。对于该部分小区,建议先检查基站的接收和发射配置是否正确,另外就是上站对硬件进行检查,按经验当上下行平衡1或者11的比例超过80%,硬件故障的几率较大。
相关话统:
原因
| 小区级
| 载频级
|
上下行平衡问题
|
【呼叫相关测量】->【指配测量】->
TCH指配成功率
呼叫建立成功率
【呼叫相关测量】->【立即指配测量】->
立即指配成功率
|
【测量报告相关测量】->
【测量报告上下行平衡测量】
【测量报告相关测量】->
【测量报告全速率信道接收电平测量】
【测量报告相关测量】->
【测量报告半速率信道接收电平测量】
|
图表 7 上下行平衡相关话统
下表以BSC203为例,这些小区下行TBF掉线率较高,原因可能是上下行链路平衡等级为1的的比例较高,这说明这些站上行强于下行,建议进行核查。
CELL
| TBF最大掉线率
| 上下行1的比例
|
LSGSPC_沙龙国际(M)0
| 11.111
| 87.25%
|
LSBSPC_自治区人民医院2
| 12.5
| 68.07%
|
LSGSPC_铁崩岗居委会2
| 10.423
| 64.94%
|
LSBSPC_木如居委会1
| 10.207
| 60.17%
|
LSGSVC_邮运局1
| 14.039
| 56.03%
|
LSGSVC_雄巴拉大酒店1
| 12.464
| 55.47%
|
LSBSPC_藏汉乐超市2
| 11.923
| 52.56%
|
图表 8 BSC203 上下行平衡分析
3.3.2UM口的干扰问题
干扰是影响网络质量的关键因素之一,对CS域和PS域的指标和用户感知均有显著的影响,如何降低或消除干扰是网络规划、优化的重要任务之一。
3.3.2.1GSM系统干扰源分类
1、硬件故障:
TRX故障:如果TRX因生产原因或在使用过程中性能下降,可能会导致TRX放大电路自激,产生干扰。
CDU或分路器故障:CDU中的分路器和分路器模块中使用了有源放大器,发生故障时,也容易导致自激。
杂散和互调:如果基站TRX或功放的带外杂散超标,或者CDU中双工器的收发隔离过小,都会形成对接收通道的干扰。天线、馈线等无源设备也会产生互调干扰。
天馈避雷器干扰:由于天馈避雷器老化或质量问题导致基站出现互调信号,无线信号杂乱,影响正常的频率计划,从而使无线环境恶化。
2、网内干扰:
同邻频干扰
直放站干扰
互调干扰
3、网外干扰(其它大功率通信设备):
雷达站:有些七、八十年代设计的分米波雷达,使用的频率与GSM相同或相近,由于其发射功率非常大,功率一般都在几十到几百千瓦范围内,其带外杂散比较大,也很容易对附近的基站造成干扰。
CDMA基站:由于我国移动通信系统制式较多,各地各种体制之间、各运营商网络之间存在各种干扰问题,尤其当CDMA与TACS、GSM在邻近频段建设,主要是CDMA的发射会干扰GSM900的接收,CDMA带外泄漏信号落在GSM接收机信道内,提高了GSM接收机的噪声电平,使GSM上行链路变差。
其它同频段无线设备、干扰器:通讯设备种类繁多,有些特殊单位的无线设备占用了GSM频段,造成干扰。
3.3.2.2发现干扰的途径
1、干扰带测量
BTS在空闲时可以利用一幀中的空闲时隙对其TRX所用频点的上行频率进行扫描,并统计到五级干扰带中去,上行干扰将体现在干扰带话统中。若话统中出现2级,就有可能存在干扰;而对于市区频率复用度大,若话统中出现3~5级,就要重点考虑是否有干扰存在。
例如下表,BSC203中LSGSVC_邮运局1、LSGSPC_铁崩岗居委会2的全速率干扰带3-5占比非常高,这与这两个站的下行TBF掉线率高有较大的关系。
CELL
| TBF掉线率
| 全速率干扰带3-5占比
|
LSGSVC_邮运局1
| 14.039
| 78.53%
|
LSGSPC_铁崩岗居委会2
| 10.423
| 100.00%
|
图表 9 BSC203 干扰带分析
2、上下行接收质量
通过上下行接收质量不同等级的百分比,来标识网络的空口误码情况。通过检查接收质量,可以从侧面来了解整个网络的质量情况,一般来说当上或下行接收质量4~7的占比较高时(超过50%),UM口的质量就较差了,对于无线链路承载的业务来说影响就会非常大,对TBF掉线的影响自然就不小,这需要从网内、网外的干扰以及基站硬件等方面来查找原因。
例如下表小区中的上下行接收质量4~7级的占比较高,从侧面反映了这些小区的无线质量情况较差,这与这些站的TBF掉线率高有较大的关系。
CELL
| TBF掉线率
| FR上行接收质量4--7
| HR上行接收质量4--7
| FR下行接收质量4--7
| HR下行接收质量4--7
|
LSGSPC_区发改委(M)0
| 33.141
| 0.00%
| 100.00%
| 75.00%
| 100.00%
|
LSGSPC_市政协1
| 18.1
| 0.00%
| 0.00%
| 91.67%
| 0.00%
|
LSGSPC_新鼎酒店(M)0
| 17.463
| 0.00%
| 0.00%
| 89.47%
| 0.00%
|
LSGSPC_帝人酒店(M)0
| 13.861
| 0.00%
| 0.00%
| 100.00%
| 0.00%
|
LSBSPC_木如居委会2
| 10.993
| 0.00%
| 0.00%
| 58.62%
| 0.00%
|
LSGSVC_轻工宾馆1
| 10.974
| 0.00%
| 0.00%
| 63.78%
| 0.00%
|
LSGSPC_铁崩岗居委会2
| 10.423
| 54.74%
| 100.00%
| 90.00%
| 61.54%
|
LSGSPC_千喜3
| 10.313
| 0.00%
| 0.00%
| 100.00%
| 0.00%
|
LSGSVC_林聚宾馆2
| 9.01
| 0.00%
| 0.00%
| 100.00%
| 0.00%
|
图表 10 BSC203上下行质量分析
3.3.3过覆盖问题
一般在密集城区,基站与基站之间的距离较小,一般在500~800M之内,而且正常的规划,是希望业务能够驻留在它的主覆盖小区内,所以在密集城区内的小区TA分布应该主要在TA≦2以内。如果小区的业务主要分布在TA>2以上的区域,那么这个小区就有可能越区覆盖,这样不但自身的业务质量不能够得到保证,而且还有可能对其他小区产生干扰。
XX市市区内,站间距基本在700M左右,有的甚至只有200~300M,而且基本为900M站点,所以市区部分区域内的基站分布还是比较密集的。
对BSC203的TA分布与TBF掉线率进行相关分析,发现有几个站的TA分布过大,如下表,这可能与TBF掉线率高有一定的关系。
建议对下表中TBF掉线率高小区进行现场勘察,找出TA分布过大的原因。
CELL
| TBF掉线率
| TA>2的分布
|
LSGSVC_东郊电信3
| 8.926
| 70.90%
|
LSGSPC_XX市市民宗委3
| 8.735
| 100.00%
|
LSGSVC_二高2
| 7.142
| 100.00%
|
LSGSPC_XX市市民宗委2
| 7.628
| 22.12%
|
图表 11 BSC203 TA分布分析
3.4 现场测试以及硬件检测
3.4.1 CQT测试
现场CQT测试是解决问题最长用方法最有效的方法,但由于其费时耗力,成本相对较高,一般都是对要点和难点才使用的方法。
对于这类TBF掉线率的现场CQT测试,重点是发现问题和重现问题,到现场要在典型区域内进行数据业务的测试,留意语音业务是否也有异常,并记录现场的无线环境。具体的测试方法就不在此复述。
3.4.2基站硬件故障排查
基站硬件正常与否是设备能够正常运行所承载的业务是否能够正常使用的先决条件,基站故障分为显性故障和隐性故障。
3.4.2.1显性故障
显性故障能够在监控告警平台得到,一般由维护部门进行处理,网络优化部门只需了解并跟进处理进程即可。
3.4.2.2 隐性故障
基站隐性故障定义,所谓基站的隐性故障是指那些没有明显的告警,但对基站的性能有影响的故障,或者是那些反复出现后又往往能自行消失的告警。这些告警的存在将使得系统的性能指标受到影响,同样基站隐性故障也能够导致TBF掉话率的提升。由于这些问题的隐蔽性,往往无法直接发现它们,因此我们需要借助其他方法才能发现这些潜在的故障。
发现隐性故障的方法
1)话务统计
话务统计提供了各种指标去衡量系统服务的好坏。基站的很多故障都会反映到话务统计的某项指标上来。常用的指标有信道完好率,掉话,切换,无线接入性等,另外华为载频级话务统计也是发现基站隐性故障的好方法。如果基站存在问题,则有可能影响到其中一项或者几项指标。因此如果这些指标的变化,特别是在没做任何参数修改的情况下发生了变化,我们应该考虑基站硬件的因素。
2)路测
路测能够最直接的反映系统真实运行情况和最终用户的感知。因此对路测文件的分析也往往能帮助我们发现问题。
3)用户投诉
用户的投诉可能会是由基站的硬件引起,如基站的发射功率不稳定导致用户手机信号不稳。对投诉信息加以提炼和分析,能帮助我们发现存在问题的区域。
常见的隐性故障
1) 基站连线错误,例如收发线连错,华为3012基站就比较容易出现这类错误。
2) 基站连线松动,基站连线松动是最容易引起上下行平衡指标异常的原因。
3) 基站板卡故障,这类板卡故障一般没有告警,通过插拔或更换板卡后故障现象消失。
4) 机房高温,机房高温一般在出现在机房外部告警故障,且天气炎热空调故障的地方。
3.4.3检查天馈
天馈硬件故障,或者参数配置错误如:塔放因子、发射接收模式等,另外天馈存在问题,可能会导致上下行不平衡,鸳鸯线等问题,这些都会都导致下行TBF掉线率高,以及其它网络问题。
一般可能出现的天馈问题如下:
1. 由于工程方面的原因,两个小区间的发射天线接反,会造成小区内上行信号比下行信号电平差很多,在距离基站较远处容易产生异常。
2.定向小区有主集和分集两副天线时,该小区的BCCH和SDCCH就有可能分别从两副不同的天线发出。当两副天线的俯仰角或方位角不同时,就会造成两副天线的覆盖范围不同,即会出现用户能收到BCCH信号,但发起数据业务时却因无法占用另一天线发出的PDCH而导致异常。
3.如果天馈线损伤、进水、打折、接头处接触不良均会降低发射功率和收信灵敏度,从而产生业务异常的现象。
这些问题一般都可以通过现场测试和勘察来发现并解决。
4 .小结
本文以XX市BSC203为例,通过对该BSC部分高下行TBF掉线率小区的分析,介绍了处理高下行TBF掉线率小区的一般思路,由于下行TBF掉线率的分子为N3105溢出导致下行GPRS TBF异常释放次数,而N3105又是监听下行TBF链路质量一个计数器,所以处理下行TBF掉线率的主要思路,就是围绕TBF链路的质量来开展,这包括G-Abis链路质量和无线空中接口质量以及基站硬件,这些就是影响TBF掉线率的主要因素。