优化UE定时器改善RRC重建比例
概述
本次山东省LTE专项系统优化RRC重建比例目标值为0.7%,而济南市RRC重建比例(华为+诺基亚)目前指标值约为1.07%,与省内其他地市相比排名末尾。为改善网络整体质量,提升用户感知,优化组计划对该项指标质差原因进行精准分析,从多维度出发力求提升指标至目标值。

一、 话统数据
提取济南市全网(华为+诺基亚)一周RRC重建比例,指标趋势如下图。

1.1 RRC重建比例公式
RRC重建比例= {RRC重建请求次数/(UE发起的RRC连接建立成功次数+网络发起的RRC连接建立成功次数+RRC重建成功次数)}*100%
1.2 RRC重建测量指标
KPI ID | KPI 名称 |
1526727085 | RRC重建请求次数 |
1526727086 | RRC重建成功次数 |
1526727087 | 重配置失败触发RRC重建请求的次数 |
1526727088 | 重配置失败触发RRC重建成功的次数 |
1526727090 | 切换失败触发RRC重建请求的次数 |
1526727091 | 切换失败触发RRC重建成功的次数 |
1526730536 | 非源小区RRC重建请求次数 |
1526730537 | 非源侧小区RRC重建成功次数 |
1526741802 | 无上下文RRC重建尝试次数 |
1526741803 | 重配置失败触发无上下文RRC重建尝试次数 |
1526741804 | 切换失败触发无上下文RRC重建尝试次数 |
1526741805 | 无上下文RRC重建成功次数 |
1526741806 | 重配置失败触发无上下文RRC重建成功次数 |
1526741807 | 切换失败触发无上下文RRC重建成功次数 |
1.3 RRC重建失败测量指标
KPI ID | KPI 名称 |
1526727089 | 重配置失败触发RRC重建拒绝的次数 |
1526727092 | 切换失败触发RRC重建拒绝的次数 |
1526727093 | 资源分配失败而导致RRC重建失败次数 |
1526727094 | UE无应答而导致RRC重建失败次数 |
1526728270 | RRC重建拒绝次数 |
1526728271 | 小区内因为无上下文导致的RRC重建拒绝的次数 |
1526730857 | 预处理失败的无UE上下文导致RRC重建失败次数 |
1526739728 | 语音业务优先接入导致的重建失败次数 |
1526741808 | 无上下文RRC重建拒绝次数 |
1526741809 | 资源分配失败而导致无上下文RRC重建拒绝次数 |
1526741810 | UE无应答而导致的无上下文RRC重建拒绝次数 |
1.4 重建与切换相关的测量指标
由于切换流程中断后会发起重建,在eNB内也记录了重建回源小区的相关话统,重建中存在特定两两小区对,在eNB内记录了两两小区对之间的重建,用于进一步判断重建原因。
指标ID | KPI 名称 |
1526728904 | 小区通过重建回源小区的eNodeB间同频切换出执行成功次数 |
1526728905 | 小区通过重建回源小区的eNodeB间异频切换出执行成功次数 |
1526728902 | 小区通过重建回源小区的eNodeB内同频切换出执行成功次数 |
1526728903 | 小区通过重建回源小区的eNodeB内异频切换出执行成功次数 |
1526728908 | 特定两小区间通过重建回源小区的切换出执行成功次数 |
二、RRC重建分析流程
重建对网络影响分为两类:
1、重建尝试次数多:这个可以直接影响路测的掉话指标,特别如需要验收路测掉话,需要重点核查重建原因,减少重建次数。
2、重建成功率低:重建成功率低会直接影响掉话指标,可以通过话统直接观察。
2.1 全网话统指标分析流程

1、 按照全网指标分析结果,重点对最近1—2周话统指标进行分析,区分是否是突变还是持续升高,近期是否存在版本或参数修改。
2、按照指标达标分类,对需要解决是重建尝试次数过高还是重建成功率较低单独分开进行分析。
3、 分析统计结果,对Top小区实施优化措施;优化措施实施后对比该小区的掉话率指标是否改善;
4、分析优化措施是否可以全网复制,如果可以的话安排全网经验复制,分析实施后的指标是否满足要求,如果满足要求,那么结束优化;否则,重新进行TOP小区优化。
2.2 TOP小区分析流程
2.2.1 重建失败优化分析流程

1、重建失败首先要区分站内重建还是站间重建,站间重建想对于站内重建多了需要从源小区获取UE上下文的流程。
2、重建失败要区分是否收到重建目标小区的RRCReestabilishment消息,如果未收到则在重建准备阶段失败,如果收到了则可能由于在目标小区接入失败或重配DRB失败。需要具体查找接入失败原因。
2.2.2 RF优化分析流程

图1 RF优化流程图
获取该Top小区的标准接口信令,或DT路测log进行分析:
1、分析是否存在同频邻小区漏配或者错配导致的重建。
2、分析是否存在弱覆盖导致的重建,如果存在本系统内的弱覆盖,需要分析是否存在异频小区进行异频切换或者异系统小区可以进行互操作来弥补该弱覆盖区域。
3、分析是否由于切换不及时导致的重建,重建前终端上报的3A事件测量报告内最优邻小区的RSRP,同时检查之前测量控制重配置消息中的参数配置;参数涉及hysteresis、offset、time to trigger,看是否是参数配置明显不合理导致的切换不及时。
4、分析是否存在导频污染引起的重建,分析重建前重建上报的测量报告中是否存在多个小区RSRP非常接近的现象,如果存在3个以上的最强小区RSRP相同,那么很有可能下行的SINR很差,导致切换重配置消息UE收不到。
6、分析是否存在上行干扰导致的重建,由于当前LTE网络建设初期用户比较少,故系统内上行干扰的现象并不存在,系统外的上行干扰还没有相关的经验。一般如果某个用户在重建前其下行的CQI很高(在10左右),但是上行已经严重受限(MCS为0阶),则很有可能是上行存在干扰所致,需要进行干扰排查。
当分析完该TOP小区所有的重建,对不同的重建原因比例进行分析,如果RF原因占主要原因,根据原因开展RF专题优化。
三、重建原因分析
3.1 邻区错配/漏配
通过UU口信令如果发现eNodeB在收到UE上报的测量报告后未处理,并且X2口没有往目标小区发送Handover_request,并且随后发起重建,则可以怀疑为邻区漏配,并且可以从测量控制进一步确认。
3.2 弱覆盖
弱覆盖是指基于链路预算获得的最大路损覆盖,由于上下行支持的最大路损不一致,通常在LTE中上行较之于下行先受限,故在弱覆盖将分为上行弱覆盖及下行弱覆盖。
普通场景下行支持的最大路损为125dB,则按照导频是18.2dBm来计算的话,下行支持的最小RSRP为18.2-125.8= -117.6,若低于该电平值,则可以认为下行存在弱覆盖。
而上行支持的最大路损为126dB,则上行支持的最小RSRP为23-126= -103dBm,但上行接收机灵敏度会大于下行,因此门限值会略高,若上行低于该值,则就认为上行存在弱覆盖。只要是上行或者下行其中一个存在弱覆盖,则就有导致掉话发生的可能。
3.3 切换导致的重建
协议定义切换失败后可以发起重建,按照时间轴对切换进行分类:包括切换过早,切换过晚及乒乓切换。
切换过早时,可以通过重建回源小区。
切换过晚时,可以通过重建到目标小区,但更大可能会产生掉话。
从信令流程上看,一般在重建UE上报了邻区的A3测量报告,eNodeB也收到了测量报告,并下发了切换命令,但是UE侧收不到。
从信号变化趋势上来看,过晚切换主要有以下现象:
拐角效应:源小区RSPR/SINR陡降,目标小区RSRP/SINR陡升(即突然出现在邻小区列表中就是很高的值);
解决切换过早/过晚的问题,可以通过调整天线位置改善RF,修改切换参数或者配置使目标小区能够延后/提前发生切换,从而避免产生重建。
3.4 干扰引起的重建
通常干扰分为上行干扰及下行干扰,系统内干扰及外来干扰。
通常,对于下行,当服务小区的RSRP高于-90,但是SINR低于-6,基本上可以认为是下行干扰的问题(当邻小区错配/漏配或切换不及时的时候,也可能出现服务小区RSRP信号很好,但SINR很差的情况);下行的干扰通常是指导频污染,指覆盖地区存在3个以上的小区满足切换条件,由于信号的波动常常出现频繁小区重选或者乒乓切换,可能会导致掉话。
通常在没有干扰的情况下,上下行是平衡的,而当下行存在干扰时,会体现在下行受限,上行不受限;而存在上行干扰时,则是上行受限但下行不受限。
3.4.1 RLC发起重传的原因
在以下几种情况下,RLC会发起重传
1、DRB:收到对端的状态PDU的负确认(NACK);
2、SRB:没有收到对端的状态PDU,没有新数据发送,同时POLL周期定时器超时;
3、DRB:没有收到对端的状态PDU,发送窗满,同时POLL周期定时器超时。
对于1,存在MAC层发送RLC数据时,几次HARQ重传都失败的情况,才会有RLC层的负确认。如下图所示。
收到对端的状态PDU的NACK
对于2和3)都是在没有收到对端状态PDU的情况下,由定时器超时触发的RLC重传,对于没有收到对端状态PDU的原因有两个,一个原因为UE侧根本就没有收到任何RLC PDU,也就不会响应状态PDU,另一个原因为UE响应的状态PDU,由于上行误码的原因,没有到达eNB。如下图所示。
在现网中,RLC达到最大重传次数引起释放的主要原因,大多都是SRB上下发的重配置命令消息无法到达UE。
UE发起重建的原因为上行数据发送失败,达到最大重传次数。
3.4.2 eNB端RLC达到最大重传次数
对于RLC达到最大重传次数的原因分析如下:
1、网络覆盖的原因,导致存在弱覆盖区域,因为信号差导致;
2、UE终端问题,从之前的掉话分析,较大情况是因为UE问题导致PDCCH漏检
3、其他
此处理可能会对现网商用网络产生的影响分析如下:
1、语音业务:由于VOIP使用UM 的RLC,DRB上不会产生RLC达到最大重传次数的情况,不会产生额外的影响;
2、其他数据业务:在由于UE终端问题或弱覆盖原因时,会导致业务传输失败,产生较差的用户感受。在RLC达到最大重传次数时后准备释放UE,在这时间内若UE检测到RLC达到最大重传次数或SRI达到最大重传次数,会发起重建请求。若是终端问题引起的UE发起重建链接,会重建成功,业务可能会恢复正常。如果是弱覆盖区域,则发起的重建链接也可能会失败,或者建链成功但业务依旧传送失败。
如果是网络覆盖问题,重新接入和等待重建是一样的现象,即使重新接入所做业务也不会提高用户的感受,直接重新接入只会增加一次异常掉话的次数和接入次数。而且UE在DETACH再重新接入时,需要发起上行直传消息和接收下行直传消息,在网络覆盖差的情况下,这两条直传消息也可能出现发送失败,如下图所示。
四、RRC重建相关参数
4.1、TOP终端重建优化
EnhancedRRCReestProtectThd该参数表示重建保护门限。由于终端厂商的复杂性,可能存在终端与eNodeB对协议的理解不一致,触发UE发起重配置失败的RRC重建流程,当RRC重建成功过之后又触发相同的重配置失败场景,从而引发了终端不停触发重建。当该参数设置为0时,表示不使用重建保护功能;当该参数设置不为0时,表示使用重建保护功能。重建保护功能就是当相同的UE一分钟内在同一基站中触发重配置失败原因的重建请求次数超过该重建保护门限,该基站拒绝重建请求。)建议值:需要使用重建保护功能时,建议值为:20,对无线网络性能的影响:当该参数设置不为0时,重建保护门限越大,重建成功率越高;重建保护门限越小,重建成功率越低。
4.2、切换Msg2消息优化
该参数用于终端切换入目标小区且重复发送专用前导时,是否做RAR功率抬升优化措施的开关参数。当开关关闭时,不对切换用户RAR功率做进一步抬升;当开关打开时,且当识别出为切换入用户重复发送前导时,在小区级参数RaRspPwr的基础上进一步抬升RAR功率,每次抬升3dB,最大抬升6dB。对无线网络性能的影响:在下行弱覆盖或干扰场景下打开该优化功能可提高小区专用前导接入成功率和切换成功率,缩短切换时延。
4.3、优化切换定时器
该参数表示系统内切换时使用的定时器T304的时长。如果UE在该时长内无法完成对应的切换过程,则进行相应的资源回退,并发起RRC连接重建过程。对无线网络性能的影响:对于T304ForEutran定时器,如果UE在该时长内无法完成对应的E-UTRAN内切换过程,则进行相应的资源回退,并发起RRC连接重建过程。实际取值范围:ms50, ms100, ms150, ms200, ms500, ms1000, ms2000 建议值:ms500(500)
4.4、优化UE定时器
定时器 310该参数表示定时器310的时长。UE在检测到物理层故障时,启动该定时器。定时器超时前,如果UE检测到物理层故障恢复,或者触发切换流程,或者UE发起连接重建流程,则停止该定时器。定时器超时后,如果没有激活安全模式,UE进入RRC_IDLE态;否则,发起连接重建流程。
定时器 311该参数表示定时器311的时长。UE在发起RRC连接重建流程时启动该定时器。定时器超时前,如果UE选择了一个EUTRAN小区或者异系统小区,则停止该定时器。
4.5、SIB2周期
该参数表示SIB2的传输周期,界面取值范围:RF8(8个无线帧), RF16(16个无线帧), RF32(32个无线帧), RF64(64个无线帧), RF128(128个无线帧), RF256(256个无线帧), RF512(512个无线帧),实际取值范围:RF8, RF16, RF32, RF64, RF128, RF256, RF512建议值:RF16(16个无线帧)对无线网络性能的影响:该参数配置越大,单位时间内的传输次数越少,系统资源占用越少,但是可能导致UE读取该系统消息块的时延增大;该参数配置越小则相反。
4.6、SIG日志上报开关
该开关用于控制SIG日志和信令软采是否上报。开关打开时,订阅的SIG日志和信令软采正常上报;开关关闭时,强制关闭已经订阅SIG日志和信令软采,并且新订阅的也不生效。
五、UE定时器参数验证
本次参数验证主要验证UE定时器T310、T311。T310默认值1000ms延长至2000ms,T311默认值10000ms缩短至1000ms。本次验证区域为章丘县,386个基站,1268个小区,验证时间10月21日0点。

六、效果评估
参数修改后,通过PRS提取章丘县KPI指标,RRC重建比例由0.72%降至0.50%左右,效果明显。
七、全网推广
对全网基站进行参数修改,T310=2000ms,T311=1000ms。通过PRS提取济南华为区KPI指标,RRC重建比例由0.75%降至0.47%左右,效果明显。
日期 | LTE 小区组 | E-RAB掉线率(%) | LTE系统内切换成功率(%) | RRC重建比例(%) | 无线连接成功率(%) | CQI≥7占比(%) |
2017-10-23 | 济南(勿动) | 0.0196 | 99.1133 | 0.7958 | 99.9191 | 96.8065 |
2017-10-24 | 济南(勿动) | 0.0204 | 99.1614 | 0.7836 | 99.9176 | 96.9141 |
2017-10-25 | 济南(勿动) | 0.0208 | 99.0712 | 0.7693 | 99.9209 | 96.9632 |
2017-10-26 | 济南(勿动) | 0.0251 | 98.6813 | 0.7357 | 99.3935 | 96.95 |
2017-10-27 | 济南(勿动) | 0.0237 | 98.6766 | 0.7608 | 99.691 | 96.864 |
2017-10-28 | 济南(勿动) | 0.0239 | 98.7862 | 0.7786 | 99.9095 | 96.4711 |
2017-10-29 | 济南(勿动) | 0.0238 | 98.9142 | 0.7797 | 99.9083 | 96.2168 |
2017-10-30 | 济南(勿动) | 0.0176 | 98.9246 | 0.714 | 99.92 | 96.837 |
2017-10-31 | 济南(勿动) | 0.0198 | 98.9355 | 0.7063 | 99.9194 | 96.7118 |
2017-11-01 | 济南(勿动) | 0.0189 | 98.6427 | 0.5092 | 99.9223 | 96.834 |
2017-11-02 | 济南(勿动) | 0.0204 | 98.6726 | 0.4964 | 99.9232 | 96.9485 |
2017-11-03 | 济南(勿动) | 0.0201 | 98.7513 | 0.4734 | 99.914 | 96.6061 |
2017-11-04 | 济南(勿动) | 0.0235 | 99.0365 | 0.4882 | 99.9108 | 96.7399 |
2017-11-05 | 济南(勿动) | 0.0207 | 98.8205 | 0.4639 | 99.9139 | 96.5656 |
2017-11-06 | 济南(勿动) | 0.0255 | 98.6182 | 0.4318 | 99.9205 | 96.9754 |

八、总结
本次对华为区UE定时器优化效果改善明显,华为区RRC重建比例由0.75%降至约0.47%。后续会将该参数在诺基亚区域进行修改,争取全网RRC重建比例达到目标值。