VoLTE-MOS无线优化分析思路V1.docx
QCI1语音的丢包率要求低于1%,实际测试的时候,只要有丢包,MOS值就会下降。虽然只丢几包,但是对语音质量确是致命的,是造成语音MOS值下降最重要的因素,尤其是连续丢包,相当于语音流有断篇的现象。
时延也是影响语音质量的重要因素。协议23.203 规定QCI1语音的时延是100ms,也即是单侧时延。实际测试时,时延是小于100ms时,语音效果很好;但是端到端时延达到300ms时,即单侧时延达到150ms时,语音质量会下降。需要说明的是,在协议23.203中并不是要求所有包时延都要小于100ms,98%以上的包时延都要小于100ms,那么端到端时延要求就是200ms。
Jitter buffer用于缓存RTP包,目的在于降低抖动,属于终端侧声码器前端的设计,与终端有关,终端抖动的容忍能力具体需要结合不同厂家的终端给出评估结果。中移动要求的是40ms,高通建议在50ms~60ms比较合理。
目前语音编码方式有多种,且每种方式采用不同的语音编码,使得MOS分值差距也比较大。传统的电话语音编码采用窄带编码方式,采样频率是8kHz,这在很大程度上影响到声音的真实性;而VoLTE采用宽带AMR编码方式,并能达到23.85kbit/s的编码速率,采样频率可达到48kHz,对语音质量有较大的提升。
VoLTE语音自身上下行平均MSC值的变化,也是影响MOS分值的主要因素,下图为1月份全省MOS 3.0占比与上行平均MSC值的关系图:
不同设备之间存在的差异、语料、音量调节和线缆接触的问题,均会对MOS评分产生不同程度的影响。
当通过测试软件+MOS仪表测得的MOS值较差时,排除设备、语料等问题后,需要确认MOS值差主要是受到哪个因素影响(时延、抖动、丢包),再分类排查,主要确定的手段有:
在EMS上,利用KPI统计,可以查看上下行QCI1总的包个数、丢包个数、丢包率、下行弃包个数、弃包率、下行QCI1 PDCP SDU平均时延与平均抖动。
其次,需要确定问题出现在上行还是下行方向,缩小排查范围,并在UE侧与S1侧同时抓包,可以确定上下行时延以及上下行丢包发生的时刻。具体参考《wireshark抓包指导书》。
RTP丢包排查手段:
(1)查看空口是否有丢包:查看内容如下所示:
如果上述3个值都为0,则一般来说空口没有丢包;如果大于0,原因分析如下:
a)“小区上行QCI1 PDCP SDU丢包个数”大于0,指的是eNB UL PDCP
收到的SN不连续,可能的原因有:
i. 上行有HARQ FAIL,导致丢包。
ii. 上行调度不及时,导致UE导致上行PDCP discard timer超时弃包,可能原因有:eNB ULPHY或者CMAC处理能力受限,上行每TTI调度UE数不够,导致SR/BSR堆积;eNB ULPHY没有检测到SR:UE发了多次SR ,eNB才检测到,虽然没有SR达到最大次数,但UE 上行PDCP discard timer已经超时,导致UE弃包。
iii. 即没有HARQ FAIL,UE也没有 PDCP discard timer超时,那可能是UE误检了DIC0,从而导致发送了ULPDCP数据。此时,需要核对 CMAC一级log,看看是否属于误检。
b) “小区下行QCI1 PDCP SDU丢包个数”大于0,指的是eNB 下行RLC通知下行PDCP该包丢了:对于UM,下行HARQ FAIL则认为丢包;对于AM,下行RLC达到最大次数,才认为丢包。
c) “小区下行QCI1 PDCP SDU弃包个数”大于0,指的是eNB下行调度不及时,导致下行PDCP discard timer超时,弃包。
(2)查看核心网是否有丢包:
a) 最直接的方法是:在S1口镜像抓包一段时间,过滤上下行RTP报文,看是否相等。
b) 简单的方法是:查看“小区上行QCI1 PDCP总的SDU个数”和“小区下行QCI1 PDCP总的SDU个数”是否基本相等。如下所示:
可以统计一段时间,保存成excel,然后看两者差值,来计算核心网的丢包率。以下情况可能会导致两者不相等,排除以下情况后,就是核心网导致的丢包了:上行ROHC解包失败或者下行ROHC压缩失败:上行空口有大量HARQ FAIL丢包,即“小区上行QCI1 PDCP SDU丢包个数”远大于0,这个会影响eNB 上行ROHC解包,可能会导致解压失败;ROHC Bug,导致解压失败:判断是否有ROHC失败的方法,telnet到用户面产品进程,输入ShowRnluRohcAllFailStat多次,看错误统计是否有增长。 可同时输入ShowRnluRohcAllSuccStat,看正确统计,由此可计算ROHC错误比率。
(3)查看应用层是否有丢包:如果空口和核心网都没有丢包,但端到端RTP还有丢包,就要抓应用层报文了,看上行应用层到UE ULPDCP是否有丢包;下行UE DLPDCP到应用层是否有丢包。
根据中移动关于MOS指标考核方法,无线侧优化思路就是采用正确的测试方法,选用性能良好的终端,选取高清AMR-WB编码(语音样本的不同影响MOS高度),在丢包、抖动和时延指标达标或影响较小时(一般来讲,若这三个指标不达标或较差,排查和定位较为麻烦,需要抓取现场LOG交由后方研发排查定位)。通过提升覆盖和质量,减少切换(尤其避免eSRVCC切换到2G),调整参数等手段来提升MOS考核指标。
随着RSRP或SINR逐渐降低,MOS分值整体趋势也呈下降趋势,但RSRP或SINR的陡降或陡升与MOS分影响无明显关系。
覆盖要求:RSRP>113dBm&SINR>0dB时能满足VoLTE基本感知。
LTE覆盖差区域,建议eSRVCC B2本系统门限在此区间配置[-110dBm,-115dBm];对于特殊场景,如快衰落,可以根据具体情况增大门限提前切换。
若某些区域或道路LTE弱覆盖,需要平衡考虑是否通过调整eSRVCC将VoLTE语音切换到CS域,还是直至弱覆盖掉话。前者牺牲的是MOS(CS域MOS比VoLTE低1.5~2左右),后者牺牲的是掉话率。
(1) SINR与MOS评分关系
以下从SINR不同场强下与不同MOS区间值的个数占比变化趋势,及SINR与MOS均值变化趋势,以此两个方面来观察SINR对MOS的影响。
从下图箭头所指红圈内可观察到:
从不同MOS区间值的个数占比角度看,从SINR值在0dB ~ -1dB左右时,随着SINR的降低,各区间MOS个数占比波动频繁,尤其3.5<MOS<4.5的个数占比开始小于MOS<2的个数占比;
从MOS平均值(图中红色虚线)角度看,随着SINR下降,MOS也呈下降趋势,在0dB ~ -1dB左右时MOS均值低于3并呈下降趋势。
以下为1月全省VoLTE语音测试连续质差里程占比与MOS 3.0占比关系图,呈正相关性。
(2) RSRP与MOS评分关系
以下从RSRP不同场强下与不同MOS区间值的个数占比变化趋势,及RSRP与MOS均值变化趋势,以此两个方面来观察RSRP对MOS的影响。
从下图箭头所指红圈内可观察到:
从不同MOS区间值的个数占比角度看,从RSRP值在-112dBm ~ -113dBm左右时,随着RSRP的降低,各区间MOS个数占比波动频繁,尤其3.5<MOS<4.5的个数占比开始小于MOS<2的个数占比;
从MOS平均值(图中红色虚线)角度看,随着RSRP下降,MOS也呈下降趋势,在-113dBm左右时MOS均值低于3并呈下降趋势。
空口无线环境的优化是LTE网络优化工作的重点,无线环境恶化不仅仅影响到语音业务同样对数据业务有很大影响,采用的优化手段包含 DT测试、扫频测试、后台网管监控、MR分析等多个维度并行实施。
类型 | 表象 | 排查方法和优化建议 |
无覆盖/弱覆盖小区 | 扫频和DT测试中检测不到任何小区的信号或者信号非常弱 | 1:排查周边基站是否存在告警,处理和恢复故障 |
2:勘察周边地形,是否存在遮挡导致覆盖黑洞,通过新建站点、周边小区RF优化缓解来解决 |
3:核查站点分布和方位角、俯仰角是否合理,通过新建站点、RF优化来解决 |
越区覆盖小区 | 扫频和DT测试中收到2圈以外小区信号,信号强度大于或相差近端主小区6db以内,均认为越区覆盖,常常伴随邻区缺失、质差等问题 | 1:排查近端基站是否存在告警,处理和恢复故障 |
2:勘察站点环境,是否存在高站情况和俯仰角不合理问题,通过降低天线挂高,控制俯仰角方式解决 |
无主导小区的区域 | 扫频和DT测试中存在主邻小区电平差6db内并小区个数大于3个以上,则认为重叠覆盖区域。 | 1:综合容量分布、站点环境进行多站点联合RF优化,通过调整方位角、俯仰角、功率配置的方式来减少重叠覆盖小区数量。 |
2:提供合理组网规划方案,采用异频组网、迁移基站方式来解决重叠覆盖问题 |
上行干扰 | 前台测试中无法直接发现,间接表象为UE的发射功率通常较高(接近UE最大发射功率),伴随上下行交互信令过程中无法及时收到下行信令。通过后台NI测量可以发现基站低噪是否正常。 | 1:核查基站是否有异常告警,优先解决 |
下行干扰 | 前台测试中RSRP较好(>-100dbm),但是SINR较差(<0db),则认为存在下行干扰问题 | 1:规划数据是否合理,规避近距离同PCI情况(建议核查距离>3KM) |
2:排除模3干扰,减少重叠覆盖区域,通过RF优化手段解决 |
3:排查系统间、系统外干扰,通过扫频等手段进行处理 |
外部干扰 | 前台测试表象和上面描述上下行干扰类似,发生的时间、地点上具有规律可循,比如多次测试中,同样地点表现出来的干扰程度差距明显。 | 内部干扰排查之后,需要扩展到外部干扰排查方面 |