三.MSC内部软件资源的使用情况
1.用命令<104. 查看是否有模块短暂超负荷,正常应无模块显示
2.用MACROOVMON检查MRSACE,SACEIN等模块的资源占用状况及是否有过载情况
MBUFOVL|UBUFOVL|PCBOVL|RDQ LIMIT #INTLOADAVRGOVL|
1024| 1913K|511|64200| MAXIMA
========================================================================
10010| 1733K0|4620| 0 48 0 0% 3% 0|
10010| 1733K0|4620| 0 48 0 0% 2% 0|
以上4个OVL FLAG均为FALSE,说明无过载情况,另外实时的MBUF和UBUF均略小于最大值,说明无BUFFER吊死情况,LOAD及AVRG值均很小,说明该模块负荷不高
对于SACEIN模块,如果LOAD,AVRG值较大,如大于30%,则在SACEIN模块中TRACE 15987T
MSG NAME TYPE SRC_PIDSND_BY DST_PIDRCV_BYTIME
15987 SIG_TO_SIG (BIF)18E0_601D2110_2419 0FF0_SUPRCV
B_BUFFER_PTR=7CA8:0000
B_BUFFER_LEN=005C
MSG_DATA =0101 0000 0000 0000 0000 0000 0000 0000
1FE0 0000 1FE0 0000 0097 0000 11C0 0097
0000 0000 0200 0730
COMPLEX_MESSAGE(START = 0004, LENGTH = 0058)
VIRTUAL_MESSAGE(START = 0008, LENGTH = 0054)
MBID 0072=002E
MBID 005D=0000 2B00 1AA0
MBID 005E=0217 0EF4 3A50
MBID 0034=15
MBID 0066=1202 0000 0000 0000 0CC0 0000 D406 0000
0000 0000 0001 0000 XX00
MBID 005A=FF90 0229 FF03 0000 0000 0000 0000 0000
USER_BUFFER+0058=0F6D 0000
对于MBID 005D=0000 XXXX YYYY,MBID 0034=15的情况,则从MBID 005E中得到MRSACE中的LCEID(3A50),用MACRO CEIDS

,3A50得到MRSACE的NA,对该模块做RESTART,使用参数BYT ROM+2E=1
3.检查SACEIN计费数据设置,在每一SACEIN中R_CHG_LCE应有且仅有一个TUPLE。对应的R_CHG_LCE.D_CHG_LCE < E28,如D_CHG_LCE > E28,则需修改数据,修改原则,D_CHG_LCE < E28,并且各SACEIN、ENTUPTCE、MRSACE、DNTUPTCE中D_CHG_LCE的值各不相等。
4.用MACRO A_STATS检查MRSACE中各种资源占用情况,是否存在资源吊死:
1)UMI
2)SCCP
3)MAP
4)MAIN
5)LINK
6)APR
7)XDH
8)DTMF
9)HONR
5. 检查SACEIN资源占用情况,详见附件“检查IN资源的步骤”。
6. 检查R_LMS_DATA占用情况:
<COUNT-TUPLE:1=”R_LMS_DATA”,2=”D_TP_STATE”&1&”0”,NA=H’XXX(MRSACE);
一般其值在30以下;
四.补丁及软件版本的检查
通过以下人机命令采集交换机补丁及软件版本信息:
<BUILD-SC-FILE.
<DISPLAY-SC-FILE:ALL.
<7835

DEV=DKA1P0,NBRREC=ALL.
将收集下来的数据发到公司相关部门进行检查以确定补丁及软件版本数据是否正确
五.信令跟踪及分析
根据TKG REPORT和BSC REPORT结合具体情况,对部分局向的信令进行跟踪分析,一般应包括到BSS的接口,到PSTN的接口,到其它MSC的接口,到HLR的接口。对于到BSS的接口应注意统计CR与CC消息之间的比例,二者应基本相等,如有一定出入,应调查产生的原因,注意调查各项失败的消息(如切换,位置更新等),另外还可通过AGLAE工具分析信令,找出可能存在的问题。对于到PSTN和MSC地接口,应对呼叫失败(如CFL,SEC等)消息进行分析,判断失败的原因,如为本局原因,应予以详细分析并解决,如为对端局原因,应给出报告由移动公司与对端局协调解决
六.系统告警的处理
1.检查并消除现存的硬件告警
<19

ption=all.
<45:sbltype=ctle,state=2&3&4&5&6,option=all.
<45:cat=network,state=2&3&4&5&6,option=all.
<45:sbltype=cllk,state=2&3&4&5&6,option=all.
2 .做网络及时钟例测,并根据例测结果排除故障
<452:testcat=rt,devtype=network
<452:testcat=rt,devtype=ccld/clcs/ctod/tlcs/ofll/opll/pfll/d tge/ctgc,na=h'1c&1d.
<452:testcat=rt,devtype=tlsr/racl,en=h'1c&1&h'1c&2&h'1d&1&h'1d&2.
以上各个项目请分开做
为了节约时间,请安排机房人员在检查前完成。(例测工作必须安排在晚上进行)
3.检查各外设的工作状况(包括MODEM,ATOM,HYCON终端等),并检查机架后电缆是否存在安装混乱,不规范的情况
4. 分析最近的系统报告,是否存在异常,在分析中应注意中继数不匹配,信令翻转,传输不稳,模块翻转等情况
5.在PSACE 中TRACE REL R_CAUS_TAB看是否有异常CAUSE产生
SomeCAUSE analysis:
Ø41_TERMPORARY_FAILURE & 47_RESOURCE_UNVALAIBLE is caused by BSS side failure.
Ø38_NETWORK_OUT_OF_ORDER is caused by no response for some operation initialed by MSC.( send routing info etc.)
Ø192_PATED_FAULT&193_ANI_FAILED the PATED data failure will cause the problem.
Ø161_SOFTWARE_RESOURCE_UNAV for this case, there must be some resource (message &userbuffer or others) problem. We can trace MSG 119T in original CE, then get the error point which send this cause.
Ø224_CHG_FAIL_NO_RECORD&225_CHG_FAILURE for this case, charging record occupation in original CE and charging data should be check.
Ø18_NO_USER_RESPONDING SYSTEM LOCATION=1FH for this case,msc send setup to bss,but bss no call confirm return to msc,so it is the bss problem
针对各异常CAUSE分析其原因,设法消除异常CAUSE,对于最后一种情况,建议在R_CAUS_TAB中做数据使其播放与普通PAGING 失败不同的录音通知(如PAGING 失败放‘不在服务区’的可以播放‘暂时无法接通’)
6.在部分重要模块(MRSACE, SACEIN, LRACE, PSACE, EPMDBS,SACECP, SACEN7, SACEADM, SACECHRS)中TRACE MSG 119T看是否有异常消息