源码.rar | |
---|---|
资料名称:源码.rar 资料大小:183.12 KB 上传时间:2019-03-09 13:51:38 下载次数:36 次 所需威望:30 个 您尚未登录本论坛,请先登录 资料等级: 您尚未登录本论坛,请先登录 |
|
您尚未登录本论坛,请先【登录】后再下载资料! | |
资料描述:源码.rar
探讨的场景:
+展开全部描述
1、数据源:取出大量指标或其他需要计算统计的原始数据文件(txt、csv等类型),几十或几百个甚至更多,当前这个例子为小时级的小区指标文件; 2、存在的问题,很难再短时间内对大量的数据计算出需要需要的结果; 需求:取出每个月,每个小区<最大RRC连接数>的最大的三天数据和其对应的其他指标;(迭代分组取TOPN的问题) 即: 第一次分组计算:取出每个小区每天24小时中,哪个时段的<最大RRC连接数>的值最大,并记录下这个时段(即自忙时); 第二次分组计算:以第一次分组结算的结果,作为数据源,取每个月中,每个小区<最大RRC连接数>最大的前三天对应的指标数据; 3、解决方案: 对于数据量比较大的场景,使用单机关系型数据库实现迭代分组的功能,耗时较长,有兴趣的朋友可以尝试一下,oracle里面的开窗函数可以解决此类场景的问题,但是具体性能如何,没有尝试过。单机mysql貌似没有能够有高性能的解决方案,我自己尝试过好几种写法,都无法避免索引失效导致的全表扫描问题;但无论如何,文件导入数据库的过程必然耗费大量时间。4、业务流程:5、代码过程落地: 6、源码:源码.rar源码.rar 7、视频说明:链接:[url]https://pan.baidu.com/s/1cer_qm6I2AC_69AgLZuotA [/url];提取码:2aqj 本站已经禁止了迅雷、快车等工具下载,请直接点击下载;如这类工具是你的默认下载工具,请取消再试。 如何取消? |