以前直做网优,现在做建设了,积累的大量数据,自学了Python,机器学习,AI,用这些来从业务角度给4G基站分个类,可用于规划方面(从投资角度,哪些类别的站点更值得投资,而不是从网络质量角度,思路的转变)
我们实际工作中经常要使用各种数据,AI三阶段,收集数据、分析数据、预测未来。利用
Python库可以简单的实现聚类(无监督学习),多说无益,给大家一段我写的代码,自己玩吧。
使用最简单的k-means算法,简单说就是计算各数据维度的欧式距离,然后平均,然后迭代,最后找出最好的聚类。用到几个库。
import numpy as np
from scipy.cluster.vq import vq,kmeans,whiten
import pandas as pd
a1=pd.read_excel('c://python36//站点分类datav2.xlsx')#自己搞表格
data1=a1.loc[:,['用户数/天','4G流量(G)/天']].values#分类维度越高,对计算机要求越高,当然越有意思
whiten=whiten(data1)
centroids,_=kmeans(whiten,3) #分成3类,可以改
re1,_=vq(whiten,centroids)
print(re1)
re1=pd.DataFrame(re1)
output1=pd.merge(a1,result1,left_index=True,right_index=True)
output1.to_excel('output1.xlsx')
print('已输出到output1.xlsx')
#我这就二千多行数据,分类速度还行,前几天搞个用户分类几十万行,电脑太撮,搞一晚上
抛砖引玉,还有其他聚类方法,大家可以讨论,我这还用其他方法对用户进行了聚类,应用很多,欢迎讨论。
[[i] 本帖最后由 shangt 于 2018-5-16 14:47 编辑 [/i]]
扫码关注5G通信官方公众号,免费领取以下5G精品资料
1、回复“iot6”免费领取《【8月30号登载】物联网创新技术与产业应用蓝皮书——物联网感知技术及系统应用》
2、回复“6G31”免费领取《基于云网融合的6G关键技术白皮书》
3、回复“IM6G”免费领取《6G典型场景和关键能力白皮书》
4、回复“SPN2”免费领取《中国移动SPN2.0技术白皮书》
5、回复“LTKJ7”免费领取《 联通科技周17本白皮书合集》
6、回复“5g-a”免费领取《中国联通5G-A 通感算融合技术白皮书》
7、回复“URLLC”免费领取《中国联通5G URLLC 技术白皮书》
8、回复“LDSL”免费领取《中国移动算力网络技术白皮书》