论文部分内容阅读
为了筛选出散播垃圾语音的用户,建立了一种采用基于加权k-means和支持向量机的垃圾语言识别方法.该方法依据用户的历史通信活动建立通信行为网络模型,用加权的k-means算法对用户进行半监督聚类,然后从每个类中均匀选取部分用户数据作为训练集,采用支持向量机获得训练模型用以预测剩余用户数据.实验结果表明,该方法的用户分类更细化,并具备预测功能,有一定的机器学习能力,可用于大客户发现及关联客户发现和业务推荐等.