【摘 要】
:
为改善传统K-modes在无序分类数据聚类中忽略多属性和属性间差异的问题,以及解决算法在高维和动态增量数据聚类的应用,提出基于Spark与改进K-modes增量聚类方法。提出多属性
【机 构】
:
工业互联网创新中心(上海)有限公司
【基金项目】
:
工业大数据信息服务平台(ZN2016020106)
论文部分内容阅读
为改善传统K-modes在无序分类数据聚类中忽略多属性和属性间差异的问题,以及解决算法在高维和动态增量数据聚类的应用,提出基于Spark与改进K-modes增量聚类方法。提出多属性值modes的新相异度度量方法,在保留多属性的同时,引入基于信息熵的属性权重计算方法,以综合考虑不同维度下属性差异;提出基于多原则的迭代方法对聚类中心K进行优选,提高聚类准确率;基于Spark平台,引入增量聚类思想运行改进算法;最后搭建Spark实验环境对提出方法进行验证,结果表明改进K-modes聚类的准确率明显优于传统K-m
其他文献
为探究蓄水坑灌条件下苹果树冠层导度的日变化规律,使用茎流计法计算冠层导度,运用方差分析、相关分析、回归分析对蓄水坑灌和地面灌溉不同处理下苹果树冠层导度的日变化特征
在6月20—22日的2012年亚洲移动通信博览会上,除LTE这一最大焦点,互联汽车、私宅安全设备、智能电表、远程医疗为代表的移动互联生活应用也成为三天之中参展者与媒体关注的热点
今年的上海高考改革有大的动作:考生的报名、学校的录取都尽量采取社会化方式.这就是说,学生在接受学校的报考志愿的指导之后,以后的一切考试工作就和学校脱钩.准考证是计算
退耕还林是一项由政府倡导的系统工程.然而,在退耕还林地区,农民生活环境和生产条件相对恶劣,农民收入增长主要依靠土地经营规模和单一粮食生产.因此,在退耕还林过程中,调整
为提出新型沼液复合微生物肥合理的灌溉施肥方案,采用二因素三水平完全组合设计,研究了不同水肥供应水平对露地西瓜生长发育及产量品质的影响。结果表明:中水高肥有利于提高
无线充电顾名思义就是不借助电源线就完成对电子电器产品的供电,从而解决电器“线的束缚”,方便用户使用。这听起来很玄乎,实际上,电能除了直接使用电线传输外,还可以转化为磁场能
引黄灌区在我国经济社会发展中占有不可替代战略地位与作用。然而,黄灌区用水矛盾加剧、水肥利用效率普遍低以及面源污染问题突出,必须大力发展滴灌技术,提高对作物供水保障
为解决图像语义分割中感知细节部分的能力较弱、分割结果粗糙的问题。首先利用深度残差网络-101取代完全卷积网络中的VGG-16;然后在conv3和conv4采用跳跃连接结构对上采样结果进行优化;最后以8倍上采样获得最终分割结果。实验使用PASCAL VOC2012数据集,从定性和定量两方面进行实验对比,实验表明所提出的方法平均IOU由67.3%提升至69.8%,并由测试结果显示改进的网络使得分割不同
以甘肃省玉门市为典型案例区,基于水足迹理论和CROPWAT模型,利用气象和农业数据,对1981-2017年该地区小麦、大麦和玉米3种主要粮食作物生产水足迹进行核算,并分析其变化特征