一种基于动态自适应数据窗口的模糊k-均值聚类缺失数据估算算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:q999666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
完整性是数据质量的一个重要维度,由于数据本身固有的不确定性、采集的随机性及不准确性,导致现实应用中产生了大量具有如下特点的数据集:1)数据规模庞大;2)数据往往是不完整、不准确的.因此将大规模数据集分段到不同的数据窗口中处理是数据处理的重要方法,但缺失数据估算的相关研究大都忽视了数据集的特点和窗口的应用,而且回定大小的数据窗17容易造成算法的准确性和性能受窗口大小及窗口内数据值分布的影响.假设数据满足一定的领域相关的约束,首先提出了一种新的基于时间的动态自适应数据窗口检测算法,并基于此窗口提出了一种改进的模糊k-均值聚类算法来进行不完整数据的缺失数据估算.实验表明较之其他算法,不仅能更适应数据集的特点,具有较好的性能,而且能够保证准确性.
其他文献
本文对我国自主创新的基本情况进行了简要说明和国际比较,并选取福建省2002~2006年数据,以线性回归分析说明了高新技术产业内部研究与开发(R&D)投入与减免税政策间的相关性。以此为
根据在当地苗圃的实际工作情况,在2011年进行了除草醚对落叶松除草试验.试验结果表明,应用化学除草醚进行苗圃地除草是经济有效的除草方法.
设施栽培葡萄的常见病害有白腐病、炭疽病、黑痘病、灰霉病:常见虫害有根瘤蚜、二星叶蝉、红蜘蛛.针对以上病虫害的发生和为害特点,本文提出了有效的防治方法.
近年来,随着大豆产业的进一步振兴,人们越来越注重对化肥的投入.然而从调查的情况看,目前肥料的利用率只有30%多,很大一部分被浪费了.为此,笔者根据多年的生产实践,就如何提高
近些年来,我国森林病虫害防治工作取得了不错的成绩,促进了生态环境的建设,但是,在防治工作中还存在一些比较严重的问题,这些问题对防治工作产生了较多的负面影响.基于这些问
本文对农作物常见肥害种类和发生原因做了深入浅出地分析,并提出了相应的防治措施,以供同行参考.
微耕机以其轻便、灵活、多功能、价格低廉的优势成为农民种田的新宠,在春种秋播中发挥了重要力量.随着国家购机补贴资金投入的加大,本县已有300余台微耕机,因此,微耕机的安全
生猪养殖是我国农业经济的一个重要组成部分,以时效短和利润高为主要特点.我国农业生产相较于工业和第三产业发展比较缓慢,农业产值一直处于低水平发展,生猪生产作为农村畜牧
本文结合作者的日常防治经验,介绍鸡传染性支气管炎的诊断要点以及遇到此症状所应做到的相应防治措施,为以后鸡传染性支气管炎的预防和治疗工作提供一定的借鉴作用.
组播数据的认证是安全组通信中的重点和难点问题之一,但目前没有一种有效方法能够真正适合所有组播应用领域的需求,如散列树的通信开销太大,而散列链不能应对网络传输中的数