动态数据挖掘中的演化聚类算法的研究

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:helinjue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,数据挖掘的应用领域越来越广泛,传统的数据挖掘都是从静态数据库中发现知识,但是应用领域的数据大都是动态的,数据库中的数据都是随时间而变化的,采用聚类方法对数据进行聚类,如果每次数据更新后,都对数据集重新聚类,一方面是代价太大;另一方面,因未利用前一次聚类的有关信息,而导致了计算资源的浪费,因而,设计动态增量演化聚类算法以提高聚类效率成为必要。本文将人工免疫与分形理论应用于聚类,针对动态数据集提出了两种动态聚类演化算法。本文所做的工作和主要创新点为:(1)将核函数引入到人工免疫聚类中,提出了一种基于核函数的人工免疫动态聚类算法KAIDA,KAIDA通过核函数方法将数据映射到高维特征空间,在高维空间中计算新增抗原数据与已有记忆抗体之间的核空间距离,通过其与记忆抗体中心点识别半径的比较,决定新抗原数据是归到已有类中,还是对其形成一个新类。实验表明,KAIDA算法能有效的实现数据集的自组织动态聚类,且与相应的未引入核函数的人工免疫算法相比,能更好地减少非同类数据混合分到一起的数目,具有更高的分类准确率。为避免记忆抗体分布过于集中,且提高聚类结果的压缩率,引入了记忆抗体免疫抑制以优化算法,实验证明,优化方法提高了聚类结果的压缩率,增加了算法的合理性。(2)提出了一种基于人工免疫与分形的动态演化聚类算法,该算法考虑到分形聚类对初始聚类结果的敏感性,以及使用人工免疫核聚类方法对数据集进行聚类的高准确率,选用人工免疫核聚类方法对数据集进行聚类形成分形的初始聚类结果,选取密度大于密度阈值的类作为分形初始类,并计算各分形初始类的分形维数,在此基础上,利用分形局部与整体在结构或分布上具有自相似性的特点,将分形初始类以外的类按照合并后分形维数变化最小的原则合并到分形初始类中,这即为分形扩展聚类,实验表明采用基于人工免疫与分形的动态演化聚类算法对数据集聚类,结果准确率较高。
其他文献
随着地理信息系统(Geographic Information System,简称GIS)的用户数量和传输数据量的增加,空间信息在线服务系统面临着许多挑战:海量空间数据的网络传输导致系统的响应时间
随着科技的进步和发展,无线传感器网络正逐渐的应用到社会的各个行业和领域。无线传感器网络是一种不确定网络,在布署时其网络拓扑无法提前预测,节点随机分布在一定空间区域内,空
复杂网络已经渗透到了我们生活的各个方面和领域了。网络抗毁性是网络可靠性的一个静态指标,排除了网络固有属性的干扰,从网络拓扑结构角度对网络可靠性进行分析,是网络可靠性研
对数据聚类的研究有很长的历史,几十年来,其重要性以及与其他研究方向的交叉特性得到人们的肯定。然而,细胞自动机在数据聚类方面的研究却相对较少。本文研究了细胞自动机与蚁群
军事信息的安全保密是部队工作中的重要问题,采用以加密算法为核心的密码技术对信息加密是最常用、最有效的安全保护手段。在我们二炮部队,需要用先进的加密技术保护的信息和数
油田开发动态分析,在整个油田开发生产过程中,具有重要的地位。搞好这项工作是保证科学高效地开发油田,保持油田高产稳产,提高油田最终采收率的基础。由于油田开发动态分析工作本
转录因子结合位点是与转录因子结合的DNA片断,负责启动基因的转录过程和控制基因的转录效率。由于转录调控是基因表达调控的关键环节,因此转录因子结合位点的预测和识别对于生
将高动态范围的图像信息存储于360度全视角的全景图像成像技术中,即全景高动态范围图像成像技术,该技术的应用非常广泛,如基于图像渲染、摄影特效、游戏模拟等等。本文提出了
随着IP网络技术的发展和各类新型数据业务的出现,因特网在全球范围内得到迅速发展,同时,也对传送网提出了更高的要求。密集波分复用(DWDM:DenseWavelength Division Multiplexing)
现今社会,Internet发展迅速,作为新型的商务模式——电子商务吸引了越来越多的注意力,它是信息化社会的产物,与传统的商务模式相比,电子商务具有更加快速和便捷的优点,电子商务的发