基于密度峰值的自适应多粒度聚类模型

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:cloudwing5237
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中复杂的任务往往存在固有的层次结构。研究如何用计算机模拟人脑对知识的层次处理模型是人工智能发展的重要内在逻辑。其关键问题在于研究信息粒的表示和生成策略,粒度的拓扑结构和不同粒层间信息粒之间的联系。以密度峰值聚类(DPC)算法为研究的突破点是基于其具有的三个重要特征:一是其方法新颖,简洁明快,符合人脑对知识归纳整理的直观性特点,即不需要复杂的处理机制;二是通过算法中的决策图天然的蕴含着粒度中心,容易在信息粒的生成机制上,通过层次聚类方法把具有相似特征的知识归为一类;三是数值化的知识在空间分布形式上具有不确性,而DPC在策略上属于密度聚类,其归纳结果取决于知识关联程度,不受分布形式的影响。鉴于此,研究基于DPC的多粒度知识表示和演化模型对于建立大数据复杂任务的双向认知机制具有重要意义。本文以DPC为基点,研究一种多粒度的知识发现模型,在算法和机制层面做了如下工作:1.在由粗到细,由顶向下的多粒度分解机制上,提出了一种基于DPC的多粒度树形结构(GT),结合人的先验知识,利用决策图将数据集分成由粗到细独立的子集形成不同大小的信息粒,建立了粒层之间的集合归属关系,通过排列组合,可以根据问题的需要选取合适的粒度求解结果。算法最终将DPC从原始的平面聚类投射到多粒度空间上,形成了一种知识的多粒度认知模型。2.进行了DPC的鲁棒性研究,主要包括决策图的局限性研究,归纳了决策图失效的情景。并在此基础上,提出了一种粒度合并策略。在自适应融合参数上,提出了基于数据驱动的自适应合并阈值并给出其理论依据,该方法能在粒度融合中根据迭代层次自动地更新合并阈值,一改传统上阈值需要人为干预的情况。3.研究依据步长迭代的多粒度模型和寻优,探索了基于研究点2的多粒度模型“三重”生成机制,并根据聚类结果出现的频度选取最适合数据集的粒度层次对聚类结果进行优化。
其他文献
目前,华北平原农业可持续发展受到水资源短缺和水质恶化的限制。然而,就在水资源极度紧缺的情况下,丰富的地下浅层咸水资源仍然未被合理开发利用,主要是由于咸水灌溉抑制作物
在互联网的推动下,数据资源每天以指数形式增长,为了帮助用户找到想要的信息,降低信息过载,推荐算法应运而生。协同过滤算法是推荐算法中应用比较成功的一个,无论在理论上还
社交网络是以用户为核心,用户间关系为纽带,虚拟再现用户真实人际关系的网络。借助互联网,社交网络把不同地域和不同种族的人联系起来,并为其提供集交流互动和信息分享等功能
LEMP(雷电电磁脉冲)和 NEMP(核电电磁脉冲)对各类电力的电子系统构成了严重的潜在危害。本文中介绍 LEMP 和 NEMP 的特点,设计了置于全光介质移动通信系统前端,在通带内具有
Web2.0时代,社交网络不仅影响了人们的生活方式,也影响着人们工作的方式。在众多社交网络的类型中,企业社交网络在增强员工的沟通和交流、促进企业信息的流通、优化企业的管
RFID(射频识别)技术已经被广泛地应用到物流、交通、医疗等诸多领域。由于RFID识别过程是非接触式的,导致该过程中的信息易被泄露,从而使得RFID应用也容易受到假冒标签和标签
2020年及未来,用户日益增长的多样化业务需求推动着移动通信新技术的发展,蜂窝组网的特点日渐趋向于超密集、高速率、高容量和分层异构化。大规模多天线(Massive MIMO)技术能
由于具有来源广泛、可再生性好、污染少等优势,以木质纤维素为原料生产燃料乙醇日益受到广泛关注,但木质纤维素预处理过程中产生的毒性副产物对发酵微生物的抑制作用是阻碍纤
随着计算机及其相关技术的飞速发展,基于视频图像序列的智能监控系统在军事、交通以及安防等多个领域都得到了广泛的应用,对运动目标进行准确检测已成为当前智能视频监控领域
重庆南川区山王坪喀斯特生态公园拥有独特的喀斯特地质地貌、良好的生态环境、多样的生物资源、优美的自然景观,为了保护、发展以及提高山王坪喀斯特生态公园的质量,为公园自