基于密度调整和流形距离的近邻传播算法及其应用研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:CHENYF20000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着存储成本的降低,海量数据不断涌现,大型数据库越来越多,数据挖掘技术备受众多领域的关注。聚类技术作为数据挖掘的主要任务之一,在没有先验信息的情况下,从海量数据中挖掘出潜在的价值信息,为企业和政府决策提供了有效的依据。近邻传播聚类算法(Affinity Propagation,AP)作为无监督学习领域极具竞争力的聚类分析技术,已经被广泛应用到很多领域。尽管如此,AP算法还有许多不足之处,本文针对AP算法在构造相似度矩阵时对复杂结构数据敏感因而聚类效果不理想的缺陷,提出一种基于密度调整和流形距离的近邻传播算法。该算法将“领域密度”和“流形理论”的思想引入近邻传播算法,利用基于密度调整和流形的距离更好地刻画了样本空间的真实分布状况,解决了相似度矩阵不能充分表示数据之间内在关系的问题,在一定程度上提高了近邻传播聚类算法的聚类效果。本文通过在人工数据集和标准数据集上进行实验对比,验证了算法的有效性和优越性。除此之外,本文构建了一个农业干旱等级评价模型,将改进后的近邻传播算法结合半监督学习思想构建一个分类模型。在对研究对象进行分析后选择9个农业干旱等级评价指标,选择皖北地区农业干旱数据作为样本,通过与BP神经网络模型对比证明了本文模型在一定程度上提高了农业干旱等级评价的准确率。
其他文献
天津电视台是从1958年10月开始建设的,在中共河北省委和天津市委的正确领导和亲切关怀下,从1959年7月1日到1960年2月底止,进行了八个月的试验性广播。由于认真贯彻了“两条
中共广东省委第一书记陶铸同志,一九五九年在南方日报创刊十周年庆祝大会上,向广州市各新闻单位的业务干部讲了话。现将陶铸同志的讲话整理发表。 Comrade Tao Zhu, the fir
技术创新是企业可持续发展的源泉,是企业的核心战略之一,但是中国企业仍无法走出“技术同质、产品功能与外形雷同”、“低技术含量、低价格、低附加值”的困境,真正实现从国
我来谈谈我们的群众工作问题。我们报纸的群众工作,过去形式主义比较严重,往往在开劳模会或其他什么会的时候发展一批通讯员,然后由编辑部写信、寄通讯刊物去联系,很多人没
东北和华北各省、自治区人民广播电台的代表,从八月十三号到二十号在哈尔滨举行协作会議,研究了改进广播文風的問题,交流了各台的国庆报道計划。中央台也派代表参加了会議。
在这个沸腾的时代,作为一个新闻工作者是幸福的。每日每时,反映人民群众在党的领导下战胜各种困难继续跃进的稿件祖国的四面八方涌向编辑部。看吧! 从南到北亿万人民战夏收,
西德报业是在美、英占领军当局直接扶持下发展的。现在,西德约有一千五百种报纸,发行总数为一千八百万份左右;八千多种杂志,发行总数约为七千万份。垄断趋势日益加剧随着垄
毛主席告诉我们:“精心写作社论是一项极重要任务”。一年来,在区党委的领导下,我们在这方面取得了一些成绩。但是由于我们主观努力不够,多数社论的写作不够精心,还需要鼓足
Web技术的快速发展使越来越多的Web应用成为我们生活的一部分,Web应用包括网上社区、网上商店、网上银行等,由于跨站点脚本(XSS)、SQL注入、跨站请求伪造(CSRF)等各种Web安全
不久前,苏联国家政治书籍出版局出版了“列宁论报刊”一书,书中收入了列宁著作三百○九篇(包括全文和摘要)。这些文章论述了报刊工作的各种问题和报刊工作的各个方面,包括了