参数可调的自扩展聚类算法及其应用

来源 :哈尔滨工业大学学报 | 被引量 : 0次 | 上传用户:scottwong522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大规模样本聚类的时间复杂度过高和聚类结果对经验参数设置的依赖性过强的问题,提出一种基于密度网格可变参数的自扩展聚类算法.算法将数据空间分割成相同大小的网格单元,再将样本归一化后映射到相应的网格单元中,然后从指定密度较大的网格单元向周围扩展,直到其平均密度达到指定的下限或可扩展的聚类边界为止.聚类过程中,通过下限密度和均值密度限制聚类间的过度扩展,如果有效样本的比率低于阈值,则自适应调整扩展密度并重新聚类.仿真试验表明,本算法可以以较小的时间代价获得较高的聚类精度和有效样本率.
其他文献
近十年来,我国铁路建设速度保持高速,铁路运营总里程数从2005年的7.54万公里增长到2016年的12.4万公里,平均每年增长约4,418公里;其中,电气化铁路营业里程从2005年的约2万公
图像关联规则挖掘是图像挖掘中重要研究课题。为了克服传统算法找到的关联规则数目太多,用户无法对其进行分析;种群进化陷入停滞不前,造成局部收敛等问题,引入了兴趣度这个阈
为了既避免数据稀疏又充分考虑相邻词性的关系和每种短语的内部组成规律,提出了改进K-均值聚类方法.此方法把每个短语看成是以中心词为核心的聚簇,充分考虑每种短语的内部组成规律;依据语料库中的数据来确定每个类的初始中心,使有指导的统计方法和无指导的聚类方法有机结合,既提高了聚类的准确率,又避免了因汉语语块库规模较小而导致的数据稀疏现象.应用改进K-均值聚类方法对7种汉语语块进行识别,F值达到了92.94
作为一种现代企业管理的思想和方法,ERP旨在提高企业管理水平和生产力水平.其在企业财务层面上的应用较在其他层面上的应用更为广泛、成熟,同时对企业经营生产、投资决策都起着
中低轨道卫星星间链路天线稳定并快速地指向中继卫星对于建立星间通信链路是非常重要的.本文采用一种轨迹预处理器规划天线的指向.分析了捕获时间的选取范围,并推导了部分公式.为
金融危机使煤炭企业同样面临着严峻的考验。面对危机,煤炭企业要想提高市场竞争力,保持和扩大市场占有率,在市场竞争中求得生存、力争发展,就必须紧跟市场变化,抓住自身的关键
打造以“八纵”和“八横”通道为主干、城际铁路为补充的高速铁路网,实现相邻大中城市间1至4小时交通圈、城市群内0.5至2小时交通圈。中国全面开启铁路经济时代。6月29日,李克强
结合SPJ900架桥机在实际工作中的使用情况,发现该机型在转运过程中存在一定的不安全因素和效率低下等问题.由此构想了一种在中车加装吊耳的方式进行改进设计,以达到提升安全
随着国家水利基础设施建设不断推进,与河道相互交叉的既有铁路桥梁结构难以满足拓浚需要。如何在确保铁路行车安全的前提下降低行车干扰、减轻防汛压力、控制工程投资,对营业
在8月24日举行的2017年中国民营经济发展峰会上,山东省委常委、常务副省长李群透露,2018年中国第一台能够进入商用的高速磁悬浮列车将在山东下线,2019年5公里试验线、2020年3