基于密度和最近邻的K-means文本聚类算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:hy1208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
初始中心点的选择对于传统的K-means算法聚类结果影响较大,容易使聚类陷入局部最优解。针对这个问题,引入密度和最近邻思想,提出了生成初始聚类中心的算法Initial。将所选聚类中心用于K-means算法,得到了更好的应用于文本聚类的DN-K-means算法。实验结果表明,该算法可以生成聚类质量较高并且稳定性较好的结果。
其他文献
随着开放获取出版与在线科研的兴起,科学知识的传播呈现网络化趋势,基于文献引证关系的文献计量学方法已不能客观反映科学交流的现状,替代计量学方法因补充学术社交媒体等网
随着珠宝行业在中国的发展,珠宝教育应运而生。本文从珠宝人才培养现状进行分析,结合珠宝企业对人才的要求,以重庆师范大学珠宝首饰设计专业的校企合作培养应用型人才的模式
新世纪以来,随着作家问题意识的觉醒,长篇小说文体实验和文体形态异彩纷呈,文体创新成为长篇小说评价的重要标准。《新世纪长篇小说文体研究》对长篇小说文体意识形态性与本
采用铁盐催化比色法、硫酸—香草醛法、盐酸—香草醛法和直接紫外分光光度法对13个品种葡萄枝蔓中原花色素含量进行分析,直接紫外分光光度法选取不同原花色素对照品对测定结
对近些年合成1,2-环己二醇的工艺进行了阐述,尤其对合成工艺路线所用催化体系和存在的优缺点进行分析阐述。指出在环境问题日益突出的形势下,开发高效绿色1,2-环己二醇生产工
针对我国高速铁路客运专线运输网络受到站点攻击时边权值对网络鲁棒性的影响,依据复杂网络理论,利用Pajek软件建立了高速铁路客运专线无向加权运输网络模型,利用Matlab分析了
<正>四肢创伤伴有周围神经损伤的比较多见,神经损伤后可引起肢体运动、感觉障碍和营养改变。祖国医学历来重视"筋骨并重",不但重视骨折的整复、固定和功能锻炼,而且十分重视
南京某地犬场爆发一起尿石症,其发病率为34.44%(62/180),致死率为45.16%(28/62),且发病持续时间较长。B超探查病犬肾脏和膀胱内出现点状或团块状强回声,表明有晶体存在;组织
文章旨在以电影业为突破口,深入解剖运作模式,揭示实质风险点,最终将信贷管理融入产业链条,通过信贷支持电影行业繁荣发展,并希望对发展其他文化创意行业发挥借鉴意义。
《艺文志》是将我国历代史书﹑政书﹑方志等图书典籍分类汇编而成的目录,被喻为"学问之眉目,著述之门户"。本文选取《湖湘文库》中收录的清同治《湘乡县志·艺文志》和《续修四库