基于模糊相似度的RPCL文本聚类算法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:sy_haiboo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类过程中,存在着文本数据空间维数巨大,聚类的数目不能直接确定等问题。为此,有专家学者提出了次胜者受罚的竞争学习(Rival Penalized Competitive Learning)算法,简称RPCL算法。该算法在一定程度上,解决了聚类的数目的确定问题。但是,该算法只适合做低维数据的聚类,对于高维数据聚类效果极差。该文提出了一种改进的RPCL算法,该方法不再采用欧氏距离去计算相似度,而是采用模糊相似度的方法,通过实验表明,改进的RPCL算法在聚类效果上好于经典的RPCL算法。
其他文献
电力大数据的支撑能够确保电网理论线损数据的及时性、准确性和完整性,可以体现出线损管理中的诸多问题,反映电网结构 的真实水平,对于提高配网运行的安全性和可靠性具有非常
卫医发[2000]233号各省、自治区、直辖市、计划单列市、新疆生产建设兵团卫生厅(局)、中医(药)管理局、财政厅(局)、计委(计经委):卫生部、国家中医药管理局、财政部、国家计
通过实地调查和实验研究,文章证实粤东龙川县龙母镇大塘村的客家方言具有7个单字调,其中阳上来自古全浊声母上声字和次浊声母上声字的白读层。古浊声母上声字独立为阳上调表现
中国社会的全面发展和民法文化的逐渐生成孕育了对民法典的强烈需求。民法典为市民社会抵抗公权力不当侵入提供有力的武器。中国民法典当在坚持私主体权利本位的前提下。虑及
优化槟榔SSR-PCR反应体系,筛选适用于槟榔的SSR引物。以槟榔(Areca catechu L.)叶片DNA为模板,利用正交设计方法对槟榔SSR反应体系中的Mg2+、TaqDNA聚合酶、dNTPs和引物等4种因
企业在开展建设项目时,常常会选择招投标的形式来选择建设单位,但目前的投标工作中存在很多问题,严重影响了投标工作的公平性。基于此,文章阐述了企业建设项目投标过程控制与
随着电子科学技术的发展和人们生活水平的日益提高,锂离子电池越来越多地出现在各种移动设备和电动汽车上。锂离子电池经常由于过充、过放而发生爆炸,因此电池管理系统(BMS)显
本文对风电机组刚性塔架振动故障进行诊断和治理,基于刚性塔架风电机组的塔架动力学模型,确定了刚性塔架共振判定条件,分析了机组刚性塔架因阵风引起转速超调导致塔架共振的
随着我国经济水平的不断发展,城市基础设施的建设从"有没有"向"好不好"逐渐转变。城市街道的设计也不再一味强调其交通属性,而是越来越重视人的需求。其中,城市综合性街道功
随着我国经济快速的发展,在用电量增长的过程中,窃电情况越来越严重,部分的不法分子为了能够降低电费的使用,从而对 电能进行窃取,导致供电企业的经济效益出现损失。因此本文