基于全覆盖粒计算的K-medoids文本聚类算法

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:shi_bc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统K-medoids聚类算法随机选取初始聚类中心,存在迭代次数增加、聚类结果波动较大的问题,因此提出基于全覆盖粒计算的K-medoids文本聚类算法。该算法定义了全覆盖平均粒度重要性的概念。首先对文本进行Single-Pass粗聚类,利用全覆盖粒度重要性和平均粒度重要性从粗聚类结果中产生初始聚类中心候选集,再基于密度和最大最小距离法则从候选集中选出初始聚类中心。通过实验验证,该算法的聚类迭代次数明显减小,聚类质量明显提高。
其他文献
据报道,英国上议院已正式批准修改《王位继承法》,按照新法律,威廉王子和凯特在7月出生的孩子,无论男女都将是英国王位第三顺位继承人。尽管这个幸运的孩子,在出生前就确定了高贵
具备自主运动能力的肠道机器人内窥镜是肠道疾病诊疗设备的发展方向,文中研究一种扩张-伸缩式机器人内窥镜在肠道中的运动效率并提出提高运动效率的方法。计算了扩张-伸缩式
为了提高高校教学管理评估的有效性与智能性,将粒子群优化BP神经网络算法运用于高校教学管理评估数据的分析。采用BP神经网络对教学管理评估指标进行建模,然后采用粒子群对神
中国的北斗正在变为世界的北斗,截至目前全球已有120余个国家和地区使用北斗系统,与北斗系统全球应用相伴而来的是北斗导航数据保护难题。北斗卫星导航数据使用主体的复杂性
思想政治工作贯穿教育教学全过程,立德树人是中心环节。根据免疫学专业课程特点,将课程思政融入免疫学教学是一种两者相得益彰的教学方式。本文总结了课程思政与免疫学教学融
为优化以竹茹(Bamboo shavings)、陈皮、茯苓(Poria cocos)、白茅根、干姜为原料制成的复方竹茹植物固体饮料的处方,以颗粒成型率、水分、休止角等为评价指标,通过单因素试验
直升机的机械扭振系统由发动机、减速器、传动轴、旋翼和尾桨等结构组成。常规直升机使用涡轮轴发动机驱动时,该机械扭振系统又会与发动机燃油调节系统相互耦合,形成一个闭环
自2015年国内商业航天拉开大幕以来,航天领域涌现出大量新的商业模式,其中商业卫星冠名以名头响、受众广、传播快受到了地方政府、科研院所、商业机构的青睐,国内出现了一批
11月23-25日,第十一届中国卫星导航年会在成都召开。本届年会由中国卫星导航系统管理办公室学术交流中心主办。这是北斗三号全球卫星导航系统建成开通后,我国首次举办的大型
设计了一种带固相萃取功能的索氏提取装置,并采用该装置提取分析紫苏(Perilla frutescens)挥发性成分。结果表明,紫苏中鉴定出75种挥发性组分,用气相色谱峰面积归一法确定其