使用“分裂-合并”策略改进文本聚类集成算法的研究

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:liongliong581
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探讨了“分裂-合并”(DM)策略对文本聚类集成算法改进的效果。首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随后在聚类集成阶段采用两个快速的谱聚类算法进行集成。在6组真实文本集上进行了实验,使用DM策略的两个聚类集成算法获得的平均标准化互信息(NMI)分别比改进前的算法提高了4.6和7.9个百分点,证明了DM策略可以有效提高文本聚类集成算法的聚类质量。
其他文献
近几年来,多数学校在研究如何提高学生自主学习能力,突出教学特色。在此背景下,“六模块建构式”教学模式应运而生。所谓“六模块建构式”是指教师应根据学生心理、实际学情以及新课程标准,灵活运用自学质疑、交流展示、互动探究、精讲点拨、矫正反馈及迁移运用六大模块,旨在促进学生自主学习,实现师生、生生互动,构建数学能力与情感共同发展的高效课堂。本文以苏教版小学五年级上册“平行四边形面积计算”为例,探讨“六模块
在当前的小学语文教学中,如何体现学生主体地位成为了教学成效提升的重要影响因素。进入高年级以后,学生的学习参与意识、独立学习能力都有了较快发展。在这样的背景下,教师应当对教学活动进行有效的改进,使学生能够更加全面参与其中,自主开展学习探究,全面提高语文学习能力。本文主要针对当前小学高年级语文教学现状进行简要分析,并针对如何发挥自主模式作用开展探究。  一、当前小学高年级语文教学现状分析  在教学改革
结合经济管理学院的发展历程和教学改革的成就,总结了经济管理学院发展的经验和存在的问题,就目前"由一建二"的形势,展望了河北农业大学经济、管理学科的发展前景,并就面临的
流通业发展效率的高低是衡量一个地区流通业发展水平的重要标准。本文将超效率DEA模型引入到流通业发展效率测度当中,结合河南省18个地市的相关数据,对各地市流通业发展效率进
职业学生的学习能力存在很大的问题,职业学生的英语大多都比较差,英语口语能力就更是有待提高。
鉴于当前流分类研究均建立在使用载荷无关的流特征的基础上,而载荷无关的特征一般无法为准确分类提供充足的分类信息的问题,提出了一种基于扩充特征集的流分类方法,该方法首先提
基于状态观测器研究了具有测量数据丢失的多输入多输出(MIMO)线性离散系统的量化H∞动态输出反馈控制问题。每路输出采用一个独立的静态对数量化器,采用扇形界方法来描述量化误
近年来,吉林省金融行业不断加大创新力度,金融资源配置能力不断增强,但由于资本市场发育不完善、经济基础相对薄弱等原因,吉林省直接融资比重仍处在较低水平,在一定程度上制