基于混合并行遗传算法的文本聚类研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sqs292241644
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统K—Means聚类算法对初始聚类中心的选择敏感,易陷入局部最优解的问题,提出一种基于混合并行遗传算法的文本聚类方法。该方法首先将文档集合表示成向量空间模型,并在文档向量中随机选择初始聚类中心形成染色体,然后结合K—Means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现。实验表明该算法相对于K—Means算法、简单遗传算法等文本聚类方法具有更高的精确度和全局寻优能力。
其他文献
<正>1.CS-5.1的市场效应 CS-5.1是香港威龙科技有限公司拥有自主产权的全新多声道编解码系统,CS-5.1是他们多年研究的最新成果,于去年9月推出。目前,国内著名品牌厦新的首部
概念之间的依存分析是提高信息检索性能的关键。相比概念关系的强弱而言,识别关系的类型更有意义。本文在Bootstrapping框架下,以"(地理)领属"。"(实体)功能"和"(动作)对象"三种语义关系类型为例,获得了构建上下文中两个概念特定关系的话义模扳,并开发了一个名为SPG的系统。本文的工作:(1)引入了生物信息计算中序列比对的方法两两生成相似上下文的模扳;(2)定义了新的模板评价机制估计模板的
<正>自1936年第一台电视机面世以来,电视已经越来越深入地影响整个世界的生活,几乎不能想象现代生活如果没有电视机会是什么样子。而电视机制造技术发展到了今天,品类之多,更
系统级芯片的成功研制,不仅提高了整机的可靠性,还为电子制造业展现出一个美好的未来。
<正>当今全球科技界,芯片研究和开发应用是最活跃的一个领域.世界各大电子公司和电脑制造商目前都围绕着这一领域展开了激烈的竞争.随着这种竞争的日益加剧,使得芯片的开发和
本文提出了一种基于分解转移矩阵的PageRank的迭代计算方法。该方法对PageRank理论模型进一步推导,把其Markov状态转移矩阵进行了分解,从而降低存储开销和计算复杂度,减少I/O需求
大学日语专业就是一个在线教育十分重视的专业,还是培养出更多人才的基地,教师应更为良好地将互联网融合至大学日语各项教学的改革中,改良教学方式,促进课程设置更为优化,以
<正>一、ITS—90国际温标与铂电阻测温 温度是国际单位制七个基本的物理量之一,在物理学单位中占有重要的地位。由于许多物质的特征参数与温度有密切的关系,因而温度测量在工
<正>随着计算机产业国际化配套格局的形成,发达国家产品结构进行调整,给中国发展外设工业带来了机遇.1998年度全国百家最大规模电子三资企业中有30家生产计算机外设或相关产
早产合并胎膜早破(PPROM)的围生儿病生率和病死率相当高,积极恰当治疗是减少围生儿死亡的关键,现就我院1997年到2000年早产并胎膜早破152例诊治情况报告如下.