基于遗传算法等技术的数据与文本聚分类研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:han8349
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的遗传算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题。所做主要工作内容包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法。该方法既可以很好地解决局部最优的问题,也可以很好地解决孤立点的问题,同时用于和k-medoids算法相结合,可以加快遗传算法的收敛速度,节约了时间成本。采用遗传算法和模式聚合进行文本特征降维。模式聚合可以有效降低文本特征的维数,使得特征从几千维降为几百维,在此基础上采用遗传算法继续降维。采用遗传算法和潜在语义索引进行文本特征降维。潜在语义索引通过奇异值分解可以有效地降低向量空间的维数。在此基础上采用遗传算法继续降维。采用社会演化算法进行聚类。K均值聚类算法通常只能以局部最优结束,很难找到全局最优。本文提出一种基于社会演化算法和K均值算法相结合的聚类新方法。在该方法中提出了认知主体在聚类中对范式学习的新的方式。采用混沌社会演化算法进行聚类。在认知主体对范式的背叛中采用混沌变异算子。实验证明该方法不但能提高聚类的效率而且能提高聚类的精度。
其他文献
<正>当前,构建清洁低碳、安全高效的新一代能源系统,以实现最大限度地开发利用可再生能源、最高程度地提高能源利用效率,已成为我国能源转型与革命的核心战略目标。0引言随着
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
利用天峨1971-2013年逐日降水量资料,利用线性趋势和Mann-Kendall突变检验等方法,对天峨不同等级降水量和降水日数的变化特征进行分析。结果表明:年降水量和降水日数均呈减少
什么是学习兴趣?心理学认为,学习兴趣是指人们以学习需要为基础的求知识、探究某事物的心理倾向,是个体活动的内在动力,它能使个体对学习活动保持注意,并带有积极的情绪色彩,它可看
目的探讨改良B-Lynch缝合术联合阴道填纱治疗剖宫产产后出血的疗效。方法选取我院(2013年2月至2018年5月)收治的60例剖宫产产后出血患者为本研究对象,将所有患者根据治疗方法
保险代理人诚信缺失,会降低社会对保险代理人整体的评价,还会损害保险公司形象,危害保险业的发展。本文分析了保险代理人诚信缺失的原因,并提出了相应的治理措施。
理性情绪疗法(RET)是一种认知行为疗法,这种治疗方法非常适合具有一定知识基础的人群,因此在学校中具有广阔的应用前景。文章对理性情绪疗法的理论基础、基本理论、主要技术等
会议
本文简述了磁悬浮列车的技术、优缺点等,展望了磁悬浮列车在未来的应用。 In this paper, the technology, advantages and disadvantages of maglev train are briefly int
  急性毒鼠强中毒主要引起中枢神经系统兴奋性增强,表现为四肢抽搐、惊厥,甚至呼吸衰竭。我们测定了患者的血清肌酸激酶和乳酸脱氢酶,探讨其变化规律与抽搐严重程度的相关