基于演化超网络的中文文本分类方法

来源 :江苏大学学报(自然科学版) | 被引量 : 0次 | 上传用户:vito23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高中文文本的分类效果,提出了一种基于演化超网络的中文文本分类方法.采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词,保留文本中的名词、动词和形容词作为特征;以χ2统计方法进行特征选择;利用布尔权重计算特征权值.经处理后的特征向量作为系统的训练集和测试集数据.运用超边替代策略训练超网络分类模型,并实现对测试集特征向量的分类.对不同阶数设定下的演化超网络模型进行了性能分析,并将其与传统的KNN和SVM算法进行了比较.结果表明,本方法对复旦大学语料和搜狐语料可获得87.2%和72.5%的宏识别率、86.9%和70.5%的宏召回率、87.0%和71.5%的宏F1,接近或优于KNN和SVM分类方法.所提出的方法是一种有效的中文文本分类手段.
其他文献
<正> 汉代名医张仲景,在伤寒杂病论序中讲到“勤求古训,博采众方”。真是一句千古名言,值得三思。我们祖国医学历史悠久,早在黄帝内经就奠定了祖国医学的理论基础,长期以来指
近期,城镇化成为各方关注的焦点,城镇化是农村人口向城镇集聚的过程,2012年中央经济工作会议明确提出,城镇化是扩大内需的最大潜力所在。工业化与城镇化紧密相关,是一个国家
<正>实验教学是培养学生探究能力的重要手段。实验不仅对激发学生的学习兴趣,提高其实践能力具有不可替代的作用,而且也是为学生创设探究氛围,培养探究意识、探究思维、探究
德育是小学语文教学的重要部分。二者相辅相成。随着新课改的深入,在小学语文教学中,我们应该注重加强德育创新的探索和实践,实现德育工作与语文教学改革协同发展。对此,本文
<正>数学是属于抽象,概括和理性的学科,数学知识是枯燥无味的,干巴巴的讲解,繁琐的计算对于生性活泼,想象丰富,活跃好动的小学生来说,难免感觉沉闷乏味,死板单调,久而久之,就
西部大开发是党中央提出来的一项重要战略任务 ,对于缩小东西部差距 ,调整产业结构 ,实现社会稳定具有重要意义。加快西部开发要从本地实际出发 ,扬长补短 ,采取有效可行的对
<正> 张仲景(约公元150~219年),名机,南郡涅阳(今河南南阳)人,是后汉时期受法家思想影响,在古代医学上曾经有过卓越贡献的医学家。两汉以来,以董仲舒为代表的儒家唯心主义和以
<正>作为一个最具个性的作家,海明威把自己的思想观念、复杂经历都融入了创作中。每一时期的创作都伴随他人生观的转变而变化,这种转变在他的小说中有着更为直接的体现。《永
我国经过近多年的宏观调控,目前房地产业整体过热的态势得到一定抑制,但自2013年2月20日推出国务院常务会议确定的五项加强房地产市场调控的政策措施即"国五条"后,多个一线城
本文研究了北京、上海、广州和深圳的房地产市场间的均值溢出效应和波动溢出效应。通过分析得出:第一,北京和广州、上海和广州房地产市场间存在显著的双向均值溢出效应;上海