中文文本分类器的设计与实现

来源 :SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会) | 被引量 : 0次 | 上传用户:qq_13439718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  为了能在海量的文本中及时准确地获取有效的知识和信息,本文对多类别分类方法进行了研究,设计并实现了一个中文文本分类器。该分类器主要包括预处理模块、特征处理模块、文本表示模块和分类器模块。重点研究了特征提取部分和文本表示部分。分类器包括训练过程和测试过程。在训练过程中,采用了计算机、艺术、教育、交通、环境、经济、医药、军事、政治、体育等10个类别的近千篇文本进行训练,为了测试分类器的性能,选用了不同类别的上百篇文本进行测试,实验结果表明该分类器的分类准确率在90%左右,分类效果较为理想。
其他文献
随着改革开放的不断深入,国民经济的飞速发展特别是沿海地区的开发和港口建设发展,土地资源日益紧张,海上人工岛和围海造陆建设项日越来越多,在节约成本、缩短工期方面吹填造陆比
  加湿器可以对储物室、办公室、卧室的湿度进行控制,可以随时知道当前房间内的湿度情况,对一些意外情况有了很好的预防和控制作用。个人使用时,可以根据自己的需求进行设置,提
  以S3C 6410为核心作为控制模块,通过烟雾探测器来实时监测仓库内的烟雾状况,当监测到烟雾浓度达到一定阈值时,系统能同时实现如下三个功能:系统自动控制蜂鸣报警器报警;自动启
  通过研究人脸识别,设计出一套用于考勤的系统。基于人脸识别的考勤系统中最主要的就是人脸识别;首先自动从USB摄像头获取YUV格式的图片,转换成QImage格式并实时显示在LCD屏
  随着小超市规模的发展不断扩大,商品数量急剧增加,有关商品的各种信息量也成倍增长。超市时时刻刻都需要对商品各种信息进行统计分析。以方便管理超市的每一个环节,所以超市
会议
  在凌阳单片机SPCE061A的基础上,以轮式机器人为对象,开发了一个具有交互性能的语音识别机器人.该机器人具备5个电机,其中两个用于走路,一个用于头部转向,以及加速电机与发射电
水库的淤积问题,是全球性的问题。水库的淤积不仅会造成水库本身安全问题、降低水库的利用效益,而且对下游的人民生命财产安全带来极大的威胁。因此,对水库淤积的有关问题进
浅层地下水水化学和地球化学特征可以反映岩石风化剥蚀作用强弱,土壤作为风化作用的产物,其对地下水化学组分有着重大影响,水体的化学组分很大程度上表征了所在水环境质量状况、
坪上应急引水工程是山西六大水利工程之组成部分,是山西兴水战略的重要组成部分。坪上泉岩溶水是坪上应急水工程的引水水源。由于该项目的供水目标为忻府、定襄和原平,保证率要
中国城市化和工业化的快速发展和能源消耗的迅速增加,给中国的城市带来了严重的大气污染问题.城市空气污染物主要包括总悬浮细颗粒物(PM2.5)、酸雨、NO化合物.为了及时了解空