中文文本分类器的设计与实现

来源 :SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会) | 被引量 : 0次 | 上传用户：qq_13439718

【摘要】

：

　　为了能在海量的文本中及时准确地获取有效的知识和信息，本文对多类别分类方法进行了研究，设计并实现了一个中文文本分类器。该分类器主要包括预处理模块、特征处理模块、文

【作者】

：

许婷婷赵永斌

【机构】

：

石家庄铁道大学信息科学与技术学院,河北石家庄市050043

【出处】

：

SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)

【发表日期】

：

2014年期

【关键词】

：

中文文本分类器训练过程文本表示预处理模块测试过程知识和信息分类准确率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　为了能在海量的文本中及时准确地获取有效的知识和信息，本文对多类别分类方法进行了研究，设计并实现了一个中文文本分类器。该分类器主要包括预处理模块、特征处理模块、文本表示模块和分类器模块。重点研究了特征提取部分和文本表示部分。分类器包括训练过程和测试过程。在训练过程中，采用了计算机、艺术、教育、交通、环境、经济、医药、军事、政治、体育等10个类别的近千篇文本进行训练，为了测试分类器的性能，选用了不同类别的上百篇文本进行测试，实验结果表明该分类器的分类准确率在90％左右，分类效果较为理想。

其他文献

真空预压加固机理及工程应用研究

随着改革开放的不断深入，国民经济的飞速发展特别是沿海地区的开发和港口建设发展，土地资源日益紧张，海上人工岛和围海造陆建设项日越来越多，在节约成本、缩短工期方面吹填造陆比

学位

预压加固港口建设地基处理吹填造陆排水固结法

基于ARM11的加湿器远程控制

　　加湿器可以对储物室、办公室、卧室的湿度进行控制，可以随时知道当前房间内的湿度情况，对一些意外情况有了很好的预防和控制作用。个人使用时，可以根据自己的需求进行设置，提

会议

加湿器主控模块湿度模块控制人机交互性意外情况需求生活质量

基于GSM网络的仓库火灾报警和自救系统

　　以S3C 6410为核心作为控制模块，通过烟雾探测器来实时监测仓库内的烟雾状况，当监测到烟雾浓度达到一定阈值时，系统能同时实现如下三个功能：系统自动控制蜂鸣报警器报警；自动启

会议

GSM网络仓库火灾报警自救烟雾探测器系统GSM无线网络自动控制

人脸识别考勤系统

　　通过研究人脸识别，设计出一套用于考勤的系统。基于人脸识别的考勤系统中最主要的就是人脸识别；首先自动从USB摄像头获取YUV格式的图片，转换成QImage格式并实时显示在LCD屏

会议

人脸识别矩形区域格式均衡化处理USB摄像头转换行直方图考勤系统

基于RFID技术的超市管理系统

　　随着小超市规模的发展不断扩大，商品数量急剧增加，有关商品的各种信息量也成倍增长。超市时时刻刻都需要对商品各种信息进行统计分析。以方便管理超市的每一个环节，所以超市

会议

基于语音识别的跳舞机器人的研究与开发

　　在凌阳单片机SPCE061A的基础上，以轮式机器人为对象，开发了一个具有交互性能的语音识别机器人.该机器人具备5个电机，其中两个用于走路，一个用于头部转向，以及加速电机与发射电

会议

语音识别跳舞机器人SPCE061A驱动电机发射凌阳单片机轮式机器人基础

大库盘水库自压式管道冲淤排沙研究

水库的淤积问题,是全球性的问题。水库的淤积不仅会造成水库本身安全问题、降低水库的利用效益,而且对下游的人民生命财产安全带来极大的威胁。因此,对水库淤积的有关问题进

学位

自压式管道排沙系统经济流速水位差克孜尔水库大库盘水库

环鄱阳湖流域浅层地下水水文地球化学特征研究

浅层地下水水化学和地球化学特征可以反映岩石风化剥蚀作用强弱，土壤作为风化作用的产物，其对地下水化学组分有着重大影响，水体的化学组分很大程度上表征了所在水环境质量状况、

学位

湖泊流域浅层地下水水文地球化学水环境质量水体元素

山西坪上泉水资源量评价及基于SVM理论的泉流量预测模型研究

坪上应急引水工程是山西六大水利工程之组成部分，是山西兴水战略的重要组成部分。坪上泉岩溶水是坪上应急水工程的引水水源。由于该项目的供水目标为忻府、定襄和原平，保证率要

学位

山西坪上泉水资源量评价SVM理论泉流量预测应急引水工程水文地质

基于神经网络的城市大气污染评估模型的研究

中国城市化和工业化的快速发展和能源消耗的迅速增加,给中国的城市带来了严重的大气污染问题.城市空气污染物主要包括总悬浮细颗粒物(PM2.5)、酸雨、NO化合物.为了及时了解空

会议

大气污染评估模型神经网络功能模块

中文文本分类器的设计与实现

与本文相关的学术论文