基于词频的中文文本分类研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:lion20003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果。
其他文献
《建筑材料工业“十二五”发展指导意见》指出,要大力发展以石墨、高岭土、膨润土、滑石、硅灰石、石英、萤石、珍珠岩等为重点的非金属矿物材料深加工产品。这些产品除满足国
在回顾人工智能、智能控制与智能机器人(artificial intelligence,intelligent control and intelligent robotics,A3I)发展历程的基础上,介绍了人工智能的诞生和发展进程、
贵阳中化开磷化肥有限公司20万t/a重钙项目日前联动试车成功,标志着开磷又一新项目即将建成投产。该项目是公司重点建设项目之一,总投资为1.2亿元,位于息烽县小寨坝镇贵阳中化开磷
由中蓝连海设计研究院承担的瓮福中低品位磷矿综合利用项目——马场坪磷精矿脱水与装车系统脱水主装置,于2012年12月31日投料试车一次成功。马场坪脱水主装置部分于7月28日开
磷化工上游龙头之一的兴发集团上半年业绩同比下降30%-50%。这是该公司近一两年来业绩首次出现下滑。结合目前磷化工和磷肥行业景气度持续未改善的现状,市场分析人士认为,兴发集
<正>从21世纪上溯3000多年前,我们的祖先就幻想有朝一日能制造一种像人一样智慧的机器,以便把人类从苦难的劳作中解放出来。如今,人类的时钟已到了21世纪,在历史发展的漫漫长
本文介绍了ARP协议及其工作原理,深入分析了ARP协议存在的安全漏洞,并针对其缺点,给出了几种解决数字资源阅览室ARP病毒的方法。
分析了我国硫酸工业发展现状,综述了硫酸渣利用技术发展状况。通过焙烧硫酸渣特性分析和试验研究,确定化学法浸出硫酸渣最佳工艺条件为:浸出剂为王水,药剂用量为5%,药剂质量浓度50g
针对地下矿山掘进巷道的支护问题,在综合分析支护工艺存在问题的基础上,提出了掘进工作面锚杆、锚索支护作业施工工法,该工法文件对规范掘进工作面的支护作业流程、建立支护工岗
<正>~~
期刊