基于改进分类模型的文本分类系统实现

来源 :重庆师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:xuhuangyun1118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类。针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类。通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的。
其他文献
血液透析病人8例,在血透时及血透间期分别自血透导管和静脉注射头孢唑啉4g,HPLC测定血清头孢唑啉浓度,按单室模型用二点法计算药物清除半衰期(t1/2)分别为:6.76±1.62h、48.1&
通过助跑上板的速度、单足跳后水平速度及单摆臂、三跳节奏等方面,分析了1994年以来集美大学体育学院三级跳运动在“速度一平跳”技术运用过程中所取得的成绩及其技术发展特点
医院药学文献微机检索系统的开发及运用第三军医大学附属第二医院药局(630037)刘同华,王治邦利用计算机对文献资料进行检索和管理,提高检索速度和效率,实现文献检索管理自动化,是获得信息
培氟沙星单剂疗法治疗妇女急性下尿路感染太原制药厂(030021)孔庆芝培氟沙星(Pefloxacin)是法国RogerBellon公司研究开发,并于1985年首先在法国上市的氟喹诺酮类抗菌剂(商品名:Peflacine),随后相继在泰国、乌拉圭、象牙... Pef
针对21世纪人才培养的需求,对学校体育改革的几个关键问题,如当前学校体育的现状、学校体育教学指导思想、体育教学观念以及学校体育课程设置等问题提出了意见,可为深化学校
分析了女子竞技健美操个人成套动作编排的依据、构成要素及其要求。
建国初期,贵州省的农田水利建设主要是在恢复旧有的农田水利设施基础之上,试办和初步发展中小型工程建设。这期间,贵州省的农田水利建设取得了一定的成绩,积累了非常宝贵的经
<正> 解热镇痛药是临床应用面广、用量大的一大类药物,在治疗药物中占有十分重要的地位。建国四十余年来,我国重视发展原料药生产,在剂型、品种、规格方面亦做了大量工作,基
摘要:网络媒体监督具有公开、及时、敢说真话、覆盖面广等方面的特点,它使得中国普通民众第一次拥有了如此平等而广泛的话语权,并在一定程度上弥补既有监督途径的缺陷,因而具有重大的意义。但在当前中国,网络媒体监督的发展还面临着很多的局限性,诸如数字鸿沟、信息失真、网络"暴力"等。本文分析了当前中国网络媒体监督的局限性及其原因,并在此基础上提出相关的完善对策,以期对中国网络媒体监督的良性发展有所助益。  关
就高校480名学生中关于体育课及体育锻炼一系列问题调查的结果进行研究。从中发现有50.3%的被试喜欢体育课。同时,在个性、态度、锻炼时间、偏好的原因、重视程度、课程评价及改