一种基于贪婪覆盖的文本分类方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:dlll9393
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是信息检索和数据挖掘中的重要主题之一。文中提出了一种基于贪婪覆盖算法的文本分类方法,首先对文本进行分词,分词的结果用CHI统计量的方法提取特征,使用TF—IDF-ICSD进行特征权重计算。对贪婪覆盖算法采用另一种选取初始点的方法来构建分类器,用复旦大学语料库作为测试数据集,并与BP算法相比较。实验结果表明文本提出的方法是有效的。
其他文献
思想政治学科核心素养发展的重要途径是强调学生的活动体验,构建活动型课程,通过“活动——体验——表现”情景模拟、角色扮演,引导学生自主学习、合作学习和探究学习,在参与
农村学校学生英语基础较差,对英语学习不感兴趣,再加上初入中学,对新的学习生活不适应,学生的英语学习问题较多。如何使学生提高对英语学习重要性的认识,英语课教学的一个重要任务
AJAX技术极大提升了Web应用质量,但同时增加了Web应用开发的复杂性和难度。文中在深入分析传统的Struts+Spring+Hibernate Web应用架构的基础上,广泛研究当前流行的开源技术,提出
当前,部分小学英语教师在培养学生英语学科核心素养之语言能力中的英语阅读能力的过程中,存在方法不够科学、效果不够明显的问题,导致小学生的英语阅读能力没有得到本质的提
介绍了DDoS的防御机制,以DDoS防御机制的行为层次将其分为两类,并对现行的一些行方法,从其基本原理、具体的使用方法、存在的优缺点等方面进行了详细的分析与研究,以便于在实际中
《全民健身计划纲要》(以下简称《纲要》)的实施,这是一件关系到提高全国人民健康水平和全民族素质的大事.实行全民健身计划,是一项在国务院领导下,由国家体委会同有关部门共
《普通高中英语课程标准(2017年版)》强调英语的学习是一个不断提高语言运用能力和人文素养的过程。核心素养的达成需要渗透在英语教学的方方面面,那么,在高中英语词汇教学中
金砖国家工商理事会于7月22日至23日在南非德班召开2018年度会议,来自五国理事会、新开发银行等机构的450余名代表参加会议.会议审议通过《金砖国家工商理事会2018年度报告》
在LEO卫星通信系统中引入Adhoc终端组网方式,提出一种同时基于Adhoc方式与正常卫星业务信道远程通信的双模终端异构组网模型LADMNM,使热点小区内溢出的近距离业务可在卫星系统