一种基于贪婪覆盖的文本分类方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：dlll9393

【摘要】

：

文本分类是信息检索和数据挖掘中的重要主题之一。文中提出了一种基于贪婪覆盖算法的文本分类方法，首先对文本进行分词，分词的结果用CHI统计量的方法提取特征，使用TF—IDF-ICSD

【作者】

：

张燕平徐庆鹏苏守宝邢猛

【机构】

：

安徽大学计算智能与信号处理教育部重点实验室

【出处】

：

计算机技术与发展

【发表日期】

：

2009年1期

【关键词】

：

文本分类 CHI统计量 TF—IDF-ICSD 贪婪覆盖算法 text classification CHI statistie TF- IDF- ICSD g

【基金项目】

：

国家重点基础研究973计划资助项目（2004CB318108,2007CB311003）,国家内然科学基金资助项目（60675031）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是信息检索和数据挖掘中的重要主题之一。文中提出了一种基于贪婪覆盖算法的文本分类方法，首先对文本进行分词，分词的结果用CHI统计量的方法提取特征，使用TF—IDF-ICSD进行特征权重计算。对贪婪覆盖算法采用另一种选取初始点的方法来构建分类器，用复旦大学语料库作为测试数据集，并与BP算法相比较。实验结果表明文本提出的方法是有效的。

其他文献

课堂——让学生深度参与

思想政治学科核心素养发展的重要途径是强调学生的活动体验,构建活动型课程,通过“活动——体验——表现”情景模拟、角色扮演,引导学生自主学习、合作学习和探究学习,在参与

期刊

活动体验学科素养合作探究学生问题意识学生视野探究学习角色扮演情景模拟

激发兴趣教给方法

农村学校学生英语基础较差，对英语学习不感兴趣，再加上初入中学，对新的学习生活不适应，学生的英语学习问题较多。如何使学生提高对英语学习重要性的认识，英语课教学的一个重要任务

期刊

激发兴趣记单词英语教学学习英语英语学习预习目标教给方法读音规则英语歌曲礼貌用语

基于开源技术的Web应用架构研究

AJAX技术极大提升了Web应用质量，但同时增加了Web应用开发的复杂性和难度。文中在深入分析传统的Struts＋Spring＋Hibernate Web应用架构的基础上，广泛研究当前流行的开源技术，提出

期刊

EXTDWRSpringHIBERNATEAJAX开源软件应用架构ExtJSDWR Spring Hibernate AJAX open

任务驱动下的提升小学生英语阅读能力实践研究

当前,部分小学英语教师在培养学生英语学科核心素养之语言能力中的英语阅读能力的过程中,存在方法不够科学、效果不够明显的问题,导致小学生的英语阅读能力没有得到本质的提

期刊

形象直观小学英语教师英语阅读能力任务驱动阅读教学模式《英语》小学生英语学科核心素养

DDoS防御机制研究

介绍了DDoS的防御机制，以DDoS防御机制的行为层次将其分为两类，并对现行的一些行方法，从其基本原理、具体的使用方法、存在的优缺点等方面进行了详细的分析与研究，以便于在实际中

期刊

DDOS防御策略网络安全DDoS defense strategy network security

中学体育工作在全民健身活动中的地位和作用

《全民健身计划纲要》(以下简称《纲要》)的实施,这是一件关系到提高全国人民健康水平和全民族素质的大事.实行全民健身计划,是一项在国务院领导下,由国家体委会同有关部门共

期刊

全民健身活动中学体育实施《纲要》学校体育工作《全民健身计划纲要》体育活动中国社会主义现代化地位和作用现代化目标社会系统工程

高中英语词汇教学的实践与研究

《普通高中英语课程标准(2017年版)》强调英语的学习是一个不断提高语言运用能力和人文素养的过程。核心素养的达成需要渗透在英语教学的方方面面,那么,在高中英语词汇教学中

期刊

核心素养高中英语词汇教学实践与研究普通高中英语课程标准人文素养语言运用能力英语教学小学和初中

金砖国家工商理事会2018年度会议举行

金砖国家工商理事会于7月22日至23日在南非德班召开2018年度会议,来自五国理事会、新开发银行等机构的450余名代表参加会议.会议审议通过《金砖国家工商理事会2018年度报告》

期刊

理事会金砖年度报告董事长

一种Adhoc方式异构组网支持的终端双模组网模型

在LEO卫星通信系统中引入Adhoc终端组网方式，提出一种同时基于Adhoc方式与正常卫星业务信道远程通信的双模终端异构组网模型LADMNM，使热点小区内溢出的近距离业务可在卫星系统

期刊

LEO卫星系统ADhoc方式双模组网模型LEO satellite systemsAd hoc modedual- mode network mod

天津市中小学教师“希望工程”市级青年学科带头人名单

期刊

中小学教师学科带头人天津市长征中学数学实验幼儿师范学校上海道小学语文聋哑学校南开中学

一种基于贪婪覆盖的文本分类方法

与本文相关的学术论文