基于交叉覆盖算法的文本分类

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：king2xl

【摘要】

：

分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络

【作者】

：

王倩倩段震张燕平

【机构】

：

安徽大学计算智能与信号处理重点实验室

【出处】

：

计算机技术与发展

【发表日期】

：

2007年6期

【关键词】

：

文本分类 x2统计量交叉覆盖算法 text classification x^2 statistic cross cover algorithm

【基金项目】

：

“九七三”计划国家重点基础研究（2004CB318108）,国家自然科学基金（60475017,60135010）,安徽省自然科学基金（050420208）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络的交叉覆盖算法作为分类器进行文本分类。实验表明,x2统计量可大规模降低特征维数,在此基础上结合交叉覆盖算法的优秀分类能力,可在特征维数较低的情况下获得一个性能较好的文本分类器。

其他文献

浅析主旋律电视文艺晚会的创新与突破——以“2019年度感动沈阳人物颁奖典礼”晚会为例

主旋律电视文艺晚会是电视文艺节目中一种必不可少的艺术形式,然而,在信息爆炸的今天,大众的娱乐方式日益多元化,主旋律电视文艺晚会难免陷入尴尬的境地——既要完成政治任务

期刊

主旋律电视文艺晚会创新突破

赴匈牙利护理学习体会

笔者参加了天津市卫生局组织的护理骨干赴匈牙利首都布达佩斯塞梅维什大学健康科学院为期3周的培训、学习与交流,现将学习体会总结如下.

期刊

匈牙利护理体会

20例喉癌患者术后放疗的护理

喉癌是头颈部常见的恶性肿瘤之一,多发于40岁以上的男性。其发病除受遗传因素影响外,还与长期吸烟、嗜酒、病毒感染、空气污染等诸多因素有关[1]。喉癌的治疗以手术为主,但常

期刊

喉癌术后放疗护理

从新闻属性出发浅析新闻播音中的重音选择

对新闻播音来说,首先应该考虑的就是如何播得清楚明了,以便受众接收信息、理解内容,从而提升传播效率。而在影响新闻播音传播效果的众多因素中,如何选择正确的重音是重要且值

期刊

新闻播音重音新闻属性

IKEv2预共享密钥认证机制的改进算法

预共享密钥认证方式作为IKEv2中认证方式之一，具有实施简单等优势，但是该认证方式下预共享密钥容易被泄露，从而导致整个认证过程的失败。为了解决以上缺陷．文中尝试将预共享密钥

期刊

IKEV2预共享密钥算法IKEv2 PSK algorithm

基于知识网格的分布式数据挖掘

科学和工商业应用需要分析分布在各异构站点的海量数据。这就需要合适的分布式并行系统来存储和管理数据。网格为分布式数据挖掘和知识发现提供了有效的计算支持。文中在讨论

期刊

知识网格VEGA数据挖掘知识发现knowledge grid VEGA data mining knowledge discovery

企业能从两会中读出什么？

今年两会期间，有好几家企业的朋友向我们了解两会中透露出的CSR新动向，这几家企业中，有的是世界500强企业，有的是新兴的互联网企业，有的是跨国公司，有的是中国本土企業。无一例外，他们都坚定地认为，两会的政策动向，将影响企业的社会责任决策，这说明中国的政策动向，已经成为CSR最重要的风向标，也说明企业的CSR经理们越来越希望了解国家政策的变化。　　那么，今年两会中和CSR有关的关键词有哪些呢？我先试

期刊

政策动向国家政策中国建设中国制造生态环境保护高频词汇质量水平中国教育现代化药品医疗器械民生议题

基于交叉覆盖算法的文本分类

与本文相关的学术论文