基于语义距离的文本分类方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：glsdap

【摘要】

：

文本分类是解决网络信息过载的关键技术之一。传统的文本分类方法大多只考虑文本中词语的统计词频等特征，忽略了文本的语义信息，导致文本分类精度不高。针对这种问题，提出了一种

【作者】

：

张培颖王雷全

【机构】

：

中国石油大学（华东）计算机与通信工程学院

【出处】

：

计算机技术与发展

【发表日期】

：

2013年1期

【关键词】

：

文本分类语义距离特征选择特征向量 text classification semantic distance features selection

【基金项目】

：

中央高校基本科研专项资金（09CX04031A）,中国石油大学（华东）计算机与通信工程学院青年教师创新基金（08120907）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是解决网络信息过载的关键技术之一。传统的文本分类方法大多只考虑文本中词语的统计词频等特征，忽略了文本的语义信息，导致文本分类精度不高。针对这种问题，提出了一种基于语义距离的文本分类方法，该方法首先根据CHI方法进行文本特征选择，然后利用语义距离计算代表类别的特征向量集合，最后通过计算文本特征向量和类别特征向量之间的语义距离来确定文本类别。实验结果表明，该方法与其他方法相比，把文本的语义信息考虑在内，在进行文本分类方面具有较高的准确率。

其他文献

基于拍卖理论的中继协作网络功率分配研究

针对放大转发无线协作中继网络，文中提出了一种改进的基于拍卖理论的分布式功率分配算法。该算法中用户以最大化自身的效用为目标，通过向中继节点发送投标量的方式购买中继功率

期刊

无线协作中继通信放大转发拍卖理论功率分配wireless cooperative relay communications amplify-and-f

高等农业院校商务英语实践课程设置和效果评价研究

社会商业化进程越来越快,众多教育机构、院校纷纷抓住契机,开立商务英语专业,商务英语顾名思义是适用于商务中的,商务英语应该坚持以人为导向,以提高就业为根本,当然也需要结

期刊

商务英语实践课程设置效果评价原则business english curriculum practice effect evaluation pr

医疗AI安全风险的伦理与法律保障机制研究

人工智能(AI)正在迅速发展并应用到医学领域当中,给广大医务工作者和患者带来了新的机遇与希望。然而,由于对象是人类的疾病与健康,医疗AI的应用本身会给患者和受试者健康带

期刊

医疗人工智能医疗伦理医疗损害医疗数据medical artificial intelligencemedical ethicsmedical dam

教育概念的个人认识史

研究者个人对某个问题的认识历程就是个人对某一问题的认识史,这看起来好像是研究者个人的事情,实际上是具有公共的学术价值的。研究者对教育概念进行了长达30多年的思考,一

期刊

教育概念个人认识史影响干预意念education conceptthe historyof personal cognitionimpactin

基于“医患信任”理论的医疗AI可信度问题的探讨

21世纪以来,人工智能技术在医疗领域中得到了广泛的应用,其在疾病预测方面显示出超出人类医生的精准和高效。然而,由于尚不清楚人工智能系统内部的工作原理,这种精准预测是如

期刊

医疗人工智能黑箱医患关系信任medical AIBlack Boxphysician-patient relationshipstrust

工程是什么和它应该是什么--一种基于“可供性”视角的研究

透过"可供性"视角去追踪工程创新的实际发生过程,会发现工程创新实质上就是对"可供性"的"摆弄"过程;在工程创新的发展和演化过程中,会对"可供性"进行模块化和生境化的显现;而

期刊

可供性工程创新可供性模块小生境affordanceengineering innovationmodulation of affordanceni

基于私有云平台的高校公共机房架构实践

随着信息时代的飞速发展，高校公共计算机房已成为教学、科研的重要基地，但往往存在机房配置成本高、软硬件资源利用率低、维护工作量大等问题。文中通过实现基于私有云平台的虚

期刊

高校公共计算机房云计算虚拟化college public computer roomcloud computingvirtualization

绿色网络PDF提取系统

随着信息技术迅猛发展，很多不良信息与文化通过PDF文档传播，而传统的提取PDF内容的方法无法适应绿色网络提供优质内容并过滤不良PDF的社会需求。文中提出通过建立层次关键字自

期刊

绿色网络自动机提取信息不良内容PDF过滤green network automata extracting information undes

一种无监督异常入侵检测的簇异常度量方法

文中主要研究用Pearson相关系数计算记录与簇、簇与簇间符号属性距离的方法；在这个方法中，提出了一种新的簇异常度量一近似平均距离AAD，AAD综合了一个簇的局部异常度，即簇的内部

期刊

无监督异常检测入侵检测网络安全聚类unsupervised anomaly detection intrusion detection networ

关于90后高校大学生参与科技创新实践的调查研究与思考——以武汉H大学为例

科技创新在国家全面深化改革和可持续发展过程中发挥着举足轻重的作用,随着国家中长期教育改革和发展规划纲要（2010-2020年）的逐步实施和深入发展,科教兴国战略在高等教育中的

期刊

大学生科技创新调查分析college students science and technology innovation investigation

基于语义距离的文本分类方法

与本文相关的学术论文