基于语义距离的文本分类方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:glsdap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是解决网络信息过载的关键技术之一。传统的文本分类方法大多只考虑文本中词语的统计词频等特征,忽略了文本的语义信息,导致文本分类精度不高。针对这种问题,提出了一种基于语义距离的文本分类方法,该方法首先根据CHI方法进行文本特征选择,然后利用语义距离计算代表类别的特征向量集合,最后通过计算文本特征向量和类别特征向量之间的语义距离来确定文本类别。实验结果表明,该方法与其他方法相比,把文本的语义信息考虑在内,在进行文本分类方面具有较高的准确率。
其他文献
针对放大转发无线协作中继网络,文中提出了一种改进的基于拍卖理论的分布式功率分配算法。该算法中用户以最大化自身的效用为目标,通过向中继节点发送投标量的方式购买中继功率
社会商业化进程越来越快,众多教育机构、院校纷纷抓住契机,开立商务英语专业,商务英语顾名思义是适用于商务中的,商务英语应该坚持以人为导向,以提高就业为根本,当然也需要结
人工智能(AI)正在迅速发展并应用到医学领域当中,给广大医务工作者和患者带来了新的机遇与希望。然而,由于对象是人类的疾病与健康,医疗AI的应用本身会给患者和受试者健康带
研究者个人对某个问题的认识历程就是个人对某一问题的认识史,这看起来好像是研究者个人的事情,实际上是具有公共的学术价值的。研究者对教育概念进行了长达30多年的思考,一
21世纪以来,人工智能技术在医疗领域中得到了广泛的应用,其在疾病预测方面显示出超出人类医生的精准和高效。然而,由于尚不清楚人工智能系统内部的工作原理,这种精准预测是如
透过"可供性"视角去追踪工程创新的实际发生过程,会发现工程创新实质上就是对"可供性"的"摆弄"过程;在工程创新的发展和演化过程中,会对"可供性"进行模块化和生境化的显现;而
随着信息时代的飞速发展,高校公共计算机房已成为教学、科研的重要基地,但往往存在机房配置成本高、软硬件资源利用率低、维护工作量大等问题。文中通过实现基于私有云平台的虚
随着信息技术迅猛发展,很多不良信息与文化通过PDF文档传播,而传统的提取PDF内容的方法无法适应绿色网络提供优质内容并过滤不良PDF的社会需求。文中提出通过建立层次关键字自
文中主要研究用Pearson相关系数计算记录与簇、簇与簇间符号属性距离的方法;在这个方法中,提出了一种新的簇异常度量一近似平均距离AAD,AAD综合了一个簇的局部异常度,即簇的内部
科技创新在国家全面深化改革和可持续发展过程中发挥着举足轻重的作用,随着国家中长期教育改革和发展规划纲要(2010-2020年)的逐步实施和深入发展,科教兴国战略在高等教育中的