基于序列的文本自动分类算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:wintelchia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于序列的文本自动分类算法,该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权,对于不含有关键词的子模式,采用Markov模型来对其信号幅度进行估计,从而生成一个待分类文本的特征序列,在中文本分类实验中,可以达到83%的BEP值,此外,该算法在实际系统中容易实现。
其他文献
基于网络的大规模软件应用系统面临着日益复杂的数据资源安全管理的难题.基于角色的访问控制方法(role-based access control,简称RBAC)实现用户与访问权限的逻辑分离和构造角
历史永远铭记着1959年3月28日。这一天,中华人民共和国国务院总理周恩来发布命令,解散西藏地方政府,责成西藏自治区筹备委员会行使西藏地方政府职权,号召为建设民主和社会主义的
从讨论超媒体引擎的设计原则和设计方法入手 ,提出了一种基于面向对象数据库管理系统的开放式超媒体引擎 .由于引入了元对象建模 ,该引擎不仅可以表达复杂的超媒体语义 ,而且
随着互联网技术和数字媒介的迅猛发展,数字化阅读正不断影响着大学生获取信息资源的习惯和方式,对图书馆传统的阅读服务模式带来了一定的冲击和挑战。文章从阅读环境、服务主
利用O-超家族芋螺毒素具有保守信号肽编码序列的特性,采用RACE方法,对线纹芋螺O-超家族芋螺毒素的cDNA进行克隆、序列测定,并经化学合成,获得一种新型高活性芋螺多肽毒素SO3。该肽
在工程图纸计算机输入识别和理解系统中,圆和圆弧的识别转换是一个尚未彻底解决的难题.文章介绍了整体识别方法的主要概念和图段数据结构,在此基础上提出了圆的识别算法.算法首先将图段与圆的两类模式进行匹配,从而确定圆的种子图段;然后,通过对其他图段实施跟踪,最终获得圆和圆弧的图形表示.最后给出了实例,结果表明,该识别算法较好地解决了图纸识别中的一个关键问题,具有适应性强、高效可靠的特点.
近年来,随着许多植物基因组测序和可利用序列的增加,相继建立了一些基于靶基因诱变的"反向"遗传学研究策略,如T-DNA诱变、基因献除、基因沉默和超表达分析等.同时,DNA微阵列
文章综述了20世纪90年代以来Agent系统中Agent思维状态模型的研究结果。从直观分析,形式化模型,结构模型,合作研究和应用方面来介绍Bratman的哲学观点,Cohen和Levesque的意图模型,Rao和Georgeff的BDI模型等重要成果,最后介绍了正在开
在抗病毒植物基因工程中,利用病毒的复制酶基因是一种很有前途的方法.本文对烟草花叶病毒(TMV)的基因组结构及其编码的蛋白的功能作了简介,同时较详细地阐述了由TMV复制酶的