基于序列的文本自动分类算法

来源 :软件学报 | 被引量 : 0次 | 上传用户：wintelchia

【摘要】

：

提出了一种基于序列的文本自动分类算法，该算法利用了文本中两个层次的语义相关性：句子（子模式）之间的相关性和句子内代表特定含义的关键词（概念节点）之间的相关性，这样就实现了对关

【作者】

：

解冲锋李星

【机构】

：

清华大学电子工程系

【出处】

：

软件学报

【发表日期】

：

2002年4期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种基于序列的文本自动分类算法，该算法利用了文本中两个层次的语义相关性：句子（子模式）之间的相关性和句子内代表特定含义的关键词（概念节点）之间的相关性，这样就实现了对关键词的动态加权，对于不含有关键词的子模式，采用Markov模型来对其信号幅度进行估计，从而生成一个待分类文本的特征序列，在中文本分类实验中，可以达到83％的BEP值，此外，该算法在实际系统中容易实现。

其他文献

扩充角色层次关系模型及其应用

基于网络的大规模软件应用系统面临着日益复杂的数据资源安全管理的难题．基于角色的访问控制方法(role-based access control，简称RBAC)实现用户与访问权限的逻辑分离和构造角

期刊

角色基于角色访问控制继承层次关系Role role-based access control inheritance hierarchy.

西藏残疾人权益得到充分保障

历史永远铭记着1959年3月28日。这一天，中华人民共和国国务院总理周恩来发布命令，解散西藏地方政府，责成西藏自治区筹备委员会行使西藏地方政府职权，号召为建设民主和社会主义的

期刊

西藏地方政府残疾人中华人民共和国保障权益1959年国务院总理筹备委员会

一种面向对象的开放式超媒体引擎

从讨论超媒体引擎的设计原则和设计方法入手 ,提出了一种基于面向对象数据库管理系统的开放式超媒体引擎 .由于引入了元对象建模 ,该引擎不仅可以表达复杂的超媒体语义 ,而且

期刊

超媒体引擎元对象语义约束面向对象Hypermedia engine metaobject semantic constraint semantic

数字化时代高校图书馆阅读服务探析

随着互联网技术和数字媒介的迅猛发展,数字化阅读正不断影响着大学生获取信息资源的习惯和方式,对图书馆传统的阅读服务模式带来了一定的冲击和挑战。文章从阅读环境、服务主

期刊

数字化阅读高校图书馆阅读服务

新芋螺毒素SO3的活性与折叠的关系

利用O－超家族芋螺毒素具有保守信号肽编码序列的特性，采用RACE方法，对线纹芋螺O－超家族芋螺毒素的cDNA进行克隆、序列测定，并经化学合成，获得一种新型高活性芋螺多肽毒素SO3。该肽

期刊

O-超家族芋螺毒素线纹芋螺SO3折叠活性O-superfamily conotoxin Conus striatus SO3 refold b

一种基于模式的圆的识别算法

在工程图纸计算机输入识别和理解系统中，圆和圆弧的识别转换是一个尚未彻底解决的难题．文章介绍了整体识别方法的主要概念和图段数据结构，在此基础上提出了圆的识别算法．算法首先将图段与圆的两类模式进行匹配，从而确定圆的种子图段；然后，通过对其他图段实施跟踪，最终获得圆和圆弧的图形表示．最后给出了实例，结果表明，该识别算法较好地解决了图纸识别中的一个关键问题，具有适应性强、高效可靠的特点．

期刊

整体识别工程图纸CAD工程设计图纸识别Global recognition vectorization thinning.

基因组信息的整合与植物功能基因组学研究的策略

近年来,随着许多植物基因组测序和可利用序列的增加,相继建立了一些基于靶基因诱变的"反向"遗传学研究策略,如T-DNA诱变、基因献除、基因沉默和超表达分析等.同时,DNA微阵列

期刊

基因组信息整合植物功能基因组学靶基因functional genomicsgenomic informationintegration

Agent思维状态模型

文章综述了２０世纪９０年代以来Ａｇｅｎｔ系统中Ａｇｅｎｔ思维状态模型的研究结果。从直观分析，形式化模型，结构模型，合作研究和应用方面来介绍Ｂｒａｔｍａｎ的哲学观点，Ｃｏｈｅｎ和Ｌｅｖｅｓｑｕｅ的意图模型，Ｒａｏ和Ｇｅｏｒｇｅｆｆ的ＢＤＩ模型等重要成果，最后介绍了正在开

期刊