基于文本团的自动文本分类方法

来源 :全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会 | 被引量 : 0次 | 上传用户:skylfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本分类是指在给定的分类体系下,对未知类别的文档进行自动处理,并根据文档特征判断其所属类别的过程.现有的文本分类算法如:KNN、SVM大都基于向量空间模型,没有考虑文档的语义特征信息。本文根据文档相似性矩阵构造文本相似图,在图中提取文本团(完全子图),这些文本团可以反映每个类别的主题信息,由此构造分类器,进而与经典的分类器组合,进行文本分类.在复旦大学中文文本分类语料库和20 Newsgroups上进行实验,实验表明本文提出的分类方法较大改进了分类性能.
其他文献
本文构建了一种新的一体化安全管理平台的结构模型,并且对其中的模块进行了功能和组成的详细说明,指出了新的管理平台的设计原则和预期达到的安全管理目标,并且对实施一体化网络
本文提出了一种基于文本的本体学习框架,该框架共包括术语抽取、本体创建和本体修剪三大功能模块。术语抽取用来从Web文本中识别出与创建本体有关联的术语,本体创建是根据抽取
Web Services基础上产生ESB和BPEL技术融合了面向服务的体系架构思想,采纳广泛通用的标准为企业提供了一个可靠的、基于标准的、分布的,可伸缩的应用集成平台。本文将二者有机
会议
职业危害调查表明,长期接触铝、氧化铝粉尘的作业工人,可发生铝尘肺[1],接触可溶性铝盐蒸气可刺激眼和上呼吸道粘膜,产生急性结膜炎、急性支气管炎[2]。目前作业场所空气中铝和铝合金粉