文本特征项的权重计算方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:ahzhangxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文通过在对多种常用的文本特征项的权重计算方法的分析后,归纳分析得出决定权重的若干因子,并据此假设出一种方法,并应用了文本分类的技术.对此权重计算方法中涉及到的各个因子进行详细的讨论分析,并加以调整,从而得出一个较佳的公式结果.文本分类检测系统采用了基于统计的方法,充分利用各种统计方法所提供的丰富的词汇信息,将自然语言理解技术应用于文本处理之中.文本特征项提取是文本处理的基本操作.该文提出了基于统计方法的文本特征项抽取方法.
其他文献
随着网络和数据库技术的飞速发展,Web技术得到了广泛应用。不仅出现了多种基于Web的大型应用系统,如搜索引擎、远程教学、电子商务应用等;而且越来越多已有的信息系统正逐步向In
随着互联网技术的不断推进和服务计算的深入发展,跨地域、跨机构和跨平台的业务协作成为可能。网格服务作为一种新型的网络应用模式,由于其具有高度的互操作性、跨平台性和松散
该文主要研究以Linda为基础的Klaim语言和XML技术的结合,设计一种新型语言--XML-Klaim.其主要内容包括以下几个部分:1. 对以Linda模型为基础的分布式语言进行了介绍、比较,并
该文中讨论了数字图象处理技术在数字化图书馆建设中的图书数字化方面的实际应用,该文中采用的方法较好的弥补了数码相机拍摄的缺陷,清晰的还原了图象并进行了二值化.该文中
对扫描输入的彩色地图进行消噪和自动分割是纸质地图电子化的关键技术.论文研究了扫描输入彩色半调图像中存在的莫尔纹噪声的产生原因和消噪的方法,提出了针对不同颜色通道在
本文分析比较了目前主流的Web开发技术,系统研究了基于Web的分布式信息系统理论,重点研究了COM组件、XML等理论及其应用开发技术。通过对COM组件技术和XML技术的分析以及中间层
该文在语音信号处理和汉语韵律的基础上,对语音合成方法及其应用进行深入的研究,主要工作如下:(1)在基音同步叠加算法(PSOLA)的研究基础上,提出了一种基于动态规划和相关函数
随着网络的飞速发展和信息交互量的不断增长,信息安全的问题受到了越来越多的关注。为了维护网络环境的安全,构建正确的安全协议是必要的。然而,如何保证安全协议的安全性,如
该文对数据清理方面的知识进行了比较全面、详细的描述.介绍了数据清理的概念、意义和国内外的研究现状.并对数据清理的原理、方法、流程、实现方式等进行了分析和总结.其中,
有限元方法作为一种有效的数值分析工具,在织物结构力学问题的研究中发挥了重要的作用,可以用来对变形织物进行建模和仿真.它不但能反映织物的外部特征,而且能对织物的内部结