基于向量空间模型的文本自动分类系统的研究与实现

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:a0126051548
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术 ,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨 ,并且提出了基于向量空间模型的文本分类系统的结构 ,并给出了评估方法和实验结果
其他文献
综述了国内外铜-钢异种金属焊接的可行性、焊接方法及焊接接头组织性能方面的研究现状。分析了铜-钢焊接过程中存在的热裂纹和铜渗透裂纹等问题。介绍了多种实现铜-钢焊接的
<正> 淋巴细胞杂交瘤技术始于70年代中期,我国却是80年代初才逐步开展。现在全国已有不少实验室能进行杂交瘤细胞建株及单克隆抗体生产。鉴于我们人力、物力和财力都有限,国
较为详细地阐述了学校体育教育评价与学校体育教育改革的关系,提出二者是不可分割的一个整体,培养和塑造学生的健康素质是二者共同的起点和归宿。同时在此基础上还探讨了建立现
首先介绍了CMMI的概念 ,从模型结构和能力级别阐明了CMMI的连续表示 ,并对其分阶段表示作了简单地说明。从计算机应用环球网工程说明了CMMI产生的应用背景 ,从项目管理、文档
简单介绍了调制解调器 (Modem)的组成 ,并根据经验对上网中常见的故障给出了现象、分析及处理方法
对CMM/CMMI和主流软件生命周期模型的关系进行了分析,认为:a)CMM/CMMI与软件生命周期模型都是软件活动过程化的产物。在软件过程化进程中,CMM/CMMI是软件过程化成熟期的成果;
笔者根据自己多年从事核安全监督管理的实践和学习核安全法规的体会,特别是根据笔者本人在地区核安全监督站的工作经历,阐述了关于我国核安全监督管理体系的某些个人观点。
Web服务技术可以为异构系统集成提供有力支持,但在异步调用、流程控制和事务处理等方面仍然存在许多困难。提出了基于消息机制的异构系统集成方案,设计了总线型消息控制平台,
<正> 我厂有一薄板构件,全部采用1Cr18Ni9Ti钢焊接而成。其中薄板厚度为2毫米。由于薄板面积大(超过6500厘米~2)、刚性较差,在产品安装调试过程中,不慎使薄板变形。整个板面
以推动人类文明进步发展的观念为先导,以科学的态度、求实的观点、详实的资料,从地质学、岩石学、石文化为切入点,详细介绍中国观赏石文化的起源、发展、现状,赏石审美的本质