基于向量空间模型的文本自动分类系统的研究与实现

来源 :北方交通大学学报 | 被引量 : 0次 | 上传用户:huohuoshan000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.
其他文献
由于当下世界金融危机的影响,包括日本在内,东亚地区为了保持增长不得不进行结构转换。今后的东亚应当通过进一步的全球化和"知识复兴",在维持世界制造基地地位的同时发展成为
计算机网络安全已经成为我们利用网络工作的一大难题,本文从影响它的主要原因着手分析,提出些防范措施,避免在计算机网络中出现问题,以确保计算机网络的安全管理与有效运行。
随着计算机的普及,网络通讯已经成为人们办公、生活的主要组成部分,然而网络通讯固然方便却仍旧存在很多问题,计算机网络通讯问题主要表现在技术故障及通讯安全问题方面。网
0 引言细胞发生癌变到肿瘤的快速生长、浸润和转移是一个多因素、多阶段、多基因变异累积的复杂病变过程[1].在肿瘤发生、发展的过程中,基因水平的改变远比我们在解剖学、细
目的探讨人工关节置换术后假体周围感染的常见病原菌分布及耐药情况,为临床合理应用抗菌药物提供科学依据。方法回顾性调查河南省洛阳正骨医院(河南省骨科医院)2014年3月至20
实现海洋平台上部组块高效安全的安装是海洋油气资源开发的保障,论文以基于快速载荷转移技术的浮托安装系统为研究对象,利用模型试验和数值模拟方法探究大型平台组块浮托安装
在研究了机车用大功率柴油机电控系统中电磁阀阀芯的运动规律和线圈电流的波形形状基础上,提出了电磁阀电流波形中的喷油起始点(SIP)的寻找方法,并且基于SIP提出一种新的周期预推