基于交叉覆盖算法的中文文本分类

来源 :计算机工程 | 被引量 : 0次 | 上传用户:resume_002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于向量空间模型的文本分类过程中遇到的最大问题就是以词为特征项的向量维数太大,需要进行特征选取,而交叉覆盖算法的输入集是n维欧式空间的点集,可以忽略维数的大小,从而最大程度上精确地表示文本,然后再进行分类,能够大大提高正确率。将交叉覆盖算法作为一种分类算法来进行中文文本分类,取得了不错的效果,在封闭测试中的准确率达到98.32%。
其他文献
研究了ATM(MPLS)网络与IP网络的高速互通的问题,提出了AAL5适配处理电路的FPGA设计方案,给出了关键模块的实现方法功能分析及性能测试结果表明,该方案能够实现ATM与IP网络间
【正】 什么是租赁经营? 租赁经营,是指在不改变企业资产性质的前提下,实行所有权与经营权相分离的一种企业经营形式。它是由国家授权单位为出租方,将企业有限期地交给承租方
提出了基于模糊区域特征的图像融合方法,该方法是在多孔小波(àtrous wavelet)多分辨率分析的基础上,根据图像每层的低频分量进行K-mean,将低频图像分解为重要区域、次重
就流式传输中的ADSL接入技术进行分析,着重对ADsL的线路进行了分析测试,以及ADsL接入模式的变化,以解决流媒体应用中流式传输瓶颈问题.通过测试,ADsL不失为流媒体传输中接入
同塔多回输电线路下方存在与之平行排列的架空通讯光缆,电磁感应作用下悬挂光缆钢芯线上会产生电磁感应电流,对光缆检修人员的安全构成威胁。运用电磁暂态仿真软件ATP-EMTP,
以松嫩平原湿地的保护为背景,提出了基于GIS的湿地信息系统的建立方法。用GIS-GPS相结合的方法进行空间数据控制点的设置,克服了传统控制点设置方法的局限性;同时,应用VB+ArcObjects技术进行系统实现,并对叠加分析、空间检索等关键技术的实现方法进行了探讨。
分析了无线局域网的安全标准IEEE 802.11i和WAPI在安全与效率上存在的缺陷。提出了一种基于哈希链构造认证令牌,实现无线网络快速实体认证机制FWAI。与802.11i和WAPI比较,新机制
【正】 1992年5月13日—5月30日,国家教委在北京召开的九年义务教育理科教学大纲、教科书审查会议,审查通过了《九年义务教育全日制初级中学化学教学大纲》(以下简称新大纲)