一种基于散度差组合型文本特征降维方法

来源 :微电子学与计算机 | 被引量 : 7次 | 上传用户:yyy8881200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于散度差的组合型文本特征抽取方法.首先讨论了文本分类中特征降维的主要方法及其特点,然后分析了基于散度差的准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.实验结果表明,该方法在文本分类上的效率较好.
其他文献
世界各地的学徒制都必须适应不断变化的国际经济形势和社会环境,英国也不例外。立足于"调解员"的视角,分析英国最新的学徒制模式表明,这些调解员与雇主一起在地区层面工作,培
大汶河属于黄河下游一级支流,是泰安市唯一的大型防洪除涝河道,流域已建成的六座拦河蓄水橡胶坝工程解决了河道防洪与蓄水矛盾,有利于生态环境的保护,同时也给大汶河的防汛调
瘟病初起,风热表证,应当使用清热解毒.辛凉解表药。如银翘润肺散加喉炎净散。退热效果不明显时,建议同时加入温热速退。对出现肺部栓塞的病例。以化痰,清肺热为主。如银翘润肺散加
无定河干流中下游段设计洪水,采用洪水地区组成法,推算受巴图湾、王圪堵大型水库影响的设计洪水。区间设计洪水充分考虑不同地貌类型,采用不同的参证站,以及相应的面积指数,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
对复合SBR工艺的机理及特性作了分析总结,并给出了几个工程实例,最后就其设计及发展作了展望。
志丹县地处陕西西北部,资源性缺水,供需矛盾突出。在阐述水资源开发利用现状的基础上,针对资源性缺水、水环境问题严重、基础设施建设薄弱的问题,提出加强水利基础设施建设、
基于大数据研究背景,针对水利行业档案信息化管理存在的问题,探讨水利行业档案信息化管理与建设的方法,通过调研分析提出要构建完善档案信息化建设管理制度,搭建档案信息网络
水文预报技术、水资源管理技术越来越先进,能够更好预测洪水、旱情等自然灾害,将灾害带来的损失降到最低。本文主要选择张家口市清水河流域作为实例研究对象,并分析流域水文
浑太河流域系指沈阳、本溪等大型城市分布河道沿线,水资源现状开发利用程度较高,以浑太流域为研究对象,针对浑太流域水文水资源特点,根据干流上各水文站的历年水文资料,结合