一种组合型中文文本分类特征选择方法

来源 :广西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:JK0803zhaozhenhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据基于频数分布和基于互信息的特征选择模式的特点,将传统的tf—idf因子以及基于互信息的特征选择方法分别进行了改进,并在此基础上提出了一种新的组合型特征选择方法。试验结果表明,该算法提高了文本分类的准确率。
其他文献
患者男,55岁,因记忆力进行性减退2月余入院.既往体健,2个多月前无明显诱因感觉头昏,无头痛,记忆力进行性减退明显,时有双下肢乏力,伴嗜睡、盗汗及发热.无头部外伤史,无视力下
目的探讨琥珀酸索利那新防治良性前列腺增生症经尿道前列腺电切术(TuRP)术后膀胱痉挛的临床效果。方法将68例前列腺增生症行TURP术的患者随机分为两组。观察组(34例)于术后当日起
目的探讨肝酶学异常的影响因素,为慢性肝病的防控提供依据。方法采用自行编制的影响因素调查表,回顾性调查我院5071名健康体检者肝酶(ALT、AST、GGT)异常情况,采用EXCEL2003建立样
利用b3lyp/6—31G(d)和b3lyp/6—31++G(d)的方法对TATP和TATP+的结构和红外振动光谱的特点进行了研究,并确定了分子的电离能。研究发现根据分子振动类型的不同,TATP的红外振动光谱主
目的 探讨正常高值血压者血清生长分化因子-15(GDF-15)水平与颈内动脉内膜中层厚度的相关性.方法 取200例正常高值血压者为观察组,100例理想血压者为对照组.用彩色多普勒超声测
介绍了一种基于DSP、FPGA技术的高速数据采集与液晶显示设计。利用DSP驱动A/D转换器,计算显示需要的位置信息。用FPGA分批次接收DSP送来的数据,从SRAM读取数据驱动800×4
以LEACH算法为基础,针对传感器节点能量消耗不均衡的问题,综合考虑剩余能量、与sink节点的距离、当选次数等因素,提出一种改进的簇头选择阈值公式。经仿真计算,改进后的算法
在详细分析扇三角洲沉积相特征的基础上,结合地震、岩芯及测井资料,对柳赞油田北区沙三3亚段下部砂组进行了高分辨率层序地层学分析。结果表明:研究区发育典型的粒度向上变粗
研制了0.3%阿维菌素微乳剂并简述了该剂型的特点,对其配方、贮存稳定性、杀虫活性等进行了研究,该制剂成本低,药效好、质量稳定、使用安全、社会效益显著。
运用HRP逆行标记技术,对蛤蚧(Gekko gecko)离顶盖通路中丘脑圆核(Rt)到端脑前背侧室嵴(ADVR)投射的具体模式和局部相关性进行研究。结果显示:蛤蚧丘脑Rt前、中部的腹外侧区传出纤维,沿外侧前脑束(lfb)前行至前联