文本分类中特征选择方法的比较和改进

来源 :郑州大学学报:理学版 | 被引量 : 0次 | 上传用户:jianbbk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考察了文档频率DF、互信息MI、CHI统计、CC统计四种不同的特征选择方法,并结合K近邻算法进行分类精度上的比较.为消除MI对低频词的倚重,提出一种DF与MI结合的特征评价函数,并验证了这种组合特征选择方法的有效性.
其他文献
以4'-正-烷氧基联苯基-4-甲酸和2,5-二羟基苯醌为原料,通过酯化和还原反应合成了一系列新的液品性2,5-双E4’-(正-烷氧基联苯基)-4-碳酰氧基]对苯二醌(化合物1)和2,5-双E4’-(正-烷氧基
<正>~~
期刊
将K—L信息D(P,P0)推广到P0为非负有限可测函数,讨论了D(P,P0)在定义域约束、可测函数组的期望值约束和同时具有两个约束条件下的最小化问题,以及它们的逆问题.指出任何均匀分布族、负
聚类是数据挖掘中的关键问题,吸取了BIRCH算法中构造簇特征树来产生初始聚类中心的方法,提出了一种基于随机抽取的有限深度层次聚类算法(RSLDCH算法),采用随机抽取样本、限制
研究一类非局部退化反应扩散方程组初边值问题,利用上下解方法,通过精细的分析,得到了解整体存在和爆破的条件。
用分步法制备全苯异氰酸酯基-β-环糊精键合硅胶手性固定相.在高效液相色谱仪上,对氟西汀对映体进行拆分,并探讨流动相组成及配比、离子强度、pH值、流速和柱温等影响分离的
解决了带有三点边值的Dirac特征值问题的特征展开定理,首先将特征值的研究化为一个整函数ω(λ)的零点的研究,然后构造了豫解式问题的Green函数.据此用留数方法证明了反射型兰点边
利用AFM、SEM和XRD等现代表面分析手段研究了高锰铝青铜(ZQAl12-8—3-2)合金在含硫酸盐还原菌(SRB)的海水环境中的腐蚀行为。结果表明,SRB不容易在高锰铝青铜表面吸附而形成完整的
<正>Based on conventional metal-oxide-semiconductor field-effect transistor (MOSFET),a novel kind of chemical field-effect transistor (ChemFET) gas sensor array
期刊
<正>Flower-like ZnO was prepared through a hydrothermal process using zinc sulfate as raw material.The microstructure and morphology of the samples were charact
期刊