基于改进TFIDF的文本特征选择方法

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:xiaoyeziagan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析几种常见的特征选择评价函数,将权值计算函数应用于特征选择.提出一种新的基于改进TFIDF的文本特征选择评价函数,即TFIDF—Dac。它从提高特征项的类区分能力角度考虑,将特征项在类间的分布信息引入公式,弥补了传统的TFIDF的不足。实验测试表明,使用改进的特征选择方法能够有效提高文本分类的准确度。
其他文献
这几年,随着我国经济的高速发展,人们生活水平也不断提 高,作为国民经济的运载体—公路运输,这段时间,也在不断的升级 和改造。由于公路运输是一个地区经济发展的基础,它可以将该区
解析形式的相位函数是进行水下光传输仿真研究的一个重要特性参数,以Petzold平均粒子相位函数作为标准,比较了OTHG相位函数、Hahrin相位函数和Founier-Forland(FF)相位函数解析模
为了解决鱼雷倾斜转弯机动过程中俯仰、偏航与横滚通道间存在较强的运动、流体动力耦合的问题,将其控制系统表示为具有非匹配不确定性的关联大系统形式,采用扰动补偿的方法设计
现阶段,随着社会的发展,我国的企业财务工程的发展也有 了改善。随着我国经济体制改革的不断深入,现在我国已经进入了新 经济时代。新经济时代的到来给企业带来了不小的发展机遇
描述一个利用面向对象技术设计的药品管理系统.对开发方法、设计过程和系统功能进行了详细的描述。该系统能够很好地反映出药品进货、存储、查询情况。同时,该系统的完成对于Vi
《纳米结构与纳米材料》是我校材料科学与工程材料专业开设的一门专业选修课,其目的是拓宽学生的知识面,使其了解材料科学研究的前沿领域,认识科学研究的正确思维方式,并学到
根据着色Petri网的建模的方法和工具CPNT001.对TCP协议的连接建立模块建立了着色Petri网模型。得到了可达树,通过可达树的方法对协议模型的正确性进行验证。
无缝施工技术是大体积混凝土建筑工程施工中的一项重要应 用技术,其应用能够有效改善和提升施工质量,提高无缝施工技术应 用水平意义重大。无缝施工技术在应用过程中需要注意多
为提高三维空间目标的测距精度,提出利用圆柱阵的近似时延测距算法。首先根据圆柱阵中部分阵元具有不同时延表达式的特点,推导出空间目标的测距公式;然后在测向结果的基础上,
在我国建筑工程行业中,每一项基础工程建设都具有投资大,周期长 的特点,并面临着不定期更换负责人的风险。这大大提高了对于工程建筑管理 的难度。我们首先要了解建筑工程中