基于文档频率的特征选择方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:berg123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的文档频率(DF)方法在进行特征选择时仅考虑特征词在类别中出现的DF,没有考虑特征词在每篇文档中出现的词频率(TF)问题。针对该问题,基于特征词在每篇文档中出现的TF,结合特征词在类别中出现的DF提出特征选择的新算法,并使用支持向量机方法训练分类器。实验结果表明,在进行特征选择时,考虑高词频特征词对类别的贡献,可提高传统DF方法的分类性能。
其他文献
目的通过分析腹膜后纤维化(RPF)的MRI表现特点,提高其早期诊断水平。方法回顾性分析经临床病理证实的7例特发性RPF患者的MRI特点。结果腹膜后纤维化MRI表现为腹膜后不规则形
《英语课程标准》倡导体验、实践、参与、合作与交流的学习方式和任务型的教学途径,以发展学生的综合语言运用能力。将任务型教学法应用于英语阅读教学具有积极的实践意义,本
在分析PageRank算法存在偏重旧网页、主题漂移、网页权值均分、忽视用户浏览兴趣现象的基础上,对其进行改进,考虑网页修改日期、网页文本信息、网站权威度、用户兴趣度等重要
提出一种基于PC和运动控制卡的开放式运动控制系统的设计方案。采用PC作为运动控制的核心处理部分,运动控制卡负责整个运动控制细节,并以VC++为工具,开发了具有开放式、通用
研究了用邻菲罗啉-OP乳化剂分光光度法测定高纯硅微粉中微量铁的方法.测铁的线性范围为0-100μg/25mL,检出限为0.020μg/mL,该法显色灵敏,选择性好,用于高纯硅样品中微量铁的
目的分析β-内酰胺类抗生素药物不良反应发生的特点,促进临床合理用药。方法收集、分析近年来关于β-内酰胺类抗生素的国内文献,总结β-内酰胺类抗生素药物的不良反应发生的
随着市场经济的发展,在激烈的市场竞争中,"中华老字号"品牌普遍面临着严峻的挑战。地方"老字号"也不可避免地深陷生存的"困境"。本文将在对福建地方老字号企业发展现状及原因
为更好地揣摩大众股民的心理及情感,提出一种基于网络论坛的股市分析方法。根据python实现相应的网络爬虫,利用该爬虫获取网络论坛中的所有帖子,对每日新帖子的数量进行统计
2011年高考物理试题突出物理学科特色,注重经典、立足基础;继续保持和注重理论联系实际,注重物理知识在生产生活中的应用;体现时代特色,稳中求变、变中求新。今后物理高考复
以镍渣和粉煤灰等工业固体废渣为主要原料制备地聚合物,并对其韧性进行优化。考察了粉煤灰对镍渣基地聚合物抗压强度的影响,并通过力学性能测试和扫描电镜观察研究了聚丙烯纤