文本分类中基于类别概念的特征选择方法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:wrx5428167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的TFIDF公式常被用于信息检索各种计算特征项权重的场合,但在文本分类任务下,TFIDF忽略了特征项的类别信息,且较易产生一些不合理的低频高权特征,一定程度上影响了最终分类的准确性。本文提出一种基于类别概念的TFCW特征选择方法,该方法避免了TFIDF的上述缺陷。实验表明该方法用于文本分类中优于目前常见的TFIDF改进算法。
其他文献
我国的高职高专教育存在以知识为本、以教师为中心、教学模式大一统、学生知识面狭窄而缺乏创新能力等问题。应树立以学生为本的人才观、德育为先的教育观、以能力为重点的素
根据江西的能源结构提出了江西应采取的能源战略对策与相应的电网规划设想。
概述了锂离子电池正极材料磷酸铁锂的结构及充放电机理,并阐述了磷酸铁锂的掺杂改性的方法,对下一步的研究工作进行了展望。
为提高加密系统的可用性,提出了基于USB的加密系统设计,该系统上层接口符合微软的CSP标准,系统内部本身实现了证书解析和证书存储的功能;系统内部可以存储大量的证书,供使用
管理、教育、服务学生是辅导员的工作职责.通过管理、教育与服务,培养学生能力、提高学生素质.辅导员履行工作职责必须注意方式方法.文章介绍了作者的做法和体会.
分析MVC设计模式和Struts的工作原理,针对科研管理系统的特点,在系统中采用Struts技术,并通过实例介绍其在应用程序中的具体应用。
张家场气田石炭系气藏属川东地区典型的低孔、低渗透储集层的裂缝-孔隙型气藏,进入开采后期,由于受异常井、出水井、及增压机组的影响,未能达到应有的生产规模.文章剖析了这
阐述虚拟现实技术的构成及特征,结合VRML语言探讨虚拟现实技术在教学中的应用。
计算冷凝器净化程度的BASIC程序早期报警系统能使操作人员对冷凝器结垢迅速作出反应,从而采取措施防止加热率的下降。每年冷凝器管道的结垢所造成的效率下降,会使一个电厂多花费几十
通过示差扫描量热仪(DSC)等试验手段,系统分析了添加稀土元素ce后所形成的Ti-Ni-Cex(X=2 at%、3 at%、4 at%)系合金的相变行为和形状记忆效应,以及相变温度和相变潜热与稀土含量之间的