【摘 要】
:
文本自动分类是信息检索和数据挖掘领域的研究热点和核心技术,但是在实际应用中,经常会出现文本实例中一些类中欧冠的文本很多,而另一些类中的文本较少的情况,而这些应用往往
论文部分内容阅读
文本自动分类是信息检索和数据挖掘领域的研究热点和核心技术,但是在实际应用中,经常会出现文本实例中一些类中欧冠的文本很多,而另一些类中的文本较少的情况,而这些应用往往就是为了预测其中很少出现但很重要的文本,这就是所谓的文本分类不平衡问题。传统方法对少数类的识别率低,如何有效的提高少数类的分类性能成为机器学习和模式识别领域亟待解决的问题。因此,该文针对提高不平衡数据集中的少数类文本的分类性能之一问题,从数据层面处理的角度对数据进行重抽样。使用随机抽样的方法以提高分类器在非平衡数据集上的泛化性能。
其他文献
目的:通过健康教育配合中频脉冲电刺激对急性周围性面神经炎的干预作用,了解此种治疗方法的可行性、重要性,从而让更多的患者受益。方法选择两个病区将135例急性期面神经炎患者
自主品牌与自主知识产权体系,是民族企业发展必须的两个方面
综述了近年来基于XML的知识表示方法的研究进展。分别从基于XML的知识表示方法、研究现状和具体应用情况进行介绍,展望了XML知识表示方法的未来研究方向和发展前景。
谈到人才问题,郑妙勤爽朗地笑起来:“喜欢什么样的人才,这个问题讲一天都行。不一定要是名校的,最重要的是他会思考,用学过的东西去思考没有学过的东西。今天用的东西,明天可能就没
课堂是知识传输的主阵地。打造化学高校课堂,在有限的时间里实现教学效率的最大化,不仅是高考实际的需要,也是学生的素质培养和教师教法锤炼与提升的需要,我们高中教师要尤为重视
在当今社会的各个领域中.我们已越来越关注人本身、人的生命、人的生活以及人的幸福。越来越多的人在思考.在我们的生活中.什么才是最重要的?近期《科学》也将视线聚焦于人的生命
各位同学,我是1929年7岁的时候搬到清华园来居住的.我父亲那时候在清华物理系当教授.清华和北大那时候都比现在小得多.我估计清华园的面积只有现在的十分之一.
目的总结垂体卒中患者经手术后视功能改善情况,探讨其手术疗效。方法回顾性分析35例垂体卒中合并视觉障碍患者的临床资料,采用经鼻蝶或经额(或翼点)入路切除肿瘤。结果发病1~7d内
目的评价非痴呆性血管认知障碍(V-CIND)患者应用天智颗粒后智能改善情况。方法选择河南大学第一附属医院神经内科90例V-CIND患者,随机分为天智颗粒组、吡拉西坦组、对照组,每组
方向相同,定位不同的两个1相加,可以获得最佳的结果——等于11