面向文本分类的改进K近邻的支持向量机算法研究

被引量 : 0次 | 上传用户:yingzizhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸的时代,面对浩如烟海的信息,怎样有效地组织和管理这些信息并且快速准确地获得所需信息仍是一个亟待解决的问题。文本自动分类是一个有效的解决办法,它能够处理大量的文本,较大程度解决信息紊乱的现状,帮助用户方便准确地把握所需要的信息。支持向量机(SVM)是建立在结构风险最小化原则以及VC理论基础上的一种机器学习算法。由于它对特征相关性和稀疏性不敏感,对高维问题的处理具有较大的优势。因此,支持向量机在文本分类上具有应用前景。然而,使用支持向量机进行分类时总会出现在分界面附近的样本分类精度不高的问题。针对该缺点做了进一步的研究提出了一种改进K近邻的支持向量机算法。通过计算一些已知类别样本在不同阈值下的分类情况来自动确定最优阈值;同时将改进的加权KNN算法融合到支持向量机中力求在不增加支持向量机算法时间复杂度的基础上,减少分类超平面附近样本的错分率。最后,将改进算法应用到新闻分类系统中,实现新闻信息的文本归类,方便了用户阅读和浏览新闻。
其他文献
目的:观察评价我院Bicon短种植体在骨量不足后牙区患者的临床应用情况。方法:临床观察评价了我院2009年—2010年共25例临床后牙区骨量不足患者使用43枚Bicon短种植体进行临床
<正>口腔癌的发生发展是多基因、多步骤、受多种因素影响的复杂的过程。MicroRNAs(miRNAs)参与了广泛的生物过程,并在癌干细胞的调节中起关键作用,miRNAs与疾病的关系已成为
目的将在治疗呼吸科疾病时应用抗菌药物的临床效果进行分析。方法选取2016年1月—2019年1月在我院治疗呼吸科疾病的患者,共42例,分为抗菌组和普通组,普通组实施常规临床治疗,
随着人民生活水平的提高,私家车的数量也越来越多,大多数车主在汽车尾部使用一定的警示语,形形色色的汽车尾部警示语也应运而生。汽车尾部警示语具有鲜明的语言特点,因此,对
根据硅酮密封胶的结构特点和应用技术特点,简要介绍了硅酮密封胶的阻燃性能的研究现状、阻燃机理分析,在建筑密封及结构承力应用时的固化性能与接缝设计,以及在道路施工中的
随着我国高速铁路建设的持续快速发展,无砟轨道结构凭借其高稳定性、少维修量等特点被广泛的用于高速铁路。但随之而来,也带来了诸多新的问题,如无砟轨道的力学性能结构特点
目的:评估Bicon短种植体在上颌后牙区骨高度不足病例种植修复的临床效果。方法:选择上颌后牙区骨高度1.7-8mm的病例62例,共植入Bicon短种植体252枚,其中植入长度6mm的种植体1
大连邮政速递物流公司是依据国家邮政总局速递改革总体方案,于2008年年末组建。它是将原大连市邮政局下属的三个单位,即大连速递分局、大连同城速递分局和大连邮政物流合并而
目的检测B细胞非霍奇金淋巴瘤(non-Hodgkin lymphoma,NHL)患者治疗前后IL-17、IL-23表达水平的变化,探讨IL-17、IL-23在NHL发生发展过程中的作用.方法应用逆转录-聚合酶链式反应(re