基于混合核函数支持向量机的文本分类研究

被引量 : 0次 | 上传用户:gn8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的高速发展,人们搜集、存储数据的能力空前提高,不管在科学研究还是在社会生活的各个领域,都积累了大量的数据。采用机器学习的方法分析数据、挖掘数据背后的信息,促成了基于支持向量机的分类技术的产生。自20世纪90年代Vapnik等人提出基于统计学习理论支持向量机算法以来,基于核函数的机器学习方法(核方法)得到了迅猛的发展,目前已经成为了机器学习领域和人工智能领域的研究热点之一,广泛应用在生物信息技术、图像处理和文本分类等多个领域。对支持向量机的进一步研究,无论对核函数理论的完善和发展,还是对核函数方法在应用领域的进一步研究拓展,都具有极其重要的意义。核函数是实现非线性映射的重要途径,正是支持向量机得到广泛应用和取得良好效果的关键所在。本篇论文的工作就是研究混合核函数的性质、构造以及应用。研究混合核核函数的意义在于一方面可以扩展提高支持向量机在现实生活中的应用性;另一方面核函数方法还处于刚刚发展的初始阶段,其潜力还没有得到完全发掘。随着WEB数据挖掘技术的不断发展,现今的文本分类技术如何能够改善文本信息杂乱无章的状况,提高对WEB数据搜索的质量,进而快速有效的获得文本信息已经成为研究的重点。所以,人们越来越关注文本自动分类技术。基于机器学习的文本自动分类技术有着比较好的效果,该技术有着多种算法,例如:朴素贝叶斯算法、k最近邻算法、决策树算法以及支持向量机算法等。本文将基于混合核函数的支持向量机算法应用于文本分类技术中,先分析了新的混合核函数的合法性、性质、算法,之后分析了WEB文本分类的方法步骤:文本预处理,特征降维,文本特征的表示方法等,并构造了一个由支持向量机构造的WEB文本分类模型,通过仿真实验证明,新构造的混合核函数比单核以及常用的混合核函数的分类精度有所提高,并具有较高效率。
其他文献
在建筑结构设计中,荷载取值已成为衡量建筑结构设计可靠性的一个重要指标。在不同的结构设计中,要求取它们各自的荷载组合,按最不利的进行设计,从多个方面进行结构计算,验算
当前中国正处于由计划经济向市场经济转变、由封闭社会走向开放社会的转型期。传统的城乡二元结构使得城市与农村差距逐渐加大,城市生活质量和水平远远高于农村。在这一特定
交流特高压1000kV变电站主变压器第三绕组采用110kV电压等级,主要引接低压无功补偿设备;本文重点分析其开关设备、并联电容器及并联电抗器,确定了推荐设备型式,并给出了典型
<正>近年来,地震、海啸及台风等自然灾害,交通事故、火灾、核泄漏及恐怖袭击等人为灾难严重威胁人类的生存和社会发展与稳定。自1990年以来,全世界每年约有2.17亿人受到自然
传统金融理论认为市场中的投资者都是理性的,然而实证发现投资者心理、情绪的影响是不容忽视的.本文运用数理统计方法探讨了我国股票市场的投资者情绪效应,得到了相应的结论.全文
21世纪以来,我国经济发展迅速,人民生活水平不断提高,对建筑的追求也向着结构轻巧、造型独特等方向发展,促使了新型结构体系的采用、施工技术水平的提高以及轻质高强材料的使用。
西虹路一西山路规划为城市快速路,是规划的12条放射线之一,也是快速环路主要的横向通道,连接内环,向西连接乌奎高速,为乌市城市西侧的主要出入口,与河滩快速路形成十字形,与
随着科学技术的发展,生活、生产中使用到的电子设备也越来越多。众多的电子设备在工作的同时产生的电磁干扰现象会降低或破坏电子设备的工作性能,造成无法预知的后果。使用电磁
随着数字信号处理向着大功率、长距离、高速率方向的发展,基于FPGA的CMOS传感器在其中扮演着很重要的角色。随着它的广泛应用,对其性能的要求也越来越严格。本文首先分析了CM
汉语世界的古典诗词一旦进入英语世界,由语言与文化的异质性带来的冲突与交锋在所难免,英语文本世界遭遇的阵阵剧痛不禁触发人们在大量古诗词翻译实践之外进行反思。如果翻译是