【摘 要】
:
在数据挖掘领域中,分类算法是当前研究的一个重要方向。作为一种经典的分类算法,支持向量机在处理非线性、小样本、高维数的问题时有着很大优势。在解决实际问题时,核函数和惩罚参数会影响着支持向量机的分类效果,为了提高其分类效果,提出用启发式算法优化支持向量机。同时,为了克服使用单一的启发式算法在优化支持向量机的过程中出现的易陷入局部最优,不能进行全局搜索的不足,提出基于低偏差序列的GAPSO_SVM算法。
论文部分内容阅读
在数据挖掘领域中,分类算法是当前研究的一个重要方向。作为一种经典的分类算法,支持向量机在处理非线性、小样本、高维数的问题时有着很大优势。在解决实际问题时,核函数和惩罚参数会影响着支持向量机的分类效果,为了提高其分类效果,提出用启发式算法优化支持向量机。同时,为了克服使用单一的启发式算法在优化支持向量机的过程中出现的易陷入局部最优,不能进行全局搜索的不足,提出基于低偏差序列的GAPSO_SVM算法。为了验证改进的算法的可行性与性能,本文的研究工作主要通过三方面展开,第一,分析与改进传统的启发式算法;第二,分析二分类支持向量机的基本原理与数学建模过程,根据多分类问题,构造出多分类支持向量机。在分析影响支持向量机分类性能的基础上,利用改进的启发式算法选择合适的核函数和惩罚参数,设计出性能优越的支持向量机;第三,选取意图分类数据集,对中文文本作分词、去停用词后,利用Word2vec语言模型提取文本特征、量化文本,最后将量化后的特征作为训练数据,改进的支持向量机作为学习器,从而构造出意图分类的模型。其中,在改进传统的启发式算法工作中,本文提出如下创新点:1.针对遗传算法存在收敛速度慢,易陷入局部最优的问题,为了提高算法的寻优效果,在选择个体时,首先将种群按照适应度大小进行排序,再将种群分成四等分,淘汰适应度最低的一份,然后在剩下的三份中复制适应度最高的一份组成新的种群,从而在保持种群规模不变的情况下,保持物种的多样性。2.针对粒子群算法存在种群多样性差,容易早熟的问题,在初始化种群时,以低偏差序列取代随机数生成初始种群,使得初始种群在空间的分布更加均匀,提高初始粒子的质量。在算法迭代过程中,为了提高算法搜索的规律性,以低偏差序列取代随机参数对粒子的速度和位置进行更新,最后通过引入遗传算法的变异思想,以一定的概率将粒子的位置变异,扩大算法在迭代后期的搜索范围,避免因搜索范围小陷入局部最优,从而提高算法寻优能力。3.在分别改进遗传算法和粒子群算法的基础上,为了结合各自的优点,提高算法的全局稳定的寻优能力,将算法以并行方式结合,在每一次迭代过程中,根据适应度值,确定遗传算法和粒子群算法的全局最优值,通过比较两种算法的全局最优值,得到GAPSO算法的全局极值。最后,通过仿真实验证明改进的启发式算法有更好的寻优能力,基于低偏差序列的GAPSO_SVM算法有着更好的分类效果。
其他文献
通过理论分析对比曲线梁桥与直线梁桥在计算中承受荷载的主要不同点、分析计算中应主要注意的事项.列举实例,建立空间模型分析计算预应力钢束对支座的支反力影响大小.针对现
再生水回用于循环冷却系统是解决我国水资源短缺的重要途经之一。与自然水体相比,再生水中营养物质充足,加之循环冷却系统内水温适中,pH值中性,供氧充足,光照充分,为微生物的
我国高速铁路的快速发展为其安全运营带来了一系列的技术挑战,其中,弓网之间受流质量的恶化成为限制列车运行速度提升和影响运营安全的重要因素之一。一方面,由于接触网具有
十八大报告提出:“必须更加自觉地把全面协调可持续发展作为深入贯彻落实科学发展观的基本要求,全面落实经济建设、政治建设、文化建设、社会建设、生态文明建设五位一体总体布局”。生态文明建设以营造良好环境、大力提升生态意识文明为基础,以转变发展方式、建立生态行为文明为根本途径,以健全环境法制体系、完善生态制度文明为保障,形成全社会共同推进的整体合力。文明与教育是紧密联系在一起的。教育是传播文明的有效形式,
本文主旨是从宋代经典绘画作品《百花图卷》的艺术特点,阐述其对我的工笔花鸟画创作的影响和启示。结合《百花图卷》当时的时代背景,以及《百花图卷》整体清幽雅致,清新脱俗
2018年财政部、发改委等部门先后出台50号和87号文,提出关注地方政府“隐性负债”风险问题。2019年政府工作报告中也提出“稳妥处理地方政府债务风险”,这说明三大攻坚战之首的“防范化解重大风险”将仍然是2019年的工作重点,即防范化解地方政府隐性债务风险。因此,在供给侧结构性改革背景之下,深入分析地方政府隐性债务风险具有深刻意义。对比2017-2019年政府工作报告中发现,2017和2018年对
完善的电网总体投资效益评价不仅能对电网规划和投资决策起到重要的指导作用,且有利于电网企业的可持续发展。根据电网投资的实际工作,考虑影响电网供电能力的显性和隐性效益
“双一流”建设作为国家战略,如何对世界一流学科进行评价发挥着重要影响。评价标准作为学科评价的核心要素,是探究不同学科评价的关键。本研究根据托尼·比彻的学科差异理论
近年来,“互联网+”技术与林业领域逐渐融合,林业文本经历小型数据、数据扩展以及数据爆发三个阶段,表现出量级大、难以整合的特性。完成海量林业文本的高效分类,能为以林业文本为主体的相关研究包括林业知识图谱的构建、林业信息的主题推荐算法研究、林业信息的舆情分析等提供科学的技术支持与理论依据。然而,通过相关文献的调研可知,林业文本分类的相关研究进程与当前的林业文本领域需求是不相符的,其不足主要表现在两个方