基于改进RNA遗传算法的聚类分析研究及应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:hquyuer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展和大数据时代的到来,数据资源呈爆炸式增长,数据处理离不开数据挖掘,而数据挖掘中非常关键的工具即为聚类分析,它作为数据挖掘的主要工具,已经活跃在各大领域。目前已经出现了很多聚类方法,但是每一种聚类算法都不是十全十美的,仍有可以改进的空间,除了可以对算法本身进行改进之外,还可以运用一些特定的优化算法来进行优化,弥补算法本身的缺陷和不足。所以,本文选择了当前应用比较广泛的两种聚类分析方法,模糊 C 均值聚类(FCM)和密度峰值聚类(DPC),作为主要的研究内容,并且借助了RNA遗传算法(RNA-GA)来对这两种聚类算法进行了优化,以下为本文的主要研究工作。  提出了一种自适应的RNA遗传算法(ARNA-GA)。在新的选择操作中,引入了惩罚系数d,保证种群中后d%的个体不会留存至下一代,从而引导解空间向最优解空间靠近;设计了新的交叉操作和变异操作,改进了 RNA-GA 中的单一操作;针对交叉和变异操作,设计了自适应策略,即引入相异度系数的概念,在判断个体差异较大时进行交叉操作,相反,进行变异操作,可减少算法的计算量,防止出现冗余操作,提高收敛速度。最后,用四个标准测试函数对算法的性能进行了评估,证明了算法的有效性。  提出了一种基于自适应 RNA 遗传算法的核模糊 C 均值聚类算法(ARNAGA-KFCM)。首先,提出了一种核模糊C均值聚类算法(KFCM),即引入高斯核函数来替代原始FCM 中的距离计算方法,改善了 FCM对孤立点和噪声点敏感的问题;将新提出的ARNA-GA 和 KFCM 进行结合,用改进的ARNA-GA来优化模糊C均值聚类的初始聚类中心,然后再运用KFCM算法来执行聚类,打破了原始 FCM 聚类算法受初始聚类中心影响的问题,并且因为RNA-GA本身就是一种带搜索策略的寻优算法,可以指导FCM算法跳出局部最优。最后,用四种UCI数据集验证了ARNAGA-KFCM的有效性,通过和FCM、KFCM进行对比,证明了本文新提出算法的优越性。  提出了一种基于自适应 RNA 遗传算法的K 近邻密度峰值聚类算法(ARNAGA-KNN-DPC)。首先,改进了DPC算法,采用了 K近邻的思想,改善了原算法中局部密度ρi的计算,使得局部密度的计算不再受截断距离dc的影响;将新提出的自适应RNA遗传算法和基于K近邻的密度峰值聚类算法进行结合,用改进的RNA遗传算法来寻找局部密度ρ和相对距离δ的阈值,因为根据  密度峰值聚类的思想,ρ值和δ值均大的点才是聚类中心,根据ARNA-GA寻优的阈值,我们可以很容易的确定出聚类中心,解决了原始DPC算法确定聚类中心困难的问题。最后,用 UCI 数据集和合成数据集验证了算法的性能,并且和当前比较热门Min_Max_SD以及K-means进行了对比分析,证明了本文提出的ARNAGA-KNN-DPC算法的有效性。  本文提出的算法是从理论可行性的角度出发,提出了算法的改进思路,并且通过MATLAB仿真实验证明了算法的有效性;从应用的角度出发,将本文提出的ARNAGA-KFCM算法应用到文本分类的实验中,其中,文本取自搜狗实验室的真实数据库,结果证明,本文提出的算法不仅在理论上是可行的,在应用上也能收获很好的效果,有一定的实用价值。
其他文献
在Web2.0时代,社会化媒体是用户获取信息的渠道,更是用户发布内容和建立关系的平台,相比传统媒体,其在信息内容多样性和信息传播实时性上已表现出显著优势。作为社会化媒体中一种
以往研究指出,工作压力源是影响组织承诺的重要因素,而对于工作倦怠在工作压力源影响组织承诺过程中所扮演的角色作用的认识,存在不同的观点;一些研究发现工作倦怠是中介变量,而另
期刊
本文通过对荣华二采区10
在初中数学教学中,教师要坚持创新的教学理念,设计多样化的教学方式,灵活运用教学内容和多媒体资源,激发学生的学习内动力,让他们对数学知识产生好奇心,主动投入思考和探究中
期刊
期刊
本文提出了侧向地震动作用下高压输电塔一导线耦联体系土体-桩-结构相互作用分析的力学模型,推导了运动方程,编制了计算程序,并对某一具体的输电塔进行计算,按考虑与不考虑相互作用
高中数学核心素养是学生适应个人终身发展和社会发展需要的人的思维品质与关键能力,通过课堂教学,提升学生数学解答能力,使学生综合素养得到全面提升.数学学科是高中学习中的
针对产教融合过程中的校企合作协同育人特点,开展依托地方产业优势的“岗位职业能力需求”教学改革探索和实践,使高职机械类专业课程教学与实训实践环节更趋岗位化、企业化、
相较于小学数学,初中阶段的数学教学更注重对理论知识的任务,而学生的理解能力是确保其能够充分掌握理论知识的重要基础前提,若在学习数学的过程中学生无法学会对数学知识进
期刊