【摘 要】
:
本文主要研究的内容为模糊聚类算法在含噪声数据集和非均衡数据集上的应用。随着科技的不断发展,聚类分析已经在许多领域得到了广泛的应用,如:数据挖掘、图像分割、模式识别、药物分析、机器学习等。根据数据的集聚规则,聚类分析大致可分为基于划分、基于层次、基于密度、基于网格几种类型,其中,模糊聚类作为一种基于划分的聚类算法因其简单的数学模型、易于解释的优点得到了最为广泛的应用。但是模糊聚类算法模型本身存在缺陷
论文部分内容阅读
本文主要研究的内容为模糊聚类算法在含噪声数据集和非均衡数据集上的应用。随着科技的不断发展,聚类分析已经在许多领域得到了广泛的应用,如:数据挖掘、图像分割、模式识别、药物分析、机器学习等。根据数据的集聚规则,聚类分析大致可分为基于划分、基于层次、基于密度、基于网格几种类型,其中,模糊聚类作为一种基于划分的聚类算法因其简单的数学模型、易于解释的优点得到了最为广泛的应用。但是模糊聚类算法模型本身存在缺陷性,具体表现在:(1)、算法对含有噪声的数据集鲁棒性较差。(2)、算法假设数据同分布的缺点导致其对数据集的方差和数据容量大小也很敏感,无法很好地处理非均衡数据集。本文就这些问题进行了细致的研究和分析,在他人研究的基础上,提出了一些自己的解决办法,具体工作如下:1.现实生活中的数据大多存在噪声点和离群点,这些异常数据点的存在会影响聚类效果。但普通聚类分析中的噪声界定,没有明确的定义,基于此,本论文首先从噪声的界定出发,分析异常样本点对聚类结果的影响,据此研究噪声的判别机制。分析数据点的可靠性,提出了基于可靠性的鲁棒模糊聚类算法(RRFCM)。算法相较于传统模糊聚类算法只考虑数据点与聚类中心的关系,引入了局部近邻约束项,考虑了数据点与周围数据点的关系,与相应的算法作对比,算法无论在人造数据集,还是真实数据集上都取得了不错的聚类效果。2.针对离群点的存在,它们会影响目标函数的稳定收敛值,因此我们还提出了一种基于L2p范数的鲁棒模糊聚类算法(RFLCM-L2p),通过p范数的引入,给距离较远的数据点较大的惩罚,来降低它们对其他数据点的拉扯力,从而降低它们的影响。3.现实生活中的数据多数存在非均衡性,例如网络欺诈链接,病例分析中的正常数据与异常数据等。模糊聚类(FCM)对此类数据较为敏感,通常无法得到很好的聚类效果,错误的聚类同时又会对决策带来较大的误判,因此有必要通过改进模型提高算法的精度。在该部分中,我们从数据的不均衡度出发,分析非均衡数据集对聚类结果的影响,以及现有在非均衡数据集上比较流行的算法。4.此外,文章对提出的两种模型都设计了相应的优化方法,并进行了复杂度分析和收敛性的分析。
其他文献
随着《普通高中英语课程标准(2017版)》的正式颁布,对高中学生的英语写作能力提出了更高要求。新课改背景下,英语写作课堂需要注入新的理念、新的教学模式。然而目前高中英语教学中,依然普遍存在传统的“命题—写作—批改—讲评”的写作教学模式等突出问题。本研究以泉州某一级达标中学高一年级的学生、教师为研究对象。以学习共同体理论为基础,研究前期借助文献分析法、问卷调查法及访谈等研究方法,试图了解当前写作教学
本文旨在研究高中英语教科书中的中国形象及其内涵,采用定量与定性相结合的方法对人教版必修系列教材全三册进行研究。笔者借助于语料库,以比较文学形象学和批评话语分析作为理论基础,通过两个视角和三个主题切入教科书中的中国形象,即“以己观己”和“以他观己”两个视角,和“人与自我”、“人与社会”、“人与自然”三个主题语境。在“中国形象”的占比上,通过定量研究发现,国家形象相关的文本在全书中所占比例较高,且在三
神经网络是一种复杂动力学行为的非线性系统,经过不断的发展和完善,已被成功应用到人工智能、计算机科学、图像处理等科学领域.脉冲控制因其控制量小,控制成本低等优点,近年来脉冲神经网络的动力学问题引起了学者们的广泛关注,尤其是脉冲神经网络的稳定性问题得到了深入的研究.然而在时标上的脉冲神经网络和高阶脉冲神经网络策略尚未得到充分关注,相关工作有待进一步深入.本文在已有成果的基础上,研究了几类神经网络的稳定
近年来,复杂网络模型的一致性和同步被广泛应用到众多领域,受到了国内外学者们的持续关注.其中,多智能体网络和神经网络作为两类常见的复杂网络模型,因而更是学者们研究的热点.脉冲控制策略因其具有时效性、简单性、低耗能性和非连续性已然被广泛应用于实践中.因此本文主要讨论了基于脉冲控制的多智能体网络模型的一致性和神经网络的反同步问题.本文通过引入脉冲控制器讨论了多智能体网络系统的一致性和神经网络的同步性问题
随着“一带一路”战略的深入推进,我国与沿线国家之间的贸易往来愈发频繁,这使得国际货物贸易对“一带一路”国际物流通道的建设提出了更高的要求。对于托运人在进行“一带一路”国际物流通道选择时的内在机制进行研究,有助于了解托运人对于“一带一路”国际物流通道的实际需求,为“一带一路”国际物流通道网络的发展与优化提供可靠的依据。目前,对于国际物流通道选择的相关研究中,在进行建模时往往只考虑物流费用、物流时间等
中华传统节日文化是在漫长的历史发展过程中,由劳动人民共同创造的,蕴含着丰富的文化内涵,是中华民族几千年来的智慧结晶。于小学语文教学中传承中华传统节日文化,具有巨大的价值。可在当下的小学语文教学中,传承中华传统节日文化的情况却不容乐观,仍存在着不少的问题。本研究以传承中华传统节日文化为导向,探索如何在小学语文教学中更有效地传承中华传统节日文化。本研究共分为五个章节。第一章,笔者从研究缘起展开介绍,接
近红外光电化学(NIR PEC)分析是利用近红外光照射下,光电活性材料与目标物作用后导致的光电流/光电压的变化,实现对目标物测定的一种分析方法。它不仅具有PEC方法中背景信号低、灵敏度高、仪器易微型化的优点,而且可以结合近红外光生物相容性好、穿透能力强的特点,在食品安全快速检测领域有很好的应用前景。本论文以水产品中的生物毒素为主要研究对象,利用硫化银(Ag2S)立方体(NCs)及量子点(QDs)的