【摘 要】
:
在自然科学和社会科学中,存在很多划分问题。随着科技的发展,人们对划分的要求也在不断提升。仅凭经验和专业知识难以准确划分,而划分问题最主要的研究分支是聚类算法。它是把相近的样本归为一类,将差别大的元素划分在不同类。本文研究了各种经典的聚类算法,其中基于密度的带噪声应用空间聚类(Density-Based Spatial Clustering of Applications with Noise,DB
论文部分内容阅读
在自然科学和社会科学中,存在很多划分问题。随着科技的发展,人们对划分的要求也在不断提升。仅凭经验和专业知识难以准确划分,而划分问题最主要的研究分支是聚类算法。它是把相近的样本归为一类,将差别大的元素划分在不同类。本文研究了各种经典的聚类算法,其中基于密度的带噪声应用空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)和近邻传播聚类(Affinity Propagation Clustering,AP)是重点研究的内容。由于聚类算法简单、高效,它在图像分割中得到广泛应用。本文将改进后的AP算法应用到纹理图分割中,得到了较好的分割结果。具体研究内容如下:(1)针对DBSCAN聚类算法对邻域半径参数值依赖性强的弊端,提出拓扑相似性的DBSCAN聚类算法(TS-DBSCAN)。TS-DBSCAN算法在DBSCAN算法基础上,建立两个函数:Cluster函数和Combine函数。Cluster函数的操作包括三步:首先,通过数据的平均距离权重获得数据集的聚类中心;其次,采用拓扑相似度获取每个聚类中心所对应的参数值;最后,借助获取的聚类中心和参数值对数据集进行初步聚类得到多个小簇。Combine函数用密度可达和密度相连将小簇合并,得到最终的聚类结果。仿真实验得出,相比于其他聚类算法,TS-DBSCAN算法的归一化和准确率的平均值分别提升了6%和8%。(2)针对AP算法不能识别非凸数据、对偏向参数Preference值依赖性强的缺点,提出了基于万有引力的自适应近邻传播聚类算法(GA-AP)。该算法在传统AP算法的基础上,采用万有引力计算数据间的相似性(引力),并利用信息熵和自适应增强(Ada Boost)算法获得每个集群中的正确集群采样点和错误集群采样点的权重,从而降低算法对参数Preference的依赖,并减少错分样本点的数量。仿真实验得出,相比于其他聚类算法,GA-AP算法的归一化和准确率的平均值均提高了6%。(3)将GA-AP算法应用于纹理图像分割中。实现过程包括图像预处理、特征提取及聚类三个阶段。采用人造图像和Brodatz纹理图像进行对比实验表明,与其他传统算法相比,GA-AP算法分割的准确率较高。
其他文献
新城疫病毒(Newcastle disease virus,NDV)微基因组(Minigenome,MG)保留NDV聚合酶识别的关键部位,病毒基因组其它位置用荧光报告基因替代,其转录依赖于NDV RNP复合物的NP、P和L蛋白。这种基因组成结构类似于缺陷病毒基因组(Defective viral genomes,DVGs),即病毒基因组在复制过程中由于其聚合酶的低保真性,导致基因组部分缺失,但保留
随着数字时代的到来和信息技术的发展,多媒体工具得以广泛应用,使得人们可以很方便得对图像、视频进行编辑,但如果恶意篡改图像出现在一些重要场景中,如杂志、医学、法律等领域,将带来严重后果。复制粘贴篡改检测技术作为取证领域的重要分支,通常在一幅图像内提取特征后建立特征矩阵并匹配,图像区域经过复制粘贴操作后具有相似性,因此根据匹配结果的相似性可定位出篡改区域。本文对现有的复制粘贴篡改检测技术进行研究,针对
禽戊型肝炎病毒(avian Hepatitis E virus,a HEV)是鸡的大肝大脾病(Big liver and spleen disease,BLSD)和肝脾肿大综合征(Hepatitis-splenomegaly syndrome,HSS)的主要病原。该病毒主要引起蛋鸡和肉种鸡的死淘率升高和产蛋率下降。发病鸡通常腹部充血,卵巢退化,肝脏出现脂肪或淀粉样变性,严重影响了养殖业的发展。针对
鸽圆环病毒(Pigeon circovirus,PiCV)属于圆环病毒科,圆环病毒属。病毒含有两个主要的开放阅读框,分别编码核衣壳蛋白(Capsid protein,Cap)和复制相关蛋白(Replication associated protein,Rep)。单纯的PiCV感染几乎没有临床症状,但能引起严重的免疫抑制,导致机体对病毒、细菌、真菌和寄生虫等各种病原体的免疫应答不足,进而引起严重的继
为了满足许多不符合银行标准而无法从银行获得贷款的客户需求,基于互联网的商业模式P2P借贷(Peer-to-Peer Lending)迅速兴起,已成为一个快速发展的金融平台,吸引了许多借款人和投资者。随着发展规模的日益扩大,信息过载使得投资者决策陷入困境。目前,已有面向P2P借贷个性化推荐的研究主要是将传统的个性化推荐方法应用到P2P借贷平台,然而P2P借贷推荐中的一些特有的性质使得该问题有别于传统
猪圆环病毒2型(PCV2)是单股负链环状DNA病毒,基因组长度1 767~1 768 bp,病毒粒子呈二十面体对称结构,无囊膜,病毒粒子大小约17 nm。PCV2导致猪免疫系统损害和抑制,严重损害猪的健康,并常继发或混合感染其他病原体,造成更为严重的损害。对PCV2的致病机制的揭示有助于更好的做好防控工作,对病毒编码产物的鉴定和功能研究是揭示PCV2致病机制的基础。生物信息学分析发现,PCV2的基
随着云计算技术的发展和网络安全知识的普及,数据隐私安全已经成为用户关注的重点。然而,用户直接上传密文数据到云端会使云服务器面临数据检索困难的问题。可搜索加密技术允许用户直接检索密文数据,满足了用户在云端存储和检索加密数据的需求。但是在传统公钥密码环境中,可搜索加密方案普遍存在证书管理和密钥托管问题,并且容易遭受来自系统内部或外部恶意攻击者发起的离线关键词猜测攻击。在医疗数据共享应用环境下,由于医疗
以全球变暖为主的气候变化对荒漠草原生态系统产生着强烈的冲击,荒漠草地生态系统因其自身的敏感性在探讨全球气候变化、碳元素生物地球化学循环及分析全球碳收支平衡等领域占据重要地位,明确荒漠草地生态系统与气候变化之间的相互作用关系,对于了解草地生态系统结构、功能,评估草地生态安全具有重要意义。本文选取内蒙古准格尔旗温带荒漠草原作为研究地点,使用CENTURY模型分析过去二十多年准格尔旗温带荒漠草原草地地上
医疗数据共享能够提高患者治疗的准确性,促进医疗研究机构的发展。然而,在医疗数据共享过程中存在一些安全问题。首先,患者可能会因为不同的症状去不同的医院就诊,导致医疗数据分散存储在不同的医疗机构,使患者失去对医疗数据的控制,不利于医疗数据共享。其次,医疗数据包含患者的敏感信息,若患者授权医疗机构将医疗数据外包给云服务器存储,当遭到恶意攻击时,容易引发数据篡改和隐私泄露等问题。最后,恶意的医疗机构和半可
小反刍兽疫(Peste des petits ruminants,PPR)俗称羊瘟,是由副黏病毒科(Paramyxoviridae)麻疹病毒属(Morbolivirus)的小反刍兽疫病毒(Peste des Petits Ruminants virus,PPRV)引起山羊、绵羊等小反刍动物的一种急性病毒性传染病。该病以急性胃炎、支气管肺炎、肠炎和怀孕母羊流产为主要特征。目前,该病在许多国家已经成为