粗糙模糊聚类算法及其应用

来源 :北方民族大学 | 被引量 : 0次 | 上传用户:llw88636108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在是大数据时代,任何行业都会有大量的数据产生,怎样从这海量的数据中挖掘出有用的信息,是我们面临的巨大挑战。而高效的聚类算法,是挖掘到有用的信息的重要手段,也是目前研究的热门课题。在众多聚类算法中,模糊聚类采用模糊数学对事物进行描述和分类的方法,近年来颇受国内外学者的关注。论文的重点工作概括如下:(1)本文的前期工作中,对模糊聚类算法和粗糙集理论做了调研。模糊聚类根据样本间的特征、相似性建立模糊相似关系,对客观事物进行聚类,可以有效地处理不精确问题。但如果样本量较大时,要获得聚类结论就会有一定的困难,且容易陷入局部最优,而粗糙集理论则可以对模糊聚类的这两个缺点进行改进。(2)本文利用粗糙集理论,从上、下近似逼近的角度,在保持分类能力不变的前提下,通过对上近似集中的样本,进行边界域划分,借助上、下近似集中的样本对隶属度的影响,更新隶属度矩阵和类中心,使其每次的迭代结果更加精确,从而提高聚类的效率。利用粗糙集的思想,在模糊聚类的基础上提出了粗糙模糊聚类算法。本文使用java语言在eclipse上实现了该算法,并在UCI数据集上对所提出的算法展开了对比科学实验。实验表明,引入上、下近似后,聚类的准确率较之前有所提高,改进后算法的目标函数收敛更快,并且更稳定,比改进之前的算法更适合处理样本较多的高维数据集。(3)采用粗糙模糊聚类的方法,设计了一个车牌识别系统。利用改进后的聚类算法,有效提高了车牌字符识别的准确性能,可以对车牌的汉字、数字和字母进行识别。实验表明,RFCM算法能够有效地识别车牌。
其他文献
目的分析老年高血压患者短时血压变异性的危险因素。方法回顾性分析2018年12月—2020年3月期间大余县人民医院收治的60例老年高血压患者的临床资料,比较不同特征老年高血压患者短时血压变异性(舒张压变异性、收缩压变异性)情况,并分析可能导致老年高血压短时血压变异性的危险因素。结果病程≥3年、血脂异常、IMT增厚均是老年高血压24 h舒张压、收缩压血压变异性的独立危险因素(P<0.05)。结论老年高
学位
量子双体系统是量子信息与量子计算的基本量子体系,作为少体量子体系,其热力学与统计力学性质是至关重要的。我们研究了这样量子双体体系的非平衡热力学和统计力学性质,尤其揭示了其内在的演化规律和物理量相关规律。为此我们首先构建出量子双体体系的哈密顿模型,该系统的子系统为非平衡态的外驱系统,借助这样一个模型我们给出了双体系统下主方程的表述形式,也进一步得到了描述演化性质的转移率矩阵所满足的性质,这些结果与单
学位
市域社会治理现代化是国家治理现代化的重要组成部分,是国家治理现代化在市域范围内的具体体现。市域社会治理从概念提出到试点推进的时间非常短暂,它既存在理论支撑薄弱问题,又存在实践探索缺乏经验借鉴的问题。基于此,本文从市域社会治理的主体构成与功能定位、工作布局与职责界定、方式融合与技术支撑三个方面,试图弄清楚"谁来治理""治理什么""如何治理"三个结构性问题。推进市域社会治理现代化,一是理顺主体间关系,
量子计算,作为二十一世纪中的一项新热门技术,无论是在计算速度还是计算能力方面,它都是明显优于经典计算机。但是,量子计算在处理量子信息的过程中,相应的量子系统需要保持一种稳定的相干性,而这种相干性会因为量子体系与环境之间发生不可避免的相互作用而受到破坏。所以,如何创造一个无消相干子空间以克服消相干的影响已成为制造量子计算机的关键之一。本文主要研究了两种无消相干子空间:绝热子空间和芝诺子空间,我们首先
线上教育打破了传统意义上的学习方式,为中国高校教学改革带来了新方向。为适应互联网时代下新的教学方法,北方民族大学于2015年开始了首次线上教学的尝试,它是宁夏回族自治区第一所实行线上教学的高校。但是由于北方民族大学现有教学平台在个性化教学和智能化组卷考试方面功能不完善等原因,导致北方民族大学在线上个性化教学和智能化组卷考试方面产生了一些问题。为解决北方民族大学线上教学中存在的问题,实现线上教学系统
目的:非小细胞肺癌(non-small cell lung cancer,NSCLC)是肺部恶性肿瘤之一,病理类型多为肺腺癌和肺鳞癌,预后较差。Notch信号通路在机体发育中起着重要作用,研究表明Notch基因既是原癌基因又是抑癌基因,与NSCLC的肿瘤发生、发展和免疫耐受相关。近年,研究发现快速的有氧糖酵解保证肿瘤快速增殖的能量供给和生物大分子合成的原料供给,是肿瘤细胞的代谢特点之一。在前期研究
结直肠癌(colorectal cancer,CRC)是最常见的消化道恶性肿瘤之一,长期危害人类健康。《中国大肠癌流行病学及其预防和筛查白皮书》显示,中国CRC的发病率居恶性肿瘤发病率第3位。然而,与CRC发生发展相关的机制仍然不清楚。因此,寻求潜在的治疗标志物对提高CRC生存率有着非常重要的意义。本文通过癌症基因组图谱(TCGA)数据库分析发现位于人类7q31号染色体上的无翅相关集合位点家族2号
背景脓毒症是临床上发病凶险和致死率高的常见并发症。内毒素耐受是机体应对脓毒症的一种重要的内源性保护途径。丙酮酸激酶M2(pyruvate kinase M2,PKM2)是糖酵解途径的限速酶,PKM2有三种构型:单聚体、二聚体和四聚体。研究发现单核巨噬细胞在脂多糖(lipopolysaccharide,LPS)的刺激下,促进PKM2四聚体(位于胞浆)向单/二聚体(位于胞核)转变,通过诱导单/二聚体P
让机器理解人类自然语言是人工智能领域一个长期的目标,其中如何衡量机器是否理解自然语言本身也是一个难题。作为智能问答的子任务,机器阅读理解是指给定一段非结构化文本和相应的问题,机器阅读文本后给出问题答案。因为机器解题过程中需要隐式完成很多自然语言处理中的底层任务才能给出正确答案,所以机器阅读理解任务非常适合用来评估机器对于自然语言的理解能力。无论在学术研究还是在实际应用中,机器阅读理解都有着重大的价