基于混合多指标信息的聚类分析

被引量 : 0次 | 上传用户:zjz_hi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
所谓聚类是指按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内相似性尽量大的一个无监督学习过程。聚类分析在经济管理及工程等许多领域有大量的实际背景。在聚类分析中,如果聚类信息(一般指聚类对象特征指标值或相似矩阵以及指标权重)是精确数值的,那么相关的聚类分析方法具有十分丰富的研究成果。但在许多实际问题中,由于被聚类的信息估计不精确或测量的误差以及人为判断等原因,常常以区间数、三角模糊数、语言短语以及不完全信息等这些不确定性信息的形式出现,针对具有不确定性信息的聚类分析问题的研究也有了一些研究成果。但这些研究大多要求聚类信息是同一种形式的信息,而由于聚类问题的复杂性,聚类对象的指标中可能包含有多种形式的信息,针对特征指标值包含确定性信息或多种不确定性信息在内的混合多指标信息聚类分析问题更贴近现实情况,目前,这方面的研究还很少。因此,对此类问题的研究,无论是在理论方面,还是在应用方面,都具有重要的意义。为此,本文针对具有混合多指标信息的聚类分析问题,进行了相应的理论与方法研究。本文首先对混合多指标信息的概念做了定义并对这方面的研究进行了综述,然后介绍了聚类分析的相关知识。提出了基于对部分聚类样本类别判定的混合多指标信息聚类分析和基于组合相似度的混合多指标信息聚类分析两种聚类分析方法,前一种方法是为了通过对部分聚类样本的类别判定来合理地诱导出指标权重,后一种方法是通过构建组合相似度来提高聚类的准确性。在论文最后,总结了本文的研究成果和结论,同时也指出了需要进一步研究的工作。
其他文献
滚切斜齿圆柱齿轮时,传统的人工查表方法往往不易找到能满足精度要求的挂轮。本文介绍了一套比较实用的挂轮计算方法,可方便地计算出高精度挂轮的优化齿数。
<正>最近习近平主席在中央政治局会议上首次提出"绿色化"发展的概念,结合湖北麻城石材产业的发展,有必要从"绿色化"的角度说说如何发展的问题。一、科学开发本地资源,加快整
目的研究“双固一通”灸法对糖尿病周围神经病变(DPN)模型大鼠的血糖、坐骨神经传导速度及神经生长因子NGF蛋白表达的影响,从神经营养素家族对损伤神经的再修复方面探讨艾灸
学校是培养人才的地方,校园的安全问题不仅关系到学生自身的健康成长,也影响着众多的家庭,影响着整个社会的安定和谐,校园综合安防系统必然成为人们关注的焦点,而校园电子巡
教师专业发展是当今世界教育改革发展的重要课题。近年来,教师专业发展逐渐被提升为教育改革的中心和核心要素,甚至被视为是学校与教学革新的心脏。我国自2001年开始的新一轮
心脏病是危害人类健康的主要疾病之一,世界范围内,每年将近三分之一的死亡是由于心脏病引起的。因此如何预防和治疗心脏病是当今热门的研究领域。心电图是从人体体表记录的心
目的:研究华蟾素对骨癌痛模型大鼠背根神经节(DRG)细胞L型电压门控钙通道(L-VGCC)电流的调制作用。方法:于SPF级雄性SD大鼠胫骨内注射Walker256乳腺癌细胞构建骨癌痛模型。急
从世界范围来看,产业集群化已是一个非常普遍的现象,国际上有竞争力的产业大多是集群模式。产业集群对区域经济发展和提升区域经济竞争力起着重要的促进作用。发展较好的工业
空调制造企业持有库存原因多种多样,库存较多必然会对企业流动资金、库存管理、人员调配等造成一定影响,导致企业出现一定程度成本浪费,空调制造企业应认识到库存管理重要性
作为材料的组成物质或增强相,天然竹纤维本身的力学特性和变异程度却很少为人所知。作者以毛竹(Phyllostachys edulis)纤维细胞为主要研究对象,使用纳米压痕技术、单纤维拉伸