基于Gamma-检验的聚类分析新度量及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:fengyufengsc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在聚类分析的介绍中,随机变量的聚类方法研究的比较少.到目前为止,以香农信息理论和kolmogorov信息论研究的比较多.同时这些方法也被广泛应用于随机变量的聚类分析.本文作者在分析Gamma-test的方法时,发现该方法可用来定义一种新的度量,同时可应用于聚类分析中,得到理想的结果.本文一共分五章:第一章用了一些篇幅介绍了当前已知的聚类分析的方法.现今的聚类方法主要集中在两大块:一是对样品聚类的方法,另一种是对随机变量聚类的方法.前者的研究已经很深入,得到许多聚类的方法,而且聚类结果也很出色.然而,对随机变量的聚类这一块的研究进展还不是很快.关键问题在于比较难找到对两个随机变量的关系的度量.很原始的就是用相关系数来度量两个随机变量的关系.随后研究比较多的是通过香农信息论的方法或者kolmogorov的信息度量方法来度量两个随机变量的方法.信息论的应用总的来说是成功的.本文也会在第二章中介绍该方法的一些理论根据,用来和本文提出的新方法的比较.在第三章中,本文提出由Gamma-test得到的新的距离,并给出了计算机上实现的编程思想.第四章中,作者运用一组模拟数据,通过新定义的度量来进行聚类,同时把得到的结果与用相关系数的方法得到的聚类结果进行比较.最后在第五章中,本文讨论了对该新度量能够继续深入研究的地方.在新定义的度量下,本文给出了计算机的程序实现.程序代码详见附录Ⅰ.附录Ⅱ为用统计软件产生随机变量的各100个随机数.附录Ⅲ为九个随机变量以相关系数为度量的相似系数矩阵.附录Ⅳ为九个随机变量以新度量为度量的相似系数矩阵.
其他文献
旅游产业是当今世界发展最快、最具潜力的朝阳产业之一。促进旅游服务贸易的发展,可以增加服务贸易外汇收入,平衡国际收支,保持经济健康运行,还可以创造更多的就业机会,带动相关产业的发展,增进我国与其他国家之间的友谊和交流。因此,研究中国旅游服务贸易的国际竞争力及其影响因素,促进我国旅游服务贸易更好更快地发展,具有很高的实际价值。本文运用波特钻石模型,采用SWOT分析法,构建了多方程的向量自回归模型,坚持
目的通过检测miR-331-3p在胰腺癌(PC)病人的血浆、手术切除的癌组织、PC细胞系中的表达,阐述miR-331-3p对PC细胞增殖、迁移及侵袭能力的影响及潜在的分子机制。方法1.征集5种
默沙东保持多年的如玉之 身终于失守了。9月30日,这家全球第三大制药公司宣布召回消炎止痛药“万络”。有研究表明,患者服用该药18个月后患心脏病和中风的危险增加。这是该公
在采访中,我们发现一个有趣的事实:实际上,政策制定和审批部门的研究人员对汽车产业的理性判断,对政策的实质影响极微。各种力量的参与使得政策变得越来越复杂
发展水下机器人技术是目前人类探索海洋深处秘密的重要途径,也是实现我国海洋强国战略的重要途径。复合型无人潜水器(ARV,Autonomous&Remotely-operated Vehicle)综合了ROV(R
山东是我国重要的小麦产区,2017年小麦总产量占全国的19%,为全国的小麦产量第二大省。同时小麦产业也是山东省促进农村经济发展,维系城乡居民收入稳定的重要产业。在农户从事小麦生产经营活动中,不仅会遭受因自然灾害频发导致减产的风险,而且也会面临小麦价格波动导致的风险损失。我国基于保障农民的产量风险和价格风险,开展了政策性农业保险试点以及出台了一系列农产品价格支持政策,这些风险管理工具为山东省小麦产量
散射是研究水声传播中多种现象的重要基础。结合经典的Kirchhoff近似和微扰方法,本文研究了小斜率近似方法用于计算海面及Biot模型下的非相干散射,详细推导了将该方法应用于
目的:研究早期康复护理对脑卒中患者机体恢复的作用。方法:选取收治的117例脑卒中患者作为研究对象,随机分为实验组60例和对照组57例,实验组给予早期康复护理,对照组给予常规
有一个非常流行但从未有数据印证的说法是这样的:中小学到大学中的班级上,考试成绩较好的学生将来适合做干部,成绩最差的学生适合当个体户,而中间的学生适合当职业经理或者专
如何使中央有能力维护统一性,又让地方以自主性来实现良好的地方治理,这一数千年来困扰中国政治的一个关键难题如今再次求解