高维罚模型聚类异方差变量选择

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:f_m_q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,高维聚类的变量选择问题受到了广泛关注。在删除冗余变量的问题上,基于罚模型聚类框架的变量选择算法研究有很大的进展,成为高维聚类变量选择中的重要研究方向。高维罚模型聚类变量选择的关键问题是罚函数的选取。对普通似然函数模型增加罚函数,可以达到删除冗余变量的目的。而如何在删除冗余变量的同时,识别非冗余变量的聚类作用是一个更为普遍的问题。在这个问题上已有的研究只考虑了各类数据同方差的情况,采用的是成对均值的一模罚函数。但在实际数据中,异方差情况是更为普遍的数据现象,而且同方差聚类模型并不适用于异方差数据。本文主要针对异方差数据高维聚类的变量选择问题,提出一种基于混合分布的异方差聚类模型,给出模型的算法。设计数据模拟实验,比较了该模型与同方差罚聚类模型的聚类效果。模拟数据分析结果表明,新模型在异方差数据上有更好的表现。
其他文献
汇率是一国对外和对内经济非常重要的指标,人民币汇率机制的改革是近几年一个研究热点问题。自从2005年7月以来,人民币实行了以市场为基础、参考一篮子货币进行调节的、有管理
随着计算机信息技术和互联网飞速发展,对软件的安全性和可靠性要求越来越高。为尽可能早的检测并消除安全隐患,微软在传统软件工程流程的基础上在软件开发生命周期的每一阶段
金融市场是一个典型的复杂系统,市场的参与者并非完全理性,而是有限理性的,且个体之间的理性程度也参差不齐,他们通过自组织相互作用而涌现出各种复杂的宏观市场现象,如股价的大幅
图像的分辨率表征了图像详细信息的丰富程度。提高图像的分辨率是图像处理及计算机视觉领域研究的重要课题。图像超分辨率复原是提高图像分辨率的方法之一。超分辨率图像复原
考虑到在实际应用中解释变量对被解释变量的影响可能随某些变量变化,变系数模型将解释变量的系数定义为关于某些变量的函数。该模型可以有效地探测数据的动态特征,降低模型偏差
本文主要研究了时标上的随机微分方程的解和边值问题的特征值分别关于方程,边界条件的依赖性问题.  全文共分为四章:  第一章为前言,主要介绍时标上随机动态方程的相关背景.
分位回归方法以其能够全面刻画因变量的分布情况等特点作为构建稳健性的基础,在普通最小二乘估计失效的情形下,相对而言,比经典线性回归——只做出因变量在给定自变量取值后的均
本文主要由四部分组成,第一章主要介绍了分形的产生和现状。第二章中介绍了Sier-pinski块的构造及其Hausdorff维数。作为满足开集条件的压缩自相似映射簇的不变集,给出了一类广
关于稀有事件的抽样一直是统计学家感兴趣的一项研究。以0、1对调查总体单元进行标识,如果调查总体中绝大多数单元标识为0,只有极少数单元标识为1,那么标识为1的单元被称为稀
Randic指标、和谐指数以及两类Zagreb指标和Zagreb离心率参数都是化学和数学领域里非常重要的指标. RandiC指标是应用广泛的分子结构指标,定义为:R(G)=∑Uv∈E(G)(d(u)d(v))-1