数据挖掘中聚类中心问题的光滑化和填充函数方法

来源 :上海大学 | 被引量 : 0次 | 上传用户:yangyugui888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类中心问题是数据挖掘中一类重要问题,它可以定义为在整个空间中的无约束全局最优化问题.由于这类问题在信息获得,文件获取及图象分块等生产和生活中有着十分广泛的应用,因此研究聚类中心问题的算法具有重要的现实意义.本文所讨论的聚类中心问题可以描述如下: (P)minf(x1,…,xq)=1/m∑mins=1,…,q‖xs-ai‖2,s.t.x=(x1,...,xq)∈Rn×q.这里,x1,…,xq是q个要求的聚类中心,m是数据个数,ai∈Rn是数据库中的第i个数据. 由于目标函数f(x)是非凸非光滑函数,所以问题(P)是非光滑全局优化问题,设计求解(P)的全局最优解的算法具有极大的挑战性.本文根据问题(P)的结构特点,提出了先利用光滑化方法将f(x)用光滑函数逼近,然后对光滑化问题利用填充函数搜索其全局最优点的方法.我们对不同的数据库进行了数值试验,数值结果表明,本文提出的算法对求解问题(P)是可行和有效的. 本文总共分为四章,第一章简单地介绍了数据挖掘及聚类的概念,以及聚类中心问题的模型.第二章简单介绍了求解聚类中心问题的现有算法:分层聚类算法,分块聚类算法,k-最临近算法,进化算法以及模拟退火法等等.第三章是本文的主要结果,我们提出了一种新的光滑化和填充函数方法求解聚类中心问题,并给出了数值试验结果.第四章总结了本文的主要结果并对未来的研究进行了展望.
其他文献
湖北海棠,属双子叶植物纲、蔷薇科、苹果属乔木,高达8m;小枝最初有短柔毛,不久脱落,老枝紫色至紫褐色;冬芽卵形,先端急尖,鳞片边缘有疏生短柔毛,暗紫色,果实椭圆形或近球形,
期刊
分布式发电系统具有发电方式灵活,对环境友好,能源利用率高等优点。并网逆变器作为可再生能源与电网之间的能量交换接口,在分布式发电系统中占有核心地位。当实际电网为非理想情况时,接入公共并网点的逆变器并网电流将会出现明显的不平衡和谐波现象,电能质量变差。因此,非理想电网条件下并网逆变器电流控制策略研究意义十分重大。本文研究非理想电网条件下三相LCL型并网逆变器电流控制策略。本文首先建立了三相LCL并网逆
21世纪是以数字化为特征的知识经济时代,“数字清江”项目正是为了适应信息时代的发展要求,加快企业的信息化进程,服务清江流域开发而提出的。作为其中的一个子系统,清江防洪
本文通过对荣华二采区10
工业实时监控系统是目前研究的热点之一,也是实现设备安全生产、提高设备管理水平的技术手段之一。论文以某进口散货船的监控系统为研究对象,目的是应用两门子PLC的网络通信技
<正>作为二十世纪最有影响力的画家、雕塑家和一位时代图像的创造者,毕加索同时也是最具创意的版画家之一—尤其是在二十世纪三十年代,这样一个前所未有的,贯穿着艺术家个人
南京博物院藏民俗文献资源十分丰富,主要包括明清时期的民间歌谣、词牌令等,还有各种木刻年画、刻纸、剪纸、广告画等一系列具有民俗特征的文物近万件。其中木刻年画藏品数千
随着能源危机和环境污染的日益严重,节能而又环保的电动汽车(EV)变得越来越普及。车载DC-DC变换器作为电动汽车中高压动力电池和低压蓄电池之间的桥梁,对高效率和高功率密度的要求越来越高。氮化镓功率晶体管(GaN)具有开关速度快、寄生参数小、电气性能优越等优点,因此对提高车载DC-DC变换器的功率密度具有显著的优势。本文首先针对车载DC-DC变换器输入电压范围宽、输出电流大的特点,对几种常用拓扑进行
传统整流器采用二极管不控整流或晶闸管相控整流,这些控制方法使得输入电流中混有大量的谐波。这些谐波不仅造成电网的极大污染、影响附近电网谐波敏感设备的正常工作,而且还会对该整流器后面的电力电子装置造成一定的电流冲击和电压波动,降低了系统的可靠性。因此,功率因数校正技术越来越为人们所重视。在功率因数校正技术中,PWM控制技术由于其独特的优越性而蓬勃发展,已经成为了近年来研究的热点。在现行的中大型功率的应
本文研究基于无线通信的风光互补路灯监控系统的设计及其应用。由于风、光照、温度等环境因素具有随机性,所以风光互补路灯就需要有一套完整的监控系统对其参数进行监控。目前市场上流行的监控系统全部使用的是有线网络,但是由于有线网络存在易损坏、成本高等缺点,对路灯系统的扩充和维护都增加了困难。本文提出采用无线GSM网络代替有线网络,研究了无线网络结构、通信协议、网络安全、远程访问方式,以及数据传输速率、传输距