K-means聚类算法在面板数据分析中的改进及实证研究

被引量 : 9次 | 上传用户:dawulitao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的日趋发展以及对行业数据库的不断扩增积累,大数据这个概念近年已经逐渐进入人们的视野。大数据是集合变量多维化、样本多样化特性的复杂数据类型的结合,而正是基于其所包含的复杂化、创新化的信息与知识,使得人们对于大数据的研究越来越热衷。对于大数据研究的一个重点就是大数据挖掘技术的不断发展完善,归根结底,大数据的作用是它所能提供的知识,而并非只是庞大的数据本身。对于大数据的挖掘任务主要总结为描述任务与预测任务。作为同时具有描述功能与预测功能的聚类模式,在数据挖掘的类划分、预处理步骤上发挥重要的作用,因此以数据挖掘的聚类模式作为本文的主要内容,为读者阐述数据挖掘的思想与方法步骤。现代经济学问题中面板数据存在时间维度上的连续性的特性,针对这一特性,本文基于传统的k均值聚类方法,提出一种改进的聚类方法,该方法的创新之处在于:定义了一种新的对象间相似性指标,该定义方法可以同时考察对象间在时间与空间维度上的整体的相似性;按照样本的时间维度分割聚类,得出对象在每一时间段上的归属情况;借鉴隶属度原理,计算对象属于某一类的权值,权值的大小即反映了该对象属于某一类的可能性大小。该创新之处旨在避免以往聚类方法将样本的时间维度特性退化的缺陷,使得具有时间与空间属性的面板数据在聚类分析过程中尽可能多的保留其时间与空间的信息,从而使聚类结果更为准确。相比于传统的聚类方法,改进的方法同时考虑聚类对象在空间上和时间上的发展趋势,在理论上更加适用于面板数据。在本文中,第1章简述大数据与数据挖掘的知识以及面板数据聚类模式的研究意义,在第2章为读者简述多元聚类分析的相关知识,如多元聚类分析的思想原理以及方法步骤等等,在第3章为读者介绍本文所重点研究的改进的面板数据的多元聚类模式,最后将该方法应用于上市公司的股票数据进行实证分析,并与传统的聚类方法进行多个方面的比较与评价。经过验证,利用改进的方法获得的聚类结果从聚类结果的评价角度上来讲是优于传统的方法的。
其他文献
王阳明对佛禅的态度,在其人生的各个阶段有着不同的变化。早年,阳明沉溺于佛教,并不讳言对佛禅的亲近。中年,阳明贬谪贵州,在龙场悟道后,他发出后悔在佛道二教上错用了三十年
目的探讨莫沙必利+奥美拉唑、莫沙必利+雷贝拉唑应用于老年反流性食管炎治疗中的实际价值。方法随机选择2016年8月至2018年12月本院收治的老年反流性食管炎患者80例进行分组
<正>前苏联著名作家尼古拉·奥斯特洛夫斯基(1904—1936)虽然只有短暂的一生,但是,他的著名作品《钢铁是怎样炼成的》却赋予了这位伟大的共产主义战士不朽的生命丰碑。《钢铁
肌萎缩侧索硬化症(ALS)是一种累及上下运动神经元及其支配的躯干、四肢和头面部肌肉的一种慢性进行性神经退化疾病。临床一般表现为由下肢感觉障碍开始发展到上肢、躯干等。
在对外汉语教学的四大环节中,教材占据着非常重要的地位,它是总体设计的具体体现,教材的好坏与教学质量有着直接关系。同时在“听”“说”“读”“写”四项技能中,“听”无疑
1980年,由莱考夫和约翰逊编著的《我们赖以生存的隐喻》正式问世。概念隐喻理论的提出打破了传统语言学将隐喻囿于语言研究范围的局面,从人类的思维认知层面揭示隐喻普遍存在
本文以英国环境保护政策发展历史为模型,分析命令控制系统和经济激励机制各自在环境保护实践中的利弊,提出应该综合发挥二者优势,充分发挥各自的有效性和经济性,在达到污染防
在"终身学习" "泛在学习"理念的冲击下,与现代科技相结合、以学习者需求为中心的移动学习逐渐走进人们的视野。国内移动学习研究起步较晚,但发展较快。应用于语言教学的研究
本文以沈机集团昆明机床股份有限公司TKS6111和THM65160两个系列机床的主轴箱(非回转体零部件)为研究对象,结合前人所做研究的共同性以及本课题研究的特殊性(机床箱体类零件