基于改进K-means聚类算法的独立成分分析(ICA)在金融数据挖掘中的应用

被引量 : 3次 | 上传用户:guaodeshanying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
独立成分分析(Independent Component Analysis,ICA)作为近年来迅猛发展的数学挖掘工具,能够有效揭示出数据背后的各种影响因素,自问世以来便受到广泛的关注和应用。本文首先详细介绍了经典ICA模型的各种估计方法的原理,其次结合改进的K-means聚类分析对加入噪声项的数据进行了降噪预处理,最后将改进的K-means聚类算法与Fast ICA算法结合应用到某只股票数据的分析挖掘上,揭示影响股价走势的深层原因。本文的主要工作如下:回顾经典ICA模型的各种估计方法,给出著名的Fast ICA算法;描述k-means聚类分析的概念和原理,介绍度量数据之间相似度的距离指标和评判聚类好坏的准则函数,分析K-means聚类算法的优缺点。其次借助熵的概念和聚类准则函数对K-means聚类算法进行改进。利用熵的概念分离数据中的噪声点,从而达到降噪的目的;利用聚类准则函数则对不同的聚类个数进行评价,从中选择效果最好的聚类个数作为最终的聚类。最后利用改进后的k-means聚类分析作为ICA算法预处理步骤结合基于负熵的Fast ICA算法对某只股票收盘价样本数据进行独立成分分析。运用传统的K-means聚类算法与对相同的样本数据进行分析,验证改进算法的有效性。
其他文献
红色旋律激励官兵献身使命,嘹亮歌声展现军人报国情怀。6月15日晚,军区大礼堂灯光璀璨,党旗飘扬。为纪念中国共产党成立90周年,军区认真贯彻军委和总部指示要求,隆重举行“嘹
[目的]采用TPT固相萃取柱,对普洱茶中的氟虫腈及其类似物残留进行提取和净化,利用超高效液相色谱-串联质谱法进行定性和定量分析。[方法]普洱茶样品经过水润湿后,采用乙腈作
<正> 新建机组电动门数量多,工作量大,问题也较多,下面介绍黄埔电厂工程4台12.5万千瓦机组电动门调试的一些做法,供参考。 1.结线方式的简化和统一目前电厂电动门使用方式很
目的 分析甲亢性肝病患者血清检验指标改变的临床价值.方法 抽取48例甲亢性肝病患者作为观察组,并选取同期甲亢病患者48例作为对照组,检测两组患者血清指标变化.结果 观察组
文章在分析历史街区改造模式的基础上,结合常州市青果巷保护性规划设计,提出城市建设者进行历史街区改造应在实事求是的基础上维护历史街区的完整性、延续性和原真性。
本文应用统计分析的方法并结合乳品产业链的运作原理,探讨分析了我国目前乳品业的发展现状和影响我国乳品质量安全的因素,并提出促进我国乳品业发展和保证乳品质量安全的对策
设计合成了带有甲基、巯基、环氧基、乙烯基、氨基、甲基丙烯酰氧丙基6种官能团的聚硅氧烷微球(PSQ),以2%(质量分数,下同)的浓度与聚乳酸(PLA)熔融混合。结果表明,PSQ可以通过扩链反应
对于重型汽车行业来说,能否建立具有国际竞争力的汽车售后服务体系,关系企业的发展。
以JJF1059.1—2012《测量不确定度评定与表示》规范,对柴油堵塞倾向性时间测定。实验中,由各影响因素引入的不确定分量进行了不确定度分析和评定,结果表明其主要来源是真空泵
本文运用文献资料法、访谈法、逻辑分析法,针对当前高校健美操教学方法,收集、查阅收录在中国期刊全文数据库(CNKI)有关高校健美操优化教学方法研究的期刊.总结高校健美揉嫩学方法