一般区间与分布式符号数据的PCA研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:a398215555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的主成分分析主要针对点数据,面对信息社会知识爆炸、信息量倍增的现象,传统的分析方法在处理海量数据,从整体上把握数据属性方面有所欠缺,符号数据分析方法通过“数据打包”,实现了从整体上把握海量数据内部之间的关系。本文主要研究一般分布的区间型符号数据和分布式符号数据的主成分分析和因子分析。在现有的针对均匀分布区间数据作主成分分析(PCA)的研究成果基础上,本文从区间变量的经验密度函数入手,逐步推导了区间变量的均值、方差、协方差、相关系数等描述性统计量,继而研究了区间数据的标准化问题。在此基础上,进行了主成分分析和因子分析的方法研究。依次以中国股市不同类股票和不同市值范围股票为符号对象,以市场表现和财务报表相关指标为变量,进行了案例分析。对分布式符号数据的主成分分析和因子分析进行了一些探索研究,包括分布式符号数据的形成,分布式符号数据的标准化,分布式数据的主成分分析和因子分析等等。以中国股市不同类股票为符号对象,以市场表现和财务报表相关指标为变量,形成分布式符号数据,进行了案例分析。研究结论表明,与以往文献假设样本点在区间内服从均匀分布相比,一般分布的区间型符号数据PCA方法更具有实际意义,而分布式符号数据的PCA方法则是对符号数据分析方法体系的进一步完善。
其他文献
按照提出的生物学产量气候区的划分标准,进行试验的地区属低产区,其特点是比牧草喜温的作物所需的热量不足。在苏联科米自治共和国,马铃薯是主要的粮食作物,栽培的品种多为
数字档案馆建设 ,要坚持档案信息资源数字化、信息内容特色化、馆舍建筑多功能化三化一体同步进行。 The construction of digital archives, we must adhere to the digiti
高校培养什么样的人、如何培养人以及为谁培养人是所有高校必须面对的一个根本性问题.本文以成都中医药大学为研究对象,采用文献资料法、专家访谈法、问卷调查法等研究方法,
1990年,有六个布里洛包装盒在瑞典现代艺术馆(ModernaMuseet)展出,馆方曾声明他们会“从馆藏中筛除这些作品”。瑞典现代艺术馆,斯德哥尔摩:某位著名的策展人在安迪·沃霍尔
本研究基于社会信息处理理论的视角来探索团队冲突的影响,旨在了解团队冲突(任务冲突及团队冲突)通过何种中介机制影响各种团队产出。基于社会信息处理理论的框架,本文提出了一
随着消费市场竞争的日趋激烈与顾客争夺成本的提高,培育和维护忠诚的顾客已经成为企业的重要策略,顾客忠诚管理应运而生。传统观念认为,顾客满意必然造就顾客忠诚。但是,一些研究
从今年2月下旬以来,浙江日报根据省委的指示。集中宣传了海盐衬衫总厂厂长步鑫生的创新精神和改革经验,并在报上开展了“怎样看待改革”的讨论,发表了有关报道和言论74篇。
今年八、九两月,华东几个省市新闻系统统一举行了测试,我参加了语文学科的阅卷、评卷工作。应该说,上海新闻界的青年同志考得还是不错的,但从试卷中发现,为数不少的新闻从业
我们现在是用薯块种植马铃薯,每公顷需要两吨左右的种薯,既增加了生产成本,又使新品种推广缓慢;而一小撮种子就相当于一吨重的种薯。有朝一日,我们会像用种子种蕃茄、萝卜一
在经济全球化和以数字网络技术为代表的高新技术飞速发展双重因素驱使下,各种新兴业务不断涌现。纵观这些新型业务的发展历程可以发现,商业模式在其中扮演了极为重要的角色,因此