符号数据回归方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lovepengchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与各行各业的融合,人们的生产生活中不断产生大量的数据,而且数据的规模也成爆炸式增长。传统的统计方法虽在理论上可行,但实际操作上会带来很多问题,如计算量过大导致时间的消耗等。符号数据分析在描述数据和缩减数据规模方面很有优势。在这种背景下,本文研究了区间型符号数据的回归方法。论文首先介绍了研究背景、国内外研究现状,然后对符号数据做了具体的介绍。主要介绍了区间型符号数据、多值变量型符号数据、模态多值型符号数据、直方图型区间型数据,并且在每一类数据下做了具体的说明。文章还介绍了逻辑独立、描述向量等一些基本概念,在这些概念的基础上,介绍了多值型符号数据和区间型符号数据的一些统计量的计算。论文主要针对区间型符号数据进行了回归方法的研究。介绍了 MinMax方法、CM方法、CRM方法。为了对这些回归方法进行比较,文章介绍了一种蒙特卡洛数值实验方案,通过构造两类数据集,然后在这两类数据集上对不同的方法建立回归模型。两类数据集的分类依据主要是考虑区间中点与区间范围是否有关来进行构造。结果表明和CRM方法相比,CM方法由于没有考虑区间范围的信息,会产生较大的估计误差,而且CM方法在两类数据集上均出现因变量区间下界估计大于上界估计的情况。CRM方法仅在区间中点与区间范围有关的数据集上会出现这种情况。为了保证区间下界估计小于上界估计,文章介绍了约束CRM方法(CCRM方法)。该方法通过对参数向量进行约束来解决这一问题。论文还介绍了一种数值解法来求解约束CRM问题,该方法主要通过不断迭代使负值参数向正值靠拢。之后文章在两类数据集上将CCRM方法与CRM方法进行了比较。结果表明,约束CRM方法能够有效地解决区间下界估计大于上界估计的问题,并且产生了较小的估计误差。最后文章在真实数据上展示了 MinMax方法、CM方法、CRM方法、CCRM方法的具体运用,并进行了比较分析。
其他文献
假货是困扰社会的严重社会问题和经济问题。假货分为假冒产品和伪劣产品两种。其存在的原因很多,但从理性人视角分析主要集中于生产者、监管者和消费者三个大方面。三者理性
<正>1872年到1875年间,清政府先后派出4批共120名学生赴美国留学。这批学生出洋时的平均年龄只有12岁,因此,他们有一个共同的名
广州是一个对老年旅游者具有极大吸引力的旅游城市.通过分析广州开发老年旅游市场的条件,提出了广州进一步营造老年旅游环境,开拓老年旅游市场的设想:采取适度超前的原则,国
作者结合多年临床积累的资料,借鉴国外音声医学研究的先进技术和临床经验,并结合我国汉语语言文字的特征,研究设计了一套适合我国临床应用的清晰度字表。并应用该字表对30名正常语
分析了西温庄一带的沉积构造,阐述了西温庄隆起的地热分布特征、地热成因类型,并在此基础上计算了西温庄隆起地热田的地热资源量。
目的 了解氟西汀使用发生不良反应的情况,为临床合理用药提供警示.方法 检索中国医院数字图书馆的期刊全文数据库(CHDL)和万方数据库,对1995~2007年12月收到的氟西汀所致的不
公允价值的应用是为了会计人员提供更多的信息来分析财务报表中的相关内容。我国现在所采用的相关公允价值计量大多都非常缺乏活跃的市场,这使公允价值计量没有可以参照的前
能源短缺是人类在未来50年将要面临的首要问题,在太阳光的照射下利用半导体光催化分解水产氢是将太阳能转换为化学能最有前景的方法之一。硫化物被认为是最高效的产氢气催化剂
<正> 佛门为何要选用莲荷这一自然景物作为自己的一种象征?莲荷风姿绰约,“出污泥而不染”的高贵品质,历来为骚人墨客所赞诵。佛教为迎合人们这种爱莲、崇莲心理,就把它吸取
克隆动物是目前生物技术领域研究的热点之一,其科学意义和应用价值重大。本文简述了当前国内外克隆动物的研究进展,讨论了影响动物克隆的技术环节,并根据现有理论和技术发展趋势