符号数据回归方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：lovepengchen

【摘要】

：

随着计算机技术与各行各业的融合,人们的生产生活中不断产生大量的数据,而且数据的规模也成爆炸式增长。传统的统计方法虽在理论上可行,但实际操作上会带来很多问题,如计算量

【作者】

：

曹仙斌

【出处】

：

中国科学技术大学

【发表日期】

：

2018年期

【关键词】

：

符号数据区间型数据 CRM方法 CCRM方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术与各行各业的融合,人们的生产生活中不断产生大量的数据,而且数据的规模也成爆炸式增长。传统的统计方法虽在理论上可行,但实际操作上会带来很多问题,如计算量过大导致时间的消耗等。符号数据分析在描述数据和缩减数据规模方面很有优势。在这种背景下,本文研究了区间型符号数据的回归方法。论文首先介绍了研究背景、国内外研究现状,然后对符号数据做了具体的介绍。主要介绍了区间型符号数据、多值变量型符号数据、模态多值型符号数据、直方图型区间型数据,并且在每一类数据下做了具体的说明。文章还介绍了逻辑独立、描述向量等一些基本概念,在这些概念的基础上,介绍了多值型符号数据和区间型符号数据的一些统计量的计算。论文主要针对区间型符号数据进行了回归方法的研究。介绍了 MinMax方法、CM方法、CRM方法。为了对这些回归方法进行比较,文章介绍了一种蒙特卡洛数值实验方案,通过构造两类数据集,然后在这两类数据集上对不同的方法建立回归模型。两类数据集的分类依据主要是考虑区间中点与区间范围是否有关来进行构造。结果表明和CRM方法相比,CM方法由于没有考虑区间范围的信息,会产生较大的估计误差,而且CM方法在两类数据集上均出现因变量区间下界估计大于上界估计的情况。CRM方法仅在区间中点与区间范围有关的数据集上会出现这种情况。为了保证区间下界估计小于上界估计,文章介绍了约束CRM方法(CCRM方法)。该方法通过对参数向量进行约束来解决这一问题。论文还介绍了一种数值解法来求解约束CRM问题,该方法主要通过不断迭代使负值参数向正值靠拢。之后文章在两类数据集上将CCRM方法与CRM方法进行了比较。结果表明,约束CRM方法能够有效地解决区间下界估计大于上界估计的问题,并且产生了较小的估计误差。最后文章在真实数据上展示了 MinMax方法、CM方法、CRM方法、CCRM方法的具体运用,并进行了比较分析。

其他文献

理性人对假货的选择研究——基于生产者、监管者、消费者视角

假货是困扰社会的严重社会问题和经济问题。假货分为假冒产品和伪劣产品两种。其存在的原因很多,但从理性人视角分析主要集中于生产者、监管者和消费者三个大方面。三者理性

期刊

理性人假货选择

中国历史上最早的官派留学生——留美幼童

<正>1872年到1875年间,清政府先后派出4批共120名学生赴美国留学。这批学生出洋时的平均年龄只有12岁,因此,他们有一个共同的名

期刊

留美幼童曾国藩丁日昌留学生

目的地广州的老年旅游市场开发探讨

广州是一个对老年旅游者具有极大吸引力的旅游城市.通过分析广州开发老年旅游市场的条件,提出了广州进一步营造老年旅游环境,开拓老年旅游市场的设想:采取适度超前的原则,国

期刊

广州市老年旅游市场城市旅游开发

汉语语音清晰度测试字表的建立和临床应用研究

作者结合多年临床积累的资料，借鉴国外音声医学研究的先进技术和临床经验，并结合我国汉语语言文字的特征，研究设计了一套适合我国临床应用的清晰度字表。并应用该字表对３０名正常语

期刊

汉语语音测试字表音声医学

太原市西温庄一带构造环境与西温庄地热

分析了西温庄一带的沉积构造,阐述了西温庄隆起的地热分布特征、地热成因类型,并在此基础上计算了西温庄隆起地热田的地热资源量。

期刊

西温庄隆起构造环境地热地质条件地热资源

盐酸氟西汀的不良反应

目的了解氟西汀使用发生不良反应的情况,为临床合理用药提供警示.方法检索中国医院数字图书馆的期刊全文数据库(CHDL)和万方数据库,对1995～2007年12月收到的氟西汀所致的不

期刊

盐酸氟西汀不良反应药物相互作用

现行会计准则中公允价值应用与盈余管理

公允价值的应用是为了会计人员提供更多的信息来分析财务报表中的相关内容。我国现在所采用的相关公允价值计量大多都非常缺乏活跃的市场,这使公允价值计量没有可以参照的前

期刊

会计准则公允价值盈余管理

硫化物复合材料的制备及其光催化性能的研究

能源短缺是人类在未来50年将要面临的首要问题，在太阳光的照射下利用半导体光催化分解水产氢是将太阳能转换为化学能最有前景的方法之一。硫化物被认为是最高效的产氢气催化剂

学位

硫化物光催化氢气插层层状化合物

为何以莲花座衬托《西藏文物》?

<正> 佛门为何要选用莲荷这一自然景物作为自己的一种象征?莲荷风姿绰约,“出污泥而不染”的高贵品质,历来为骚人墨客所赞诵。佛教为迎合人们这种爱莲、崇莲心理,就把它吸取

期刊

《西藏文物》

动物克隆技术的研究进展及其发展趋势

克隆动物是目前生物技术领域研究的热点之一，其科学意义和应用价值重大。本文简述了当前国内外克隆动物的研究进展，讨论了影响动物克隆的技术环节，并根据现有理论和技术发展趋势

期刊

克隆动物胚胎细胞体细胞转基因克隆动物

符号数据回归方法研究

与本文相关的学术论文