区间值数据的概率处理方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhongxuanshiye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的高速发展,人们采集和处理的数据格式越来越丰富。对于常见的实数数据已有大量研究工作,而相对来说区间值数据的研究比较少。区间值数据在多变量分析,模式识别,数据挖掘,控制等多领域有着广泛的应用。区间值数据与实数数据不同的地方在于用一个区间范围表示一个特征值,而不是一个精确值,这决定了其本身包含不确定性。因此,与实数数据相比,区间值数据需要特殊的处理。随机事件在自然界广泛存在。区间值数据的一大来源也是源于未观察到的随机变量。概率论是一门比较成熟的学科,有大量的技术和理论支持,也适用于对不确定性进行建模。因此,本文从区间值数据本身的不确定性特点出发,尝试用概率模型对区间值进行处理,解释了概率模型对应的现实基础,并改造和提出了一些适用于区间值的差异性度量和回归,聚类算法。本文的研究成果主要如下:1).给出了两个例子说明用概率模型处理区间值的合理性。把区间映射到一定的分布函数上,并在其基础上定义了3个差异性度量,证明了它们的一些性质。2).在概率模型基础上,结合区间值不确定性的特点,提出了应用于区间值数据的回归算法,包括:多变量线性回归和核回归算法。3).基于新的聚类目标函数,提出了一种新的应用于区间值数据的聚类算法,此算法同样也适用于实数数据,并且证明了算法的收敛性。
其他文献
在汽车制造行业中,车体外表面的外观是衡量一个车身质量和美观的重要标准。工业界对汽车外表质量检测要求越来越高,但是目前并没有很好的方法对其进行自动化检测和分类,大多
群体智能算法作为一种新兴的智能计算技术已成为越来越多研究者关注的焦点。群体智能的概念源于对蜜蜂、蚂蚁、大雁等这类群居生物群体行为的观察和研究,通常将这样一种模拟
随着各种数据业务的不断发展,运营商对于在其已经建立的PDH电信网上传输以太网数据的设备(EoPDH:Ethernet-over-PDH)提出了更高的要求,与此同时标准、开放的CompactPCI技术不断
本文第一章提出信息中的否定关系应当区分为矛盾否定关系和对立否定关系,发现了一类对立概念的特征:对立概念之间存在中介概念的充分必要条件是对立概念为模糊概念,从概念层
改革开放以来,我国经济突飞猛进,令世人瞩目,但伴随而来的职业病危害问题也引起了社会的广泛关注。我国目前存在有毒有害生产作业的企业数量巨大,而相对应的职业病危害风险评估专
分类是从训练数据集中找出一个类别的概念描述,依据概念描述来建立分类模型,并用该模型预测未知数据的类别。作为数据挖掘的一个重要分支,它在商业、医学、军事等领域都有广
地理信息系统是近年来信息技术迅速发展的热点之一,不同应用领域的地理信息系统(GIS)随着其自身的不断发展和完善,其应用领域将会不断地扩展和延伸。不同的应用领域对GIS的要求也
随着移动通信技术的快速发展和移动计算机的大量普及,由移动计算、实时应用结合传统数据库技术而形成的嵌入式移动实时数据库系统已成为数据库领域的新兴热点课题。其缓冲区
智能优化算法区别于传统的优化算法,以其在工程问题寻求全局最优解中的巨大优势,目前越来越受到人们的关注。模拟退火算法,蚁群算法,遗传算法和粒子优化算法等作为智能优化算
现在,我们正处于一个信息爆炸的时代,随着网络技术的推广以及其中各种应用数量的增加,互联网中的数据量也快速上升着。电视剧领域也深受互联网的影响,同样出现了信息过载的问