多异常点识别的贝叶斯方法

来源 :东南大学 | 被引量 : 0次 | 上传用户:eriwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多异常点识别问题是统计诊断领域中的一个难题,经典的统计诊断理论对此一直没有有效的方法,其中计算的复杂度和结果的粗糙性是很难克服的.本文的主要目的是针对这个问题,提出-套全新的解决方案。 本文采用贝叶斯框架,为每个数据点设置-个指示变量,用于说明该数据点是否为异常点,为确定起见,我们研究了线性模型的多异常点识别问题,以整个空间的均匀分布作为异常点的分布,之所以采用这一非正常分布,是因为在实际问题中异常点的来源是不清楚的,本文假定异常点个数是未知的.我们给每个参数设置了先验,由这些先验可以得到相应的后验分布,通过对这些指示变量所服从的后验分布进行Monte Carlo抽样,我们就可以估计每个数据点是否为异常点的概率. 为了检验我们的方法的精确性和有效性,本文进行了一系列模拟实验.实验结果是非常令人满意的:每组实验中正常点被当作异常点或者异常点被当成正常点的频率都很小,在十组实验中异常点被算法正确选择的频率都很高,几乎接近100%.而且,我们的实验结果对参数的依赖性很小。 上面的方法要求每次迭代都要对整个数据集进行扫描.当数据集比较大时,这种做法的计算量就会让人难以忍受,为了解决这个问题,本文还提出了识别异常点的另一种方法。这一方法的主要思路是模拟一个随机点过程,其中随机而变的点集为异常点集的样本.随机点过程的实现采用生死跳跃Markov链进行模拟.本文完成了这一方法的理论推导.由于时间关系,有关的实验只能留待以后的工作。
其他文献
高振荡积分是一个比较重要的问题了,到目前为止,有很多方法用来求高振荡积分。本文主要讲的是首先各自叙述渐进法和同伦扰动方法;然后是对渐进法和同伦扰动方法进行比较得出一个
生态文明是在我们当前环境恶化应当面对的正确态度,基于生态文明的情况下,流域生态补偿法律机制的制定和完善是我国急需做出应对的。目前我国只有政府拥有作为流域生态补偿的
学位
本文主要研究了带风险控制和分红策略的风险模型,目标是寻找最优策略使得期望折扣分红最大。我们用二维扩散模型来逼近保险公可财富的动态过程,其中扩散和飘移系数都是由风险控
元胞遗传算法是一种将遗传算法和元胞自动机原理结合的进化算法,解决了遗传算法局部搜索能力不足的问题,使种群多样性保持更持久,保证了全局搜索和局部寻优之间的良好的平衡
在当今信息技术的不断发展,信息技术不断的深入到企业生产经营、基础建设、技术改进过程当中,通过科学的研究与信息资源的合理利用,有效的提升企业单位的宝贵财富以及企业的
为了规范税收秩序须完善企业税务管理工作。本文先就当前企业税务管理机制不健全的表现及成因进行了分析,随后就完善企业税务管理工作的提出建议和意见。 In order to stand
期刊
随着科学技术的飞速发展,在那些复杂的、多因素影响的严重非线性复杂系统中,传统的控制理论和控制方法越来越显示出局限性。随着控制品质的高要求,由于系统或系统所处的环境复杂
企业内部管理是企业发展重要的保障,企业档案管理作为企业内部管理其中一部分,企业档案是每个企业基础的信息资源,对企业发展过程当中生产、科研、技术、经营等多方面的活动
阅读是语文学习的基本组成部分,培养学生的阅读能力是小学语文教学的一项重要任务。作为教师的我们应根据学生的特点,结合具体情况,探求适合的方法,着力培养学生的阅读能力。笔者