【摘 要】
:
离群数据挖掘是找出隐含在海量数据中相对稀疏而孤立的异常数据模式,它往往可以使人们发现一些真实的,但又出乎意料的知识,因此通过对离群数据的研究,发现异常的行为和模式,
论文部分内容阅读
离群数据挖掘是找出隐含在海量数据中相对稀疏而孤立的异常数据模式,它往往可以使人们发现一些真实的,但又出乎意料的知识,因此通过对离群数据的研究,发现异常的行为和模式,有着非常重要的意义。现有的传统离群数据挖掘方法存在着受人为因素影响较大,而且不能对挖掘出来的离群点做进一步分析的问题。本文采用信息熵作为离群数据的度量手段,对离群数据挖掘方法进行了研究,其主要研究成果如下:1、给出一种基于信息熵的离群数据挖掘算法(OMBIE)。首先,分析和定义了基于信息熵的离群度量因子,并通过离群度量因子来度量数据集中每个记录的离群程度;然后,根据每个数据点离群程度,检测出离群数据,从而有效地消除了人为主观因素对离群检测的影响,进一步反映客观事物的本质,并能较好地解释离群点的含义;最后,实验验证了该算法的可行性和有效性。2、给出一种离群数据挖掘算法(OMBCAS)。首先,引入属性熵与特征属性的概念,并计算特征属性子空间和属性权重;然后,利用异常度的概念,计算子空间离群影响因子,并检测出离群点;最后,实验验证了算法具有不需要人为干预、伸缩性强等优点。
其他文献
农业区域经济是经济发展的重要问题之一,如何实现浙江省区域农业的健康、快速发展,并结合省内经济发展的特点尤为关键。通过浙江省所处的地理位置,以反互联网发展的优势,将区
以猪圆环病毒2型(PCV2)遗传标记毒株为毒种,经细胞培养传代,优化了病毒增殖条件,获得较高滴度的病毒培养物用于PCV2灭活疫苗的研制。为了比较不同免疫佐剂的效果,本试验对国
道教自佛教传入中土之始,就和其有着深刻的矛盾;在各种争斗中,道教大都处于相对劣势的状态。但是尽管如此,道教为了探寻它的发展出路,积极地向佛教"取经",借鉴佛教的生死轮回
本文旨在通过组织学生写演课本剧,把语文教学和学生生活结合起来,提高语文实践的效果,从而提升语文教学水平。
实现社会主义文化现代化,是毛泽东、邓小平执著求索的重大历史课题,也是中国人民梦寐以求的历史夙愿。它关系到社会主义事业的兴衰成败,关系到中华民族的伟大复兴。毛泽东、
本文通过细读文本,从微观层面直至宏观层面对《雨巷》的人物、意象、情节、主旨等方面重新做出解读。通过剖析男主人公"我"在"逢着""丁香姑娘"之前和之后所产生的巨大心理变
<正>由于教育引导缺失、理解认识不足等原因,大学生士兵对个性的含义往往存在不同程度的认识偏差,过分地强调差异性与独特性。有的甚至将懒散、情绪化、怕吃苦、虚荣心强、看
随着信息技术的迅速发展,互联网已经渗透到社会的各个领域和层面。网络的发展对广大青少年的世界观、人生观、价值观等方面都产生了重大影响,对学校德育工作产生了巨大冲击,
网络游戏市场规模在最近的几年里增长迅速,且行业利润率很高,吸引了大量的资本进入。然而传统的网络游戏由于前期资金投入高、运营复杂,行业的后进入者相对于行业内的领先者
<正>客家土楼民居是一种独有的建筑形式,它介于城市和乡村之间,以集合住宅的方式将居住、贮藏、商店、集市、祭祀、娱乐等功能集中于一个建筑体量,具有巨大的凝聚力。将土楼