【摘 要】
:
离群检测是数据挖掘研究的重要组成部分,其任务是,在给定数据对象集中发现那些与其他大部分对象相比有显著不同特征的对象。在大部分数据处理方法研究中,数据对象之间的这种差异性很可能被视为噪声而丢弃。实际上,罕见数据对象的出现对数据集的分析与处理可能蕴含着更大价值。离群点检测方法有很多,在一些特定应用场景中,比如在分布复杂且不确定数据集的离群检测中,粒计算提供了一套基于粒化思想应用于复杂问题求解的理论框架
论文部分内容阅读
离群检测是数据挖掘研究的重要组成部分,其任务是,在给定数据对象集中发现那些与其他大部分对象相比有显著不同特征的对象。在大部分数据处理方法研究中,数据对象之间的这种差异性很可能被视为噪声而丢弃。实际上,罕见数据对象的出现对数据集的分析与处理可能蕴含着更大价值。离群点检测方法有很多,在一些特定应用场景中,比如在分布复杂且不确定数据集的离群检测中,粒计算提供了一套基于粒化思想应用于复杂问题求解的理论框架。将粒计算理论中的相容粗糙集方法融入离群检测模型中,可以提高数据集中不可分辨数据对象的不确定性处理之适应性,提升离群检测准度。为此,以相容粗糙集理论为基础,本文运用极大相容粒思想改进了基于粗糙集的离群检测模型。主要研究内容涉及如下几个方面:(1)离群检测研究中,现有的经典粗糙集理论在处理数值型属性对象的离群判别问题上有一定局限。另外,与数值型属性不同,符号型属性数据对象之间的距离没有固有有效度量方法,采用传统的线性距离度量效果往往不佳。针对这些问题,本文将利用相容粗糙集的粒化特点,研究基于相容度值差异度量的离群检测方法,并用对比实验验证了相容度值差异度量的对象离群因子的有效性。(2)相容粗糙集虽然能够处理混合型属性数据集,但基于相容关系的粒之间不具有传递性或对称性,在进行离群点检测时,对信息粒之间甚至同一信息粒内对象之间的关系会有误判。针对这一问题,基于相容粗糙集的极大相容粒思想,结合数据对象分布特征,构建了一种新的离群检测模型。与现有相容粒概念相比,新模型中的粒元素具有更强的相似性,进而可以提高模型检测的准确度。
其他文献
随着人们文化生活的日益丰富,媒介环境渐趋复杂,观众对电视节目的关注与兴趣逐渐下降,如何在当下媒介环境中脱颖而出是每个主持人必须思考的问题。无论媒介环境怎样变化,一档优秀的电视节目始终离不开一位优秀的节目主持人,主持人承担着贯穿节目始终、展现节目主旨的责任。我们要充分了解节目主持人的角色属性,并能在不同的角色设定下把握好其特性。就电视文化类节目而言,其主持人更应充分结合节目实际,更好地去体现节目宗旨
时代的进步,科技的发展,已经极大地改变了媒体的传播方式,纪实性电视专题节目,渐渐地受到观众的广泛认可与普遍喜爱。作为专题节目核心组成部分的主持人在节目中要做到一专多能,通过各种语言表达技能和方式方法充分展现出节目所表达的主题和特征。本文以本人毕业作品《云朵上的羌寨,从沉睡到觉醒》为例,从语言表达的角度出发,分析、归纳、解读在纪实性电视专题节目中主持人语言表达的特点。本文主要包含五个部分,第一部分阐
互联网技术的日益发展和新媒体的不断普及,为短视频行业的发展提供了良好的条件与时机,成为自媒体发展的主要阵地,同时也成为对外讲述中国故事、传播中国文化、塑造中国形象的重要平台。其中,自媒体博主李子柒作为自媒体行业的佼佼者,不仅影像风格有鲜明的个人特色,而且凭借其自创的“古香古食”系列短视频获得海内外网友的关注和喜爱,截至2021年4月,全球粉丝数已经超过1.3亿,成为年轻一代利用短视频影像传播中国故
随着网络节目的蓬勃发展,“互动”成为网络视听内容的内核,多版本和衍生类网络访谈节目随之增加。网络访谈节目深受大众喜爱,在网络产业中占据重要地位,究其原因,与网络访谈节目主持人的独特风格与语言策略密不可分,节目主持人在其中起到了关键作用。本文从网络访谈节目主持人的语言出发,运用语用学中的语用策略等理论,以近三年受关注的网络访谈节目为研究语料,探究角色新特征背景下网络访谈节目主持人的语用策略模式以及使
自1931年抗战爆发以来,随着日本军国主义对我国侵略程度的不断加剧,全国各族同胞被迫发起反抗。同时,国内的有志之士便撰写了大量传播抗战思想,研究边疆、民族问题的学术论著,各地政府也积极创办地方报刊,投入抗战建国的潮流之中。《西康国民日报》于1939年10月10日“双十节”正式创立。本论文以抗战时期的《西康国民日报》为研究对象,分为绪论、正文、结语、附录四个大部分组成。“绪论”阐述了选题缘由、研究意
纪实类节目是近几年电视荧幕中极为活跃的一种节目类型,在新闻节目、专题片、纪录片当中几乎都可以看到纪实性的存在。纪实类节目存在的价值在于对过去或现存事物的记录,从而还原并揭示生活本身所富有的内涵和价值。新媒体掀起的创新狂潮,使得纪实类节目的形式也在不断更新,而在这中间,主持人担任的角色也在发生改变。主持人只有对自身角色进行准确定位,并实现角色的个性化塑造,才能在多元背景下占据牢靠地位。本文结合笔者毕
《经济周报》是1945-1949年间上海出版发行的对国内外具有较大影响的理论性经济刊物。目前,该刊物已有相关纸质版和电子版出版发行,但学术界对其缺乏专题系统研究。《经济周报》作为大众传播媒介之一,主要内容是对这一时期国内外经济问题和经济理论进行了理论性和现实性的综合研究报道。例如,关于国内经济问题中的农业问题、对外贸易问题和通货膨胀问题;关于国际经济问题中的美国与英国、苏联与东欧国家以及部分亚洲国
漕运史研究是大运河历史文化研究的重要方面。自进入21世纪以来,学界关于漕运史的研究成果丰硕。这些论著围绕我国各个历史时期大运河的历史变迁、河道整治、漕运管理等问题展开研究,探讨漕运对大运河沿线地区的经济、社会、文化等方面产生的影响。伴随漕运史研究的深入,不少与之相关的史料文献先后被整理汇总和出版,催生了运河学的产生和发展。系统梳理和回顾总结这些学术成果,对把握当前研究现状及指导今后大运河漕运史研究
分子性质预测是一项基础且重要的研究,准确预测分子性质在化学信息学的各个应用领域中都受到广泛关注,例如工业应用,环境工程及药物设计等。近年来,数据驱动方法取得的巨大成功以及机器学习技术的落地应用,加速了各个领域信息的交叉融合,也为分子信息获取带来了新的挑战和机遇。本文提出利用分子动力学和机器学习的方法分别对微波作用下超临界水的热力学性质,化合物分子的水溶性和水合自由能进行了预测研究。首先,通过分子动
特征选择是数据分析对数据降维时常用的方法,有效的特征评估方法是特征选择的基础与关键.模糊邻域粗糙集作为一种较新的处理不确定性的数学模型,基于它的不确定性度量可以作为特征评估的工具.但目前在模糊邻域粗糙集上的不确定性度量的构建还不够完善,尤其是从信息表示方面讨论的度量甚少.为了挖掘更好的特征选择算法,本学位论文采用代数表示与信息表示的复合构建,建立和深化了模糊邻域粗糙集的决策熵不确定性度量体系;基于