【摘 要】
:
特征选择作为重要的数据预处理手段,有效地改善了模型的训练时间与学习精度。然而随着大数据时代数据产生与收集速度的急剧提升,传统特征选择算法面临着严峻挑战:(1)特征空间存在高维性的同时,通常伴随着未知性与演化性;(2)标记类别之间往往不是相互独立的,通常存在复杂的层次结构关系。这导致传统的特征选择算法表现不佳,甚至无法应对现实的应用环境。为此本文针对流特征下,充分挖掘和利用类别的层次结构进行特征选择
【基金项目】
:
国家自然科学基金面上项目(No.62076116):开放动态环境下层次结构数据分类学习的粒计算方法; 国家自然科学基金(No.61672272):基于粒计算的多模态多标记数据分类建模研究; 福建省教育厅科技项目(No.JAT180318):面向高维小样本数据的特征选择算法研究; 福建省
论文部分内容阅读
特征选择作为重要的数据预处理手段,有效地改善了模型的训练时间与学习精度。然而随着大数据时代数据产生与收集速度的急剧提升,传统特征选择算法面临着严峻挑战:(1)特征空间存在高维性的同时,通常伴随着未知性与演化性;(2)标记类别之间往往不是相互独立的,通常存在复杂的层次结构关系。这导致传统的特征选择算法表现不佳,甚至无法应对现实的应用环境。为此本文针对流特征下,充分挖掘和利用类别的层次结构进行特征选择的问题,进行流特征下的在线分层特征选择方法的研究。具体而言,主要研究内容如下:(1)流特征下基于邻域粗糙集的在线分层特征选择。针对传统流特征选择算法忽略了类别间层次结构关系问题,利用类别层次结构中节点之间存在的兄弟策略定义了一种面向层次化结构数据的邻域粗糙集模型。其次,基于邻域依赖度定义了特征在线重要性选择和在线冗余更新等策略,构建了一种在线流分层特征选择框架,并设计了相应的在线流分层特征选择算法。实验结果验证了算法的有效性。(2)流特征下基于核模糊粗糙集的在线分层特征选择。针对传统流特征选择算法忽略了类别间层次结构关系问题,且为了高效地度量样本数据间的模糊关系的同时,进一步优化在线运算的时间性能,基于类别层次结构中节点之间存在的兄弟策略定义了一种面向层次化结构数据的核模糊粗糙集模型。其次,基于(1)中的流特征选择框架,利用核模糊依赖度重新定义在线重要性选择和在线冗余更新阶段特征筛选策略,构建一种新的在线流分层特征选择算法。实验结果表明算法的性能有更进一步的提升。
其他文献
新闻类语篇在语文教学中占据着重要位置,且随着实用类语篇在高考语文中比重的增加,对新闻类语篇进行更深刻的学习显得尤为重要。而深度学习正符合新闻类语篇学习的特征。在当前的语文课堂上,新闻类语篇教学一直不被重视,很多教师将大部分精力用于文学类语篇的阅读与鉴赏,而把新闻类语篇视作阅读的补充材料,导致学生对新闻类语篇的学习停留于表层,没有真正理解新闻类语篇的深刻内涵。因此,从深度学习理论出发对新闻类语篇的教
教材是教师教学和学生学习的直接载体。当前,我国小学科学教材正处于对接发展人的核心素养的关键时期,小学科学教材在小学科学课程标准更新与修订下,不断追求与时俱进、创新适切性。科学实验是小学科学课程的基础,物理实验是组成科学实验的重要环节,科学教材中的物理实验部分内容改编与完善对发展学生核心素养至关重要。美国在世界科学教育中处于领先地位,对中美两版小学科学教材中的物理实验部分(以“电和磁”模块为例)进行
中学语文教材中的古代长篇叙事诗兼具“叙事性”与“诗性”,是一类具有跨文体色彩的选文。与叙事短诗相比,长篇叙事诗的篇幅更长、情节更突出,教师在教学中也就更难以把握其“叙事性”与“诗性”:若只考虑“叙事性”,则容易把诗歌课上成文言文课;若只斟酌“诗性”,便难以使学生理解故事的内容和主旨。因此,文章着眼于长篇叙事诗的教学,通过对比余映潮、王君、李明哲三位名师的《木兰诗》课例,寻找在教学中合理把握“叙事性
在近代民族危亡的语境下,“启蒙”是精英文学想要达到却一直不能很好完成的一个任务,原因在于精英文学因其思想的超前及形式的欧化一直与普通百姓有所隔膜。通俗文学因与民众天然的亲密关系无疑是进行启蒙的一条路径,而通俗文学的思想性又较精英文学为差。思想性与娱乐性并重的作品成为社会的期待。金庸武侠作品的娱乐性自不待言,其思想性高低成为上世纪末关于金庸作品价值大讨论的核心问题。若能证明其思想性达到一定高度,则它
《普通高中英语课程标准(2017年版)》:要求学生根据表达需要选择正确的词汇和语法结构,以书面形式传达信息、论证观点、表达情感,提高语篇衔接性和连贯性等。然而,虽然教师花费了诸多时间讲解和训练,目前高中英语写作现状仍存在较多问题:学生缺乏写作的内在动机,对写作缺少兴趣;写作篇章结构不规范;写作资源的获取途径单一;英语语言知识和语言表达匮乏;在合作学习中的自我评价以及评价他人写作的能力较弱(王德美,
《边城》是沈从文表达“美”和“爱”的文学理想的代表之作,在特定的历史文化环境的影响下,这部伟大的作品很长一段时间得不到人们的认可和接受,直至上八十年代国内外“沈从文热”影响下,《边城》的美学价值和教育作用才被人们逐渐认识和接受,在中国现代文学史上占有一席之位。如今《边城》一直被编选入高中语文必修课本之中,它所表现出来的“美的教育”“爱的教育”“人性教育”“文学教育”等教育思想也日益被人们重视起来。
近年来,随着流浪未成年人数量的日益增加,流浪未成年人这一群体已成为社会工作者介入的重要对象之一。流浪未成年人由于自身的脆弱性以及社会支持网络的不完整,在社会适应以及自身成长发展方面本就存在着诸多问题。尤其是当他们遭遇突发性的危机后,会产生一系列的应急反应,而这些危机的化解无疑需要社会工作者运用专业方法做好危机之前的预防和准备以及危机发生后的有效介入,协助他们在自身能力不足的情况下尽快摆脱危机状态,
由拉格朗日方程所描述的机械臂系统同步控制问题的研究吸引了来自科学与工程领域学者们的广泛兴趣。人们越来越多地将机械臂应用于需要极高精度和性能稳定性的实用任务。本文以实际工程中的应用背景为驱动,设计了在关节空间和任务空间上机械臂系统的不连续控制与同步问题,主要内容如下:首先,构造主-从拉格朗日系统,所考虑的系统允许存在参数失配,设计间歇控制使得具有参数失配的机械臂系统达到实用同步。同时基于Lyapun
近年来,随着我国教育强国政策的推进,愈来愈多的研究生层次人才加入小学教师队伍,初任小学教师队伍结构正在发生改变。学历层次对教师产生的影响是深刻的,作为研究生学历初任小学教师,在面临社会身份转变、生活场域转换、文化场域更迭时,他们当下的专业发展现状如何?在发展过程中产生了哪些需求?影响需求满足的因素有哪些?本研究结合勒温场论,从个体与环境出发,针对具体情境、具体场域中的教师专业发展需求进行研究。本研
自1982年德国数学家Wille提出形式概念分析以来,该理论已经成为有效的知识发现工具,并且被广泛应用于机器学习、模式识别及数据挖掘等领域.为了拓展经典概念格模型的应用范围,许多扩展模型被提出,包括模糊概念格、变精度概念格、多粒度概念格等.基于不同的模型可以处理不同的问题,包括但不限于概念知识获取、属性约简、决策规则等.矩阵视角下,研究属性约简不仅可以获取更加简洁的知识,而且时间效率高,有利于决策