【摘 要】
:
随着因特网技术的飞速发展,每天能获取数以万计甚至更多的数据,这些数据以流的形式快速、连续地到达,比如各类监控系统,网络入侵检测,信用卡欺诈检测等产生的数据。如何从这
论文部分内容阅读
随着因特网技术的飞速发展,每天能获取数以万计甚至更多的数据,这些数据以流的形式快速、连续地到达,比如各类监控系统,网络入侵检测,信用卡欺诈检测等产生的数据。如何从这些规模宏大、动态变化、实时涌现的数据流中提取出有效的信息已成为当前数据挖掘领域研究的热门问题。数据流分类是数据流挖掘领域研究的重要内容之一,传统的数据分类算法对其不再适用,需要提出新颖的算法处理具有动态变化的数据流。对分类数据流的大多数研究均假设数据是相对平衡和稳定的,然而,事实并非如此。针对数据流的不均衡性与概念漂移的特点,本文提出了两种数据流分类模型,具体内容如下:(1)针对数据流规模巨大、实时性的特点,提出了基于神经网络的不均衡数据流集成分类算法。该集成模型包含三个部分:平衡训练数据流样本、构建集成分类器池、用新到达的数据流样本增量更新分类算法。用改进的降采样方法平衡数据流,BP神经网络作为基分类器。本文选择了三个标准方法进行实验对比,从UCI机器学习库中选取十个数据集进行评估,实验结果表明本文提出的算法能有效地处理具有非稳定和不均衡特征的数据流分类问题。(2)针对数据流动态变化、非稳定的特点,提出了一个基于双加权在线极限学习机的不均衡数据流分类模型。该模型以在线极限学习机作为基分类器,从时间和空间角度分析样本的分布特点,提出了一个自适应双加权机制来调整样本在时间层面和空间层面的权重。分别采用概率密度函数计算在时间层面的权值以及增量式的概率神经网络计算在空间层面的权值,利用双权值平衡当前数据的类分布,更新整个模型。实验结果表明提出的算法具有较高的G-mean和F-measure,且表现出了良好的健壮性。
其他文献
民俗文化是我国民族文化的重要组成部分,但随着历史的进程民俗文化面临着生存环境逐渐缩小,它的持续发展面临着严峻的考验。要正确认识到民俗文化历史的发展轨迹,定位及其现
目的:探寻相对校正因子(RCF)在中药材一测多评中应用的规律性。方法:以中国知网(CNKI)文献数据库为来源,采用文献检索方法收集大量有关中药材一测多评的文献,提取文献中通过一测多
卵巢癌是女性好发肿瘤之一,也是最常见的女性生殖器官恶性肿瘤,死亡率居妇科肿瘤首位。早期发现其生存率可达90%以上,但由于缺乏明显的临床症状,70%的卵巢癌患者发现时已属晚期,5年
目的:探讨参一胶囊联合SOX方案(奥沙利铂联合替吉奥)治疗原发性肝癌的临床疗效。方法:将84例原发性肝癌患者随机分为观察组及对照组,每组42例。对照组给予SOX方案进行治疗,观
从病因病机、 治疗原则、 方药运用及典型医案四个方面浅析李成年教授治疗颈性眩晕的临床经验.李成年教授认为,颈性眩晕多因脾虚痰扰所致,应以健脾化痰、 燥湿理气为治疗原则
目的回顾分析糖尿病(Diabetes mellitus,DM)合并横纹肌溶解综合症(Rhabdomyolysis,RM)的临床预后情况。方法选取2013年1月—2017年1月收治的DM合并RM患者52例,收集患者的基线
目的:通过比较右美托咪定(Dexmedetomidine)及丙泊酚(Propofol)对机械通气脓毒症患者体内炎症因子(TNF-α,IL-6)及核转录因子-кB的影响,推断出右美托咪定抑制炎症反应的可能机制,
研究背景 我国是食管癌高发区,食管癌校正死亡率达20.4/10万,居世界首位,主要为食管鳞状细胞癌,占全部食管癌的95%左右。江苏省是食管癌的高发地区,特别是扬中、淮阴等地是全国主
择偶标准是进化心理学领域的研究热点。两性的择偶标准众多,大致可归纳为三个维度:资源、外貌和性格。作为进化过程的适应产物,人类会在不同环境因素和个人因素之间进行权衡,从而调整择偶标准。其中性别比是影响个体择偶的重要环境因素,择偶价值感(指个体对自己作为潜在配偶的总体吸引力的感知)是影响个体择偶的重要个人因素。已有研究关注两者与择偶标准的关系,但此类研究在性别比、择偶价值感与两性择偶标准的关系上一直存
BES1是拟南芥油菜素类固醇(Brassinosteroids,简称BR)信号通路下游的转录因子,该转录因子家族包括BES1、BZR1、BEH1、BEH2、BEH3、BEH4六个同源性很高的成员。到目前为止,已