【摘 要】
:
在很多现实的分类应用中,新数据的类标需要由领域专家最终确定,而分类器的分类结果仅起辅助作用.另外,随着大数据所隐含价值越发被人们重视,分类器的训练会从面向单一数据集
【机 构】
:
东北大学软件学院,东北大学信息科学与工程学院
【基金项目】
:
国家自然科学基金(61100027,61374178,61202085,61572117,61572116);中央高校基本科研业务费专项资金(N13 0417003);高等学校博士学科点专项科研基金(20120042120010)
论文部分内容阅读
在很多现实的分类应用中,新数据的类标需要由领域专家最终确定,而分类器的分类结果仅起辅助作用.另外,随着大数据所隐含价值越发被人们重视,分类器的训练会从面向单一数据集逐渐过渡到面向分布式空间数据集,大数据环境下辅助分类也将成为未来分类应用的重要分支.然而,现有的分类研究缺乏对此类应用的关注.大数据环境中的辅助分类面临以下3个问题:1)训练集是分布式大数据集;2)在空间上,训练集所包含的各局部数据源的类别分布不尽相同;3)在时间上,训练集是动态变化的,会发生类别迁移现象.在考虑以上问题的基础上,提出一种大数据环境中分布式辅助关联分类方法.该方法首先给出一种大数据环境中分布式关联分类器构建算法,在该算法中,通过横向加权考虑分类数据集在空间上的类别分布差异,并给出"前件空间支持度-相关系数"的度量框架,改进关联分类算法面对不平衡数据的性能缺陷;然后,给出一种基于适应因子的辅助关联分类器动态调整方法,能够在分类器应用过程中充分利用领域专家实时反馈的结果对分类器进行动态调整,以提升其面向动态数据集的分类性能,减缓分类器的退化和重新训练的频率.实验结果表明,该方法能够面向分布式数据集较快地训练出有较高分类准确率的关联分类器,并在数据集不断扩充变化时提升分类性能,是一种有效的大数据环境中辅助分类应用方法.
其他文献
采用固定化酶传感器和流动注射分析技术研制了全自动血糖-乳酸分析仪.通过转盘式样品盘和自动取样针实现了样品的自动采样.采用停流技术,增大酶传感器的响应电流,提高测定精
中国盆景源远流长,流派纷呈,近年来,在湖北乃至华中地区出现一种盆景造型风格,给人以“动”感,展现了“自然的神韵,活泼的节奏,飞扬的动势,写意的效果”的艺术风格,先后在许多地,市出现
由于位置感知移动电子设备的繁荣,位置服务(LBS)几乎在所有的社会和商业领域广泛流行.虽然LBS给个人和社会带来了巨大利益,但也给用户的隐私造成了严重威胁.因为用户享受LBS
目的对第二代H1受体阻滞剂的不良反应进行总结性分析,为今后临床安全用药提供参考依据。方法回顾性分析2005年-2014年某中心综合门诊部皮肤科门诊因变态反应使用第二代H1受体
针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择.算法首先采用Pearson相关系数和Wi
目的探讨新生儿呼吸衰竭(NRF)的发病、治疗及预后情况。方法对2011年1月-2013年12月四川大学华西第二医院新生儿科收治的421例NRF患儿的临床资料进行回顾性分析。结果 NRF发
在超声条件下,采用溶胶凝胶法制备Zn(OH)2溶胶,然后在其上沉积沉淀CdS,制备CdS/Zn(OH)2催化剂前驱体。前驱体分别在空气和氮气下焙烧,制得两种CdS/ZnO复合光催化剂。催化剂表
通过对长江口外海域187个站位沉积物样品的常量元素含量分布分析,研究了长江口外海域沉积物常量元素组成的R-型聚类分析、R-型因子分析及主要控制因素。长江口外海域沉积物常
<正>流动人口服务管理体制,是流动人口实践活动领域的重要问题。深入研究新形势下流动人口服务管理体制,使其组织机构设置更加合理高效,法规制度建设更加系统完善,管理服务活
北斐济海盆位于西南太平洋边缘,近半个世纪以来,针对该海盆地质和地球物理特征的调查研究取得了丰硕的成果。现今海盆内活动的构造带主要包括北斐济断裂带以及北部、中部、斐