多分类器系统中信息融合方法研究

被引量 : 0次 | 上传用户:yjfc000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题具有不确定性,尽管由于多分类器融合技术在降低分类系统泛化误差、简化分类器设计等方面的优良表现,国内外对它的研究取得了不少成果,但至今还有许多关键理论和技术问题有待解决和完善。再者,由于标记样例的难以获取,近几年来,多分类器融合已经由传统的“有监督”多分类器融合,逐步拓展到“无监督”多分类器融合(也称“聚类融合”)、“半监督”多分类器融合(有标记的样例不足)两个更年轻的高不确定性的领域。因此,近几年来,国际上越来越多研究者投入到多分类器融合的研究中,使得该领域成为了一个相当活跃的研究热点。本文针对多分类器系统中信息融合问题,在全面介绍和分析分类器融合的研究现状、工作机理的基础上,提出了多种用于进一步提高分类器融合系统性能、扩大其应用范围的算法。本文的主要研究成果如下:针对传统多分类器设计框架仅适用于有标记资料的缺陷,提出了一种通用的自适应多分类器设计框架。该框架集成了各种资料条件下(最初无标记信息、中期有少量标记信息、后期有足够标记信息)的多分类器设计方法,具有自适应功能,对于一项应用能根据资料所处的阶段(无监督、半监督和有监督)自动调整。针对有监督分类器融合方法-模糊积分,对该方法中的重要问题-模糊密度确定问题进行了研究,首次将两种典型的静态确定方法进行了细致的比较研究。在此基础上,提出了一种动态自适应模糊积分融合算法,该方法的特点是采用一种新的基于模糊测度的差异性度量方法进行初始的成员分类器选择,并选择合理的初始模糊密度,引入修正系数对模糊密度进行自适应动态调整,不仅降低了融合的规模,而且提高了整体的性能。针对无监督分类器融合算法可能出现的信息失真问题,提出了一种基于信息滚动机制的平均互信息方法,并通过实验验证了其有效性;然而,也发现随着规模增大,暴露出易被噪声聚类成员干扰的缺陷。因此,将问题拓展,提出了一种基于蚁群算法的匹配方法,该方法具有随着规模的扩大而优势越来越明显的优点,为未来解决聚类类别不匹配的情况提供了一个方向。在此基础上,提出了一种新的无监督分类器融合算法,该算法兼顾聚类质量与成员多样性,采用一种新的相似性度量,并依据度量结果先对聚类成员进行剪辑操作,再分组、选择,最后根据了每个聚类成员对每类别的贡献设计了一种新的加权函数,与其他方法相比,该方法具有较好的稳定性与精确性针对半监督分类器融合算法中的两类算法(多视图和单视图),提出了两种基于统计的协同训练算法。多视图方面,提出了一种改进的基于统计方法的多视图协同训练算法,该算法采用多元统计方法KCCA对两视图中变量组进行分析,并在KCCA的应用过程中利用类标号信息产生奖励或惩罚因子,使得抽取的同类样本特征之间的相关最大化,同时使得不同类样本特征之间的相关最小化,最后采用二次确认的投票方法进行标注。实验表明,该方法在有标记样本占比例较小时,具有较明显的效果。单视图方面,提出一种新的单视图协同训练算法,该算法通过最小显著性差异(LSD)假设检验方法使得三个成员分类器两两之间具有显著性差异,然后采用D-S证据理论提高标注的稳定性,再用局部离群点检测方法-LOF算法对剔除误标记的噪声样本,从而很大程度上保证了新标记样本的纯净,实验验证该方法具有较高的分类精度和稳定性。
其他文献
科学确定风险,而人们感知风险。许多影响社会稳定的风险之所以最终演化为严重的社会冲突,并非由于风险巨大而难以遏止和化解,而在很大程度上是根源于不同主体的风险感知差异,
<正> 在每天的生活中,有一种东西,我们会不自觉地使用,然后轻易地丢弃,那就是牙签。这种如此被人忽略的商品,在日本是怎么制造出来的?而且又形成怎样的市场状况呢?河内长野这
期刊
<正> 佛教传入中国至隋唐分为若干宗派:天台、唯识、律、净土、华严、禅等等。至唐以后,其他宗派均先后衰落,而禅宗的影响越来越大,终至独秀,究其原因或有许多方面,但就禅宗
英语委婉语是一种语言文化现象,人们对它的选择和使用都是为了实现某种目的。本文从语用学的角度出发,通过一些例子,观察并探讨说话人在使用委婉语(主要是语境中的委婉语)时
随着社会生产力的不断发展,人们生活水平不断提高,信息传递日益加快,传统的单一的行政管理手段应对复杂的城市公共事务已是力不从心。唯有加快推进城市公共管理方式的改革,提
《中国译学理论史稿》译学理论史研究的开创之作,本文将从该书的翻译理论与翻译史两方面的开创性进行评述。
当前高职体育面临着发展的机遇与严峻的挑战,如何充分发挥高职体育教育功能,是目前高职院校体育生存和发展所必须面对的课题。本文主要从高职体育与社会需求,中日近代竞技体
经过多年的努力,我省高职院校"双师型"师资队伍的建设,在经历了被动适应期、探索发展期,已进入了规范建设期,取得了一定的成绩。大部分院校的"双师型"教师总量已达到教育部要
陈染的创作在文学史上展示了动态的发展过程,从八十年代早期作品的喷薄式书写,到九十年代后以一种怀旧式的回忆对日常生活焦虑的表述,其小说文本内在的创作模式也体现了主体