【摘 要】
:
随着计算机技术和互联网技术的快速发展,互联网上的多媒体数据急剧增加。随着数据量的增加,分类问题的规模变得越来越大,其中包括样本数量、特征维度和分类的类别数目的快速
论文部分内容阅读
随着计算机技术和互联网技术的快速发展,互联网上的多媒体数据急剧增加。随着数据量的增加,分类问题的规模变得越来越大,其中包括样本数量、特征维度和分类的类别数目的快速增长,这给分类算法的效率和准确率带来了严峻的挑战。如何管理这些大量的数据以及如何在大量类别中进行分类是目前急需解决的问题。面对这样的问题,人们开始借助于层次结构这一辅助工具,人类通过层次结构来管理大量的数据,包括生物系统分类学的层次,文本类型的层次等。因此有研究者提出了层次分类(Hierarchical Classification)方法来解决类别数量特别多的分类问题和语义化的分类问题。在已有层次分类研究的基础上,本文提出了一种层次分类的框架,主要包括两个关键部分,类别层次的自动构建方法和基于结构化支持向量机的层次分类模型。具体的研究内容包括以下几个方面:(1)在类别层次构建方面,本文提出了一种融合多种类别语义关系的算法。该方法利用多核学习的思想,通过学习不同语义类别关系的权值系数来融合多种类别语义关系,在融合后的类别关系基础上实现了一种基于谱聚类的类别层次的自动构建算法。在两个数据集上的实验验证了本文构建层次的算法有效性。(2)在层次分类方面,本文将给定层次结构的分类问题转化到结构化学习框架中,利用结构化支持向量机进行层次分类,在融合后的类别关系基础上提出了一种语义化的损失函数,使得分类结果更语义化。实验表明了本文层次分类框架的有效性,并验证了本文提出的语义化的损失函数。(3)将基于结构化支持向量机的层次分类框架应用于蛋白质折叠模式识别问题,将不同蛋白质序列的多种特征融合到一起,提出了一种基于层次结构的损失函数,并在基准数据集中验证了层次分类框架在蛋白质折叠模式识别应用中的有效性。
其他文献
嵌入式系统是一个快速发展的领域。U盘作为一种便利的存储设备,广泛地应用于嵌入式系统中。目前,越来越多的嵌入式产品都具有USB接口功能,但实际指的是下位机的功能,不具备主动识
在快速扩散制造模式下多企业环境中,由于企业与企业之间缺乏一个全局的知识服务平台,工程技术人员很难获取其它企业中的相关知识,并且企业内部的知识搜索也没有考虑到员工的
2017年2月J Hepatol发表了加拿大Mamatha Bhat等的论著《基于肝癌相关肿瘤特征和动力学的一种新型MELD评分系统的建议》[Bhat M,Ghali P,Dupont B,et al.Proposal of a novel
网络控制系统(Networked Control Systems, NCS)是一种通过网络实施控制的控制系统,它将通信网络引入到控制系统中,实现了系统各节点共享网络资源和分布式控制方式,由此给控
随着我国改革开放的深入以及加入WTO,我国金融行业自由化、国际化的速度逐渐加快,国内各商业银行除了彼此之间相互竞争外,还将迎接许多世界级外资银行的挑战。中国银行业在失去
在软件工程研究的发展中,面向功能的结构化方法和面向对象方法被广泛应用。传统软件开发方法的基本技术是结构分析和结构设计技术。它是围绕实现处理功能的“过程”来构造系
Vitis amurensis is a valuable resource for wine production. Ripening of the grape berry is the key phase which determines the composition of wine. To better und
随着云计算网络服务的高速发展,大量用户把自己的敏感和隐私数据存储在云服务器上,因为用户通过外包把私有数据存到服务器上,那么用户对于数据的绝对控制权就会失去,云安全也
在数据挖掘过程中,常常存在与数据模型或数据一般规律不符合的数据对象,这类与其它数据不一致的数据对象就称为异常数据,它们往往容易被人们所忽略。然而,这些数据对象可能是具有
元胞自动机(Cellular Automata,简称CA)是一种时间、空间和变量均离散的数学模型,已被广泛应用于各种物理现象的模拟。粒及粒计算的概念来自Rough集理论,是Rough集理论的扩展