面向多模态数据的多分类与检索方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:y51211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的快速发展,包含有文本与图像等数据的多模态文档大规模地出现在人们的日常生活中。在信息的世界中,这些不同模态的数据资源可以无形地提升感觉器官接受知识的能力。尽管如此,由于多模态数据所呈现出的多样性、复杂性与随意性,人们很难从大量的数据资源中挖掘出对自己有用的信息。因此,为了更好地满足人们日益增长的各种需求,本文从多分类与检索的角度研究了多模态数据的智能化管理技术。  许多实际问题的解决方案均涉及到多分类技术,该技术可以有效地缩减用户与计算机的理解差异。在传统的多类Boosting方法中,多类损耗函数不一定具有猜测背离性,且多类弱学习器的结合被限制为线性的加权和。为了获得高准确率的最终分类器,多类损耗函数应该具有多类边缘极大化、贝叶斯一致性与猜测背离性。除此之外,弱学习器的缺点可能会限制线性分类器的性能,然而它们的非线性结合可以提供较强的判别力。根据这两个观点,本文设计了一个自适应的多类Boosting分类器,即SOHP-MCBoost算法。在每次迭代中,SOHP-MCBoot算法能够利用向量加法或Hadamard乘积来集成最优的多类弱学习器。这个自适应的过程可以产生弱学习的Hadamard乘积向量和,进而挖掘出数据集的隐藏结构。  对于一个多模态数据文档,模态内损耗可以捕获到每个模态数据的语义类信息,而模态间损耗可以挖掘到不同模态数据之间的语义相关性。传统的单模态Boosting方法没有考虑模态间损耗,这可能会增大相关数据的语义距离。为了共同地分析多模态数据,本文设计了一个包含模态内损耗与模态间损耗的多模态多类Boosting框架。对于多维泛函空间内的优化问题,这个框架可以利用梯度下降的策略来轮流地更新每个模态的预测器。在获得最优预测器之后,Sigmoid函数可以把相应的拟边缘转换成语义概念类的后验概率。经过这样的操作过程,语义空间的跨模态检索能够妥善地保存模态内的语义信息与模态间的语义相关性。  基于原始特征向量的内容相似性可以揭示每个模态数据集的内部结构,而基于语义特征向量的语义相似性反映了不同模态数据之间的相关性,二者的结合能够在一定程度上提高跨模态与多模态检索的性能。在一阶马尔可夫链中,每个目标对象的内容特征与语义特征可以分别表示一个隐藏状态及其对应的发射概率。根据多类逻辑回归或随机森林,具有一阶马尔可夫链的CCSS模型可以把每个模态数据的原始特征映射到一个共同的语义空间。通过在马尔可夫链内寻找一条最优的状态路径,CCSS模型能够为每个查询对象返回一条目标对象的索引序列。在这个序列中,相邻的目标对象具有类似的内容信息与语义信息。  不同模态的数据提供了互补的信息,它们的相互作用可以帮助人们在高层次上更好地理解多模态数据文档。在跨模态检索的过程中,具有两条一阶马尔可夫链的图模型(CCSSI)不仅考虑了不同模态数据的相互作用,而且结合了内容相似性与语义相似性。一条链中的对象可以转移到该链的另一个对象,却不能转移到另一条链上的任意对象。当CCSSI模型检索一条链中的对象时,另一条链中的对象能够补充有用的信息。在某一个时间步,最相关对象的选择同时依赖于两条马尔可夫链的隐藏状态。给出一个查询对象,CCSSI模型可以输出一条目标对象的索引序列。
其他文献
随着信息技术的迅猛发展,分布式计算架构也在经历着变革,Peer-to-Peer(以下简称P2P)就是其中一种很有前景的技术。P2P技术给我们带来的不仅是机遇,还有挑战,这是因为P2P网络
真实感场景的绘制是计算机图形学研究的热点和难点之一,它作为虚拟现实技术的关键部分,随着计算机图形学的发展,在近几年受到广泛的重视。本文不仅研究真实感场景的关键技术,而且
软件的生命周期,包括需求获取,需求分析,设计,实现,测试,发布和维护等·系列软件开发活动。软件过程模型是过程的一种抽象表现形式,它从理论的角度对过程的各个方面进行描述。在软件
可满足性问题(Satisfiability problem问题,简称SAT问题)是第一个被证明的NPC(Non-deterministic Polynomial Complete)问题,它是计算复杂性理论的奠基石,是计算机科学与人工
随着计算机技术和网络的飞速发展,数据库的应用十分广泛,深入到各个领域,越来越多的企事业单位、科研机构等将自己的数据库连接到Internet上,但随之而来产生了数据的安全问题。各
在数据集成环境中,一致性查询应答技术是一项管理非一致性数据的有效技术,它能在保持源数据不变的条件下,查询到要求的一致性查询结果CQA(consistent query answer)。目前CQA的
随着互联网的迅速发展,在线图片的数量呈现爆炸性的增长,尤其在最近移动互联网端的迅猛发展,图片作为其信息呈现的载体逐渐火爆。随着大量图片资源的涌现,在大规模的图像规模
随着医疗技术和嵌入式技术的发展与进步,家庭健康监护系统的使用逐渐普及。家庭健康监护系统是缓解目前老年人对有限的公共健康服务基础设施依赖,并为其提供更为长期有效的监护
为了保证网络资源的安全可控,网络接入控制已经成为当前主要的安全环节。其中,采用网络身份鉴别协议EAP同PKI技术相结合,成为了集通用、安全、高性价比于一身的做法。目前业
本文以基于控制流图的数据流分析技术为基础,研究C/C++程序中指针引用的合法性检查。首先分析指针非法引用的各种表现形式和产生原因,构建具体的检查规则;然后以控制流图为数据