【摘 要】
:
随着互联网络的快速发展,视觉大数据高通量计算以及海量多媒体内容监控与过滤等实际应用的日益迫切,传统的视觉大数据分析系统的时间复杂度和空间复杂度正面临严重的挑战。其中,紧致化视觉表征与计算是视觉大数据中的核心问题之一,也是计算机视觉、机器学习、数据挖掘等领域的研究热点之一。围绕这一核心问题,本论文将面向大规模视觉搜索与高通量多媒体计算等应用的紧迫需求,展开了关于紧凑性特征的理论研究和技术攻关,尤其是
论文部分内容阅读
随着互联网络的快速发展,视觉大数据高通量计算以及海量多媒体内容监控与过滤等实际应用的日益迫切,传统的视觉大数据分析系统的时间复杂度和空间复杂度正面临严重的挑战。其中,紧致化视觉表征与计算是视觉大数据中的核心问题之一,也是计算机视觉、机器学习、数据挖掘等领域的研究热点之一。围绕这一核心问题,本论文将面向大规模视觉搜索与高通量多媒体计算等应用的紧迫需求,展开了关于紧凑性特征的理论研究和技术攻关,尤其是针对基于二值表示的紧凑特征表示学习的研究。然而,紧凑特征获取的过程通常伴随信息的丢失,以及现存的紧凑特征表示模型通常存在许多缺陷和问题,包括特征编码的序列信息缺失、无法准确捕捉多媒体数据的关联性、多模态数据存在缺失、特殊流形结构特征处理复杂,等等。从不同的检索任务出发,本论文针对上述问题进行了大量的调研与研究,重点研究和讨论紧凑特征模型在三个信息检索任务中的应用,包括大规模近似最近邻搜索任务、多模态数据检索任务以及图像集合处理任务。我们抽象出三个层层递进的核心科学问题,并且创新性地提出了对应的解决方案。首先,面向传统大规模数据检索任务,我们首次将序列嵌入问题引入紧凑特征表示学习,将问题拆解为序列信息构建、序列信息删减、序列信息保留以及离散优化等子问题,逐步对每个子问题进行详细且深入的探索。其次,在面向多模态数据检索任务上,我们着重关注多模态数据关联性的度量、多模态缺失数据的补齐、以及紧凑特征学习等模块,实现多模态数据搜索,以满足于当下多媒体大数据搜索的需求。最后,在面向图像集合处理任务上,我们以黎曼网络为基础,充分挖掘与分析现有几何网络模型存在的问题,将几何网络与紧凑特征学习结合,提出了一种高效的深度黎曼网络模型。具体而言,本论文将展开以下五个主要工作:1)提出一种基于序列嵌入的哈希算法,目标是学习具有保留特征序列信息的二值紧凑特征。算法先后提出序列嵌入、序列图嵌入、序列锚图嵌入等由繁至简的排序信息表示与高效紧凑特征建模方法,并且设计了一种简单的优化策略。2)提出一种基于序列约束的哈希算法。该算法以序列嵌入模型为基础,关注高阶的四元序列约束关系,提出了张量序列图模型和序列约束投影算法,实现了大规模序列关系建模与信息删减,并且设计了一种针对正交约束的优化算法。3)提出一种基于近邻集合相似度的哈希算法,方案提出了一种基于近邻集合相似性度量方法,实现了更好的多模态数据之间的关系表示,并且结合非对称图模型和离散优化算法实现多模态数据的二值紧凑特征学习。4)提出了一种基于密集链接网络的哈希算法,旨在解决模态数据缺失这一现实中广泛存在的问题。方法由基于密集链接的自编码器和变分哈希学习两个模块组成,分别实现缺失模态特征补齐和二值紧凑特征学习。5)提出了一种基于矩阵摘要的网络模型,其核心目标是实现基于视觉特征集合的分类和检索。以最新的深度黎曼网络为基础,提出了矩阵摘要网络结构,在充分考虑数据分布和多样性的条件下,算法实现高效且准确的基于黎曼流形特征的紧凑表示与分类。综上所述,本文针对大规模视觉搜索与高通量多媒体计算等任务上开展了一系列的研究与创新,提出了一系列的紧凑特征表示方法。大量实验结果和理论分析表明,本文提出的五种方法都可以提升对应检索任务的性能。
其他文献
本文,我们研究求解Hamilton-Jacobi(HJ)方程的有限差分Hermite加权本质无振荡(Hermite Weighted Essentially Non-Oscillatory,HWENO)方法,以及求解多介质流问题的高精度的守恒的有限差分方法。主要研究成果为:1、我们设计了求解Hamilton-Jacobi方程的有限差分方法。我们在插值过程中同时使用了函数值和导数值,并且同时演化它们
本学位论文运用变分方法和临界点理论,研究了二类Schr?dinger-Poisson系统和一类拟线性Schr?dinger方程解的存在性,总共分为五个章节,主要内容如下:在第一章,简要介绍了研究的物理背景,研究问题所需的概念、定理、记号等预备知识.在第二章,我们研究了如下带有未定非线性项的Schr?dinger-Poisson系统这里λ,μ>0,20是一个参数,V和f满足—些合适的假设条件.在第四
目的:颅内压(intracranial pressure,ICP)监测对创伤性颅脑损伤(traumatic brain injury,TBI)患者精确指导术后管理,提高其生存率并改善预后具有重要意义。医务工作者不仅可以通过ICP值直接判断患者颅内情况,而且可通过脑血流(cerebral blood flow,CBF)计算公式间接得出CBF变化,对后续诊疗措施的施行提供极大便利。然而,CBF计算公式
2-20 μm中红外激光因其波段的特殊性,在通信、传感、军事、医疗和科研等领域有着重要的应用前景。在众多中红外激光的产生方法中,中红外光纤激光器具有结构简洁、易维护、稳定性好和转换效率高等优点而深受科研界的关注。尤其是中红外超短脉冲光纤激光器,它不仅拥有光纤激光器的固有优点,还具有高的峰值功率、较低的能耗和超快时域特性。为此,开展中红外超短脉冲光纤激光器研究将是十分有意义且刻不容缓的工作。然而,目
能源是人类社会可持续发展的重要物质基础,也是当今全球国家共同关注的话题。随着经济的高速发展、人口的快速增长、混合动力汽车的飞速发展,以及便携式电子设备的需求日益强烈,无疑会加快全球能源消耗速度,给人类敲响能源短缺的警钟。因此,寻找清洁、可持续和可再生的新能源,以及开发先进、低成本和环境友好的相关存储技术已迫在眉睫。作为介于传统电容器和电池之间的新型能源存储装置,超级电容器因其具有功率密度高、循环寿
疟疾是由疟原虫感染引起的虫媒传染病,每年导致全球约40万人死亡。疟原虫属于顶复门原生动物,在按蚊和脊椎动物两个宿主交替寄生。当按蚊叮咬疟疾患者时,具有传播能力的雌雄配子体随着吸血进入按蚊中肠内,迅速激活为具有受精能力的雌雄配子,进一步受精形成合子。合子变形发育为具有运动能力的新月形动合子,动合子穿越按蚊中肠建立感染。合子-动合子的变形发育是疟原虫完成按蚊传播的必需步骤。疟原虫细胞质膜膜下排布的细胞
酶是一类具有催化功能的复杂生物大分子,在生物体内扮演着不可或缺的角色。弄清楚自然界中生物体内的酶催化过程,不仅可以帮助我们揭开生物催化的神秘之处,也有助于新型高效仿酶催化剂的研究与设计。酶催化的全过程一般包含了底物输运进入活性区,底物在活性位的结合,催化反应的触发以及产物释放离开活性位这四个化学和非化学步骤。探明化学步的催化反应机理和非化学步的转运通道机制对酶催化过程十分重要。在本论文中,应用经典
利用环境友好的太阳能驱动光催化CO2还原制燃料和化学品,是解决全球环境问题和能源危机的一种可持续有效途径之一。虽然,光催化还原CO2已经得到广泛的研究,但是至今为止该过程的能量转换效率依然很低。设计和开发具有高转换效率的光催化CO2还原催化剂仍然是一个巨大的挑战。光催化还原CO2的过程不仅面临着与光催化分解水相同的问题,如:大多数催化剂禁带宽度较宽无法满足对可见光的吸收以及光生电子空穴(e--h+
牛疱疹病毒Ⅰ型(Bovinehepersvirus Ⅰ,BoHV-1),又称牛传染性鼻气管炎病毒(Infectious bovine rhinotracheitis virus,IBRV),属于 α-疱疹病毒亚科,可引起急性、热性、接触性牛传染性鼻气管炎(Infectious bovine rhinotracheitis,IBR),该病在世界多个国家和地区不同程度地发生与流行。养牛业发达国家以疫苗
各类视觉神经网络作为生物学神经网络的仿生特征建模,分别在不同的视觉应用中取得了性能突出的识别和检测效果。因此,针对视觉神经网络的组织结构、信息传输、和训练推理等方面开展算法研究和架构设计具有重要的现实意义。本文首先对深度神经网络、细胞神经网络、脉冲神经网络进行了详细的算法研究,分别在跨域物体检测、图像滤波处理、视错觉分析、与目标定位等具体应用中对相关算法进行了充分的理论推导和实验论证。此外,针对视