跨模态敏感信息检索研究及应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:case_sheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络普及,新疆地区越来越多用户开始从互联网中获取信息。由于区域特殊性,网络中信息传播与获取使用户更加便捷的获取信息,但许多负面效应也随之而来,面向新疆地区的敏感不实信息以及涉疆、涉暴信息的传播迅速形成社会舆论,产生巨大的舆论压力。所以,采用有效措施及时对这些敏感信息进行管控以及处理迫在眉睫。这些敏感信息载体大多以文本、图像、视频等载体在网络中进行传播,传统检测方法多基于单一模态,无法处理网络中这些多源异构的数据。跨模态检索的引入有助于网络中多模态数据的处理与跨模态匹配,从而对敏感信息进行更加全面精确地检索标注,非常具有研究的意义与价值。总体来说,本文的研究主要工作如下:(1)提出了融合注意力机制的跨模态关联分析模型。该模型通过双向GRU网络学习文本特征的表示,再利用VGGNet-LSTM网络学习图像特征的表示,有利于文本与图像特征深层次细粒度表达,并采用注意力机制建立文本与图像之间的非对称链接,提供了与图像同步的强大文本表示形式,减小了图像文本之间的语义鸿沟。(2)提出了基于改进双编码的跨模态语义匹配模型。该模型通过联合使用多级编码,网络可以显式地逐步学习在视频和文本中表示全局、局部和时间特征。在与公共空间学习正交的同时,整个模型以端到端的方式进行训练,缓解了文本与视频之间的语义异构性。(3)设计并实现基于跨模态的敏感信息检索子系统。该系统对本文提出的模型在工程上的有效性与实用性进行了验证,包含了敏感信息标注、敏感信息检索以及敏感信息库建立三大功能。有效帮助工作人员对敏感信息进行实时管控与处理,满足了项目要求。
其他文献
面临全球温室效应的问题,我国采取积极应对的态度,提出力争在2030年前我国二氧化碳排放达到峰值,力争在2060年前实现碳中和。但大量高能耗,重污染,高碳排的企业在经济环境的推动下,不断地挑战着大自然的容忍极限,对环境可持续发展造成了重大威胁。随着2017年全国发电行业碳排放权交易市场的建立,对我国发电行业节能减排有了更高的要求,其中对火电企业的排放标准更是严格要求,火电企业不得不增加环保投入进而控
伴随着深度学习方法的飞速发展,人脸表情识别方法同样获得了快速发展,但是其仍旧面临着不少难题。对于不同的人类个体来说,即便是表达相同类别的表情,也会存在一定的差异,并且在实际生活中,人们在表达表情的同时还会伴随着言语,这些言语会造成口型的变化从而带来视觉差异,这种情况造成的表情类内差异性问题会严重影响到识别的准确率。同时,表情是一个动态变化的过程,以往使用二维卷积神经网络对单帧图像进行特征提取,忽略
随着计算机技术的迅猛发展,与计算机安全相关的攻防技术也在不断演变进化。本文关注的是众多攻击技术中的ROP攻击(Return–oriented Programming),攻击者控制源程序的返回地址来间接操控程序的走向,从而执行特定的攻击(一般是获取控制权限)。目前,ROP攻击通常利用的是系统内静态库和动态库中的短指令工具链(gadget),通过拼接这些gadgets,完成特定目标的攻击。而针对它的检
近几年来高送转现象是我国资本市场上的一大焦点,我国上市公司接二连三的推出高送转的股利政策,不仅中小投资者热衷于购买高送转股票,甚至还出现了高送转概念股。而在实施高送转的公司当中发现创业板公司占据了绝大多数,由于创业板公司股本规模普遍小于主板公司,又由于属于高新技术企业,具有高成长性的特点,可以利用高送转在快速扩大公司股本规模的同时,向外界传递利好信号。其实高送转的本质是把未分配利润和资本公积转增股
随着计算机技术的飞速发展,语音合成(Text-to-Speech,TTS)已经成为人机交互中不可或缺的一部分,并且在人机交互中扮演着重要角色。而目前针对于中文情感语音合成的研究还在萌芽阶段,大部分的研究还是中文语音合成,缺乏情感的加入。本文将研究基于循环神经网络的中文的情感语音合成。研究内容主要有如下工作:1.提出了一个基于循环神经网络的端到端的中文语音合成方法。该方法解决了在资源受限的条件下,经
近年来,我国A股市场规模日趋增大,日渐完善的监督审核机制使得上市公司外延式并购越来越频繁。并购伴随着较多不确定性风险,经常发生整合效果欠佳甚至并购失败。适时引入业绩承诺,可以规避并购交易中的高估值风险,保护相关各方利益。但越来越多的被并购方为了实现高溢价并购而做出了高额业绩承诺,忽视了公司本身有限的盈利能力,由此也产生了业绩“变脸”这一现象。经历了2013年的并购浪潮,业绩“变脸”问题也愈发突出。
区块链技术自诞生以来就由于它本身可追踪、不可篡改等特性成为了学界、产业界研究的热点。随着区块链2.0时代的到来,智能合约赋予了区块链解决更多实际应用问题的可能。然而,由于区块链技术账本公开透明的设计使用户的隐私安全受到了冲击,更为严重的是由于区块链去中心化的特性,使其不能有中心化应用一样的针对隐私泄露的弥补措施。为了满足区块链应用对用户隐私信息的保护需求,近年来已有相关研究人员对区块链隐私保护问题
现今,随着雷达技术的发展和研究的日益进步,雷达对目标的探测能力日渐成为工业领域、军事应用、汽车应用等各个领域不可或缺的技术。雷达测距是雷达的基本性能之一,其通过接收照射目标反射回来的回波能量完成测距的任务。调频法测距技术可以运用于连续波雷达中,调频连续波(FMCW:Frequency Modulated Continuous Wave)雷达通过向物体发射周期性的高频线性频率斜坡来测量距离,具有调制
学位
通过端到端的深度卷积神经网络结构来学习特征表示,然后使用控制变量实现对生成信息的特定属性控制则是信息生成研究的一个重点方向。虽然将控制变量与输入信息或特征图级联能够实现对生成信息的特定属性控制,但控制变量与输入信息或特征图之间存在的信息量差异过大和维度不匹配将对属性控制带来一定的困难。因此本文对控制变量的引入方式进行了具体的分析和研究,并做了如下工作:(1)本文提出了一种控制信息引入方式,通过引入