基于内容匹配的大数据溯源技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kongque168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来和大数据技术的不断发展,海量数据涌入互联网。海量数据资源中蕴含着大量的可用信息,在科研和商业领域都具有巨大的应用价值。与此同时,数据的信息安全问题也逐渐地显现出来。数据非法泄露、数据盗用和数据丢失等安全问题频频发生,给个人、企业和国家的信息安全都造成很严重的影响。为了解决当前存在的信息安全问题,许多科研人员投身于数据溯源技术的研究。数据溯源技术是对非法泄露数据的追根溯源,找到泄露数据的真实来源,达到数据库版权保护的目的。目前存在的数据溯源技术都是应用在数据库可控非法泄露场景,对应用在数据库不可控非法泄露场景的数据溯源技术研究较少。针对数据库不可控非法泄露场景,本文提出了基于内容匹配的大数据溯源技术。基于内容匹配的大数据溯源系统由三个模块组成,包括溯源数据库建立模块、溯源数据库筛选模块和溯源数据库匹配模块。三个模块层层递进构建出三层内容匹配结构模型实现待溯源数据表与原始数据库的匹配,达到版权保护的目的,实现大数据溯源。首先,为了缩小待溯源数据表的匹配空间,本文提出了溯源数据库建立算法。该算法借助于DBSCAN聚类算法实现原始数据库的聚类,形成聚类空间,再通过相异度计算公式计算出待溯源数据表与聚类空间中心的距离,找到与待溯源数据表相似的聚类空间作为溯源数据库。其次,为了更加精准地实现待溯源数据表与溯源数据库的匹配,本文提出了溯源数据库筛选算法。该算法借助于改进的Siamese网络将溯源数据库中与待溯源数据表相似的数据表筛选出来。将待溯源数据表和溯源数据库中的数据表的特征矩阵输入到训练好的网络模型中,最终确定两个数据表是否相似,完成溯源数据库的筛选,缩小待溯源数据表的匹配范围。最后,为了找到待溯源数据表的真实来源,本文提出了溯源数据库匹配算法。该算法借助于数据表排序加滑动窗口的方法确定待溯源数据表在溯源数据库中的真实来源,实现基于内容匹配的大数据溯源技术。通过仿真实验验证基于内容匹配的大数据溯源系统的三个组成模块的功能并测试系统的性能指标。首先,对模块的功能进行测试,实验结果表明每个模块实现的功能与系统的设计需求一致。其次,对系统的功能进行测试,实验结果表明系统能够实现数据溯源。最后,对系统的性能指标进行测试,实验结果表明当数据库遭到恶意地攻击时,系统具有较高的抗攻击性能。
其他文献
在危机情况下,如短期灾难或大流行(新冠肺炎-19)等长期事件,Twitter可能是一个有价值的信息来源。社交媒体通常能以比官方新闻等传统来源快得多的速度提供有关变化的事实,也能提供关于事件的个人观点,如在危机和大规模紧急情况下的观点或独特要求,Twitter正越来越多地被用作一种流行的信息来源,用于交流和分享危机环境下的情况,报告受影响的人员和伤亡情况。该领域的最新研究证实,此类社交媒体信息可用于
学位
<正>在敦煌壁画中我们经常会见到五弦琵琶,但真正的五弦琵琶是什么样子的呢?我们一起去看看吧!日本正仓院,位于日本奈良县的东大寺内,是用来保管寺内珍贵物品的仓库,建于公元8世纪中期的奈良时代。在我国唐开元二十一年(公元733年),大唐僧人鉴真第6次远渡重洋来到日本,他所带去的中国的佛经、医药、书法等众多珍贵物品都存放在正仓院内。在正仓院中,还有一件极其珍贵的乐器,那就是唐代螺钿(dian)紫檀五弦琵
期刊
水文监测是及时获取河流湖泊水情的有效途径,其中关键的一环是水位观测。水位观测是指对河流湖泊等的水位进行实地测定,它不仅能够直观地反映河流水情,还有利于及时发布水情预警。近年来,基于计算机视觉技术的图像测量方式开始应用于水位观测任务中。使用传统图像处理技术的水尺检测和水位识别方法需要手工设计特征,这严重影响了检测和识别的性能。而深度学习的方法通过卷积神经网络来自动提取特征信息,可显著提升检测和识别的
学位
在如今的大数据时代,现实世界中的很多应用都可以建模为图,如社会网络分析、交通网络分析等,并且图的规模通常达上亿或更高级别。大规模图需要在分布式图处理系统中处理和挖掘,如GraphLab、Giraph等。图划分是分布式图计算的基础工作,其作用是将大规模图划分到集群中的不同机器上。分布式图计算的性能主要由运行最慢的机器和不同机器间的通信成本决定。因此图划分的质量对分布式图计算的性能有很大的影响,其目标
学位
随着信息技术的发展,各种大数据应用层出不穷,如超高清视频、智慧城市、智慧医疗等。这些应用的数据量往往很庞大,计算任务的场景多种多样,有基于完全可分的大数据的应用,如图像处理应用,可以将图像看作大规模任意可分的像素点;也有基于粗粒度可分的大数据的应用,如矩阵运算(可以将矩阵看作行向量或纵向量上的运算)和音频视频处理(可以将音频和视频看作是由多帧数据和多段连续画面构成)等。可见,大数据往往任意可分或粗
学位
癌症是一种由于病变细胞失去正常的调控机制从而不停自我繁殖的疾病,诱发癌症的病因并未被医学研究人员从根本上发现,所以癌症很难有效地预防。并且因为癌症是由于体内细胞异常导致的,与常见的大部分疾病不同,无法使用常规的医疗手段治疗,而目前常用于治疗癌症的放疗和化疗手段会杀死人体内正常的细胞,具有非常强烈的副作用,所以对癌症的预防与治疗是当代医学需要攻克的一大难题。传统划分癌症的方法是根据细胞病变的组织器官
学位
随着社会经济的快速发展和安防需求的不断增长,多相机视频监控系统被越来越多地应用到交通管理、社会安防等众多领域。多相机监控系统在实现场景多视角和全方位监控的同时,也面临着海量监控视频分散孤立的问题。因此,如何通过多相机协同工作,对监控视频中的视觉信息进行提取和关联,实现综合分析是当前多相机监控系统需要解决的关键问题之一。针对其中涉及的多相机协同目标分析问题,本文重点研究了多相机协同多目标跟踪算法,分
学位
在中国歌剧发展史上,革命题材歌剧一直都是浓墨重彩的一页。从《白毛女》到《小二黑结婚》,从《江姐》到《金沙江畔》,一代又一代文艺创作者“承百代之流,会当今之变”,创作出一部又一部满足大众审美旨趣、传播当代中国价值观念的作品。本文以此为背景,分析歌剧《金沙江畔》的叙事策略,试图以小见大,讨论革命题材歌剧在叙事维度上的创作范式。
期刊
光束法平差(Bundle Adjustment)是一种利用给定的三维点以及相机位姿的初始估计,通过最小化重投影误差的方法来实现相机参数和三维点坐标优化的算法。在实际应用中图片的特征点数量繁多导致光束法平差算法中的计算量巨大,极大的限制了算法的执行速度,并且导致内部数据缓存所需存储空间庞大,造成了算法执行速度缓慢,数据的读取和存储缓慢,实时性差的问题。为了解决光束法平差算法中因计算量巨大而导致的算法
学位
随着无人驾驶系统和移动机器人等领域的发展,商用深度传感器(如激光雷达,To F相机等)得到了更加广泛的应用。在智能车辆或机器人上通常配备了大量的传感器,主要是深度传感器和可见光相机。这些传感器可以为定位、测绘、障碍检测等不同的任务提供信息。其中深度传感器可以提供周围场景的三维空间信息,而可见光相机可以提供环境的色彩纹理信息,将二者信息结合有助于对周围场景进行更准确和更具体的观测分析。对于许多联合使
学位