基于数据集特征的自适应子图匹配算法的设计与应用

来源 :东华大学 | 被引量 : 0次 | 上传用户:tshanyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代下,常见的数据网络如社交网络等的快速发展,使得生活中每天都会产生海量的多源异构数据。图模型作为一种独特的非线性数据结构,适合用来对海量数据进行建模,并且能够较好的描述海量数据之间复杂的内在关联性。如何分析和挖掘出图中有价值的信息,成为了当下的一个研究热点。子图匹配技术用于从一个给定数据图中搜索枚举出全部的能够与给定查询图相匹配的子图,是一种分析和挖掘图中有价值信息的关键性技术,在生物信息学、社交网络分析等领域中有着广泛的应用。随着数据图的规模不断扩大,如何加速子图匹配过程成为了主要研究问题。现有的子图匹配算法可以分成过滤、排序、和枚举三个步骤。最近的一项研究指出,现有算法在每一步中的性能与数据图的特征密切相关。然而现有的算法都没有考虑数据图的特征对算法性能的影响。针对以上问题,本文将基于数据集的特征设计一种高效的子图匹配算法,以加速子图匹配过程。同时,本文设计了一个子图匹配系统,该系统可以应用在社交网络分析、生物分析等场景下,便于用户高效查询不同数据图下的子图匹配结果,并且还具备展示图的结构、比较不同算法的查询效率等功能。具体来说,本文的研究内容如下:(1)本文研究分析子图匹配的代表性算法,通过对现有算法的研究,分析出数据图的哪些特征会影响算法每一步的性能。(2)本文针对特征影响因素设计了一种数据图预处理方法。在预处理方法中首先定义了标签密度,用以区分一个数据图是否包含大量重复标签。其次结合图的平均度、社区结构以及边密度特征,定义了图密度,用以区分一个数据图的稀疏程度。(3)本文提出了一种可以根据数据集特征进行自适应调整的高效子图匹配算法AC-Match。该算法首先预处理数据图,获取标签密度和图密度。其次根据标签密度及图密度,采用适合于数据集特征的过滤、排序和枚举方法,将其进行组合,形成一个能根据数据集特征进行自适应调整的高效子图匹配算法AC-Match。(4)本文在八个真实数据集上进行了大量的实验,主要从匹配查询时间和消耗的内存空间两个方面对比AC-Match算法与其他五种代表性子图匹配算法的性能。实验结果表明,AC-Match算法的性能优于其他五种算法。(5)本文设计开发了一个子图匹配系统。该系统集成了AC-Match算法以及其他一些代表性的子图匹配算法,主要实现图文件上传、图可视化、执行子图匹配、匹配结果可视化、相关信息显示等功能,满足用户在各种领域的子图匹配查询需求。
其他文献
目前国内普遍采用三维可视化技术对变电站内变压器等设备进行建模,虽然一定程度上解决了传统管理方法存在的管理协同工作的难题,但随着电力系统呈现开放式的发展趋势,其非线性、高维度等特征给三维数字可视化带来巨大的挑战。需要深入对变电站设备间的联动机制、约束关系及动态运行过程表达方式方法开展研究。本项目采用ROPN系统工程建模方法能够对变压器运行状态过程进行全方位、细粒度的机理建模,构建变压器运行系统的数字
期刊
随着科学技术的飞速发展,机器翻译应运而生,机器翻译技术也在发展的过程中取得了很大的突破,并且仍在不断完善之中。当下,百度等互联网公司开发出了一系列网络翻译引擎,以满足大众的需求,特别是受到了翻译行业的青睐。在很大程度上,机器翻译已经成为高效翻译流程的重要组成部分。即便如此,机器翻译的实际翻译质量还是难以与人工翻译相媲美,而机器翻译-译后编辑(MTPE)模式有效弥补了机器翻译的不足,受到了许多语言服
学位
以火电机组锅炉侧的换热四管为研究对象,采用非参数建模方法建立其对应的状态估计模型,通过聚类获取正常工况下的状态矩阵,结合专家知识库准确地对锅炉四管进行故障预警。仿真实验结果表明,所提的非参数建模方法能够在故障微小变化的早期侦破出异常,实现设备早期的故障预警,具有较好的工程推广前景。
期刊
该英译汉翻译项目的材料来源于英国教育部针对英国职前教师培训(ITT)的项目文件。文件包括职前教师培训项目内容、英国教师的规章制度、项目标准等一系列内容,具体论述了参训教师的权利与义务,借助各培训单位的项目落实情况进行广泛的案例研究,详细解读了英国的职前教师团队建设的经验与成果。此次翻译以交际翻译理论为指导,总体采取归化的策略,以读者为中心,以交际为目的。案例分析主要从词汇和句法两个方面进行分析。词
学位
经济、文化日益全球化的今天,随着多媒体技术的快速发展,为了进一步满足国内观众的多样化需求,越来越多的外国影视作品、电视节目等进入中国。从翻译研究的角度来看,这也进一步推动了影视翻译在翻译领域的发展。然而,目前影视翻译研究的对象较单一,集中在电视剧和电影上,而影视翻译的具体策略又因作品类型的不同而存在差异。因此,笔者基于在上海电视台的翻译实践,以大阪NHK新闻作为主要的研究对象,以功能对等理论为指导
学位
随着近年来无人机产业的迅速发展,消费者更加青睐无人机产品。无人机的使用涉及到国家空域和个人隐私等问题,因此需要提高消费者的合规操作意识,此时对相关监管文件进行汉化翻译就尤为必要。本翻译实践报告基于笔者在海通国际实习时翻译的《无人机系统飞行操作和用户手册》,详细描述了从译前准备到项目交付的翻译全过程。全文共分为四个章节:第一章是翻译项目描述,主要介绍该项目的背景和意义;第二章从译前准备、译中执行、译
学位
基于我国科技成果评价改革的时代背景,通过对山西省科技成果评价改革的政策分析,结合山西省科技成果评价工作实际需要,从标准制定、机制建设、评价机构和人才培育、成果评价数字管理平台搭建等方面,提出推进山西省科技评价体系建设的关键要素,以及科技成果评价改革的具体实践和探索。
期刊
随着网络的快速发展和广泛应用,网络信息安全问题日益受到重视。用户身份认证系统是数字社会的核心基础设施,其中最被广泛使用的身份认证方法有数字签名和生物认证。然而,利用数字签名进行身份认证时,由于签名方案一般要求签名密钥是均匀随机的,生成并安全存储这样的签名密钥对用户来说是一种负担;利用生物认证进行身份认证时,一般需要用户在注册阶段把生物信息录入并存储到中心服务器上,一旦中心服务器被攻破,就会导致生物
学位
2019年,突如其来的新冠肺炎疫情不断扩散,给中国、日本乃至全世界经济及各国间的相互贸易往来产生巨大冲击,致使当前各国间贸易格局出现特殊时代背景下的新变化。从贸易形式来看,跨境电商、数字服务贸易等数字化贸易发展前景非常可观,亚太地区贸易数字化进程也在不断加快。近年来在经济社会急速数字化的背景下,人们对于网络安全和数据跨境移动相关的国际通用规则缺失的担忧越发强烈。各个国际组织、论坛正在积极开展世界通
学位
对话系统指通过自然语言与用户进行对话的系统。对话系统通常嵌入在应用系统中,提供对话式的客服、内容搜索等服务,为用户带来更加智能的体验。企业服务管理云平台是为政府管理机构汇集企业信息,以便更好地为企业提供服务的平台。为了便捷地了解辖区内企业信息,需要为平台提供一个智能检索工具。为此本文基于Rasa多轮对话框架,针对企业信息设计实现了智能检索助手,实现了基于语音问答的企业信息查询统计功能。同时对Ras
学位