异构信息网络多对象kNN查询技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:yinje2004_2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构信息网络kNN查询在数据挖掘领域有着广泛的应用,如链接预测、信息检索、个性化推荐等。现有的相关算法是给定一个查询对象,返回k个目标类型对象。而实际上,很多需求是查询与多个对象相关的实体,即多对象kNN查询。为了解决这个问题,本文针对异构信息网络多对象kNN查询算法开展相关研究工作。根据查询语义的不同,本文提出两种查询框架:基于特定语义的多对象kNN查询(Specific Semantic based Multi-object k-Nearest Neighbor Query,SSM-kNN)和基于融合语义的多对象kNN查询(Fusion Semantic based Multi-object k-Nearest Neighobr Query,FSM-kNN)。SSM-kNN采用元路径表示查询语义,选择单条元路径在信息网络上进行相似性和相关性计算,只考虑查询对象与目标对象间已有的特定联系,完全依照用户意图进行查询处理。FSM-kNN则综合考虑多种关联关系进行kNN查询,不仅利用网络中的显性关联语义,同时纳入了隐含关联语义。由于查询语义的不同,SSM-kNN中的多个查询对象必须是相同类型,而FSM-kNN对查询对象类型则没有限制。针对基于特定语义的多对象kNN查询,元路径可以由用户给出,对于网络结构复杂而用户难以给出查询元路径的情况,本文提出了基于关联分析的元路径确定算法,通过分析查询对象间的隐含语义确定查询元路径。根据对象影响力,本文提出了查询对象集合与同类对象间的相似性度量算法m-Path Sim(Multi-object Path Sim)以及与异类对象间的相关性度量算法m-Avg Sim(Multi-object Avg Sim)。为了解决多对象暴力kNN查询速度较慢的问题,本文提出了基于邻接矩阵过滤的多对象kNN查询算法和基于上界过滤的多对象单色kNN查询算法。最后,实验结果表明了多对象kNN查询算法的有效性,而两种过滤算法能够提升30%到90%的查询效率。针对基于融合语义的多对象kNN查询,本文首先提出了网络嵌入算法Repeat Random2Vec,利用基于元路径的重复随机游走算法和异构Skip-gram算法融合查询语义,将网络映射到低维向量空间中。为了分析查询对象间的关联关系,本文提出了查询对象集合语义偏向分析算法,通过构建子网络计算共同关联对象,用于增强查询对象间的隐含语义。针对低维向量空间,本文将多个对象对应的特征向量转化为一个重心向量用于距离度量。为了解决低维向量空间kNN查询效率问题,本文提出了基于Balltree的多对象kNN查询算法以及基于Voronoi图的多对象近似kNN查询算法。本文通过大量实验,证明了网络嵌入算法Repeat Random2Vec和基于融合语义的多对象kNN查询算法的有效性,而查询优化算法则可以将查询效率提升88%到90%。最后,本文设计并实现了多对象kNN查询系统,提供了交互良好的查询界面,验证了算法落地应用的可行性。
其他文献
学位
学位
偷税行政责任与逃税刑事责任的认定与追究相辅相成,是打击偷逃税违法行为与保障国家税收收入的有效法律武器。面对立法上有关偷税行政责任与逃税刑事责任的冲突现状,如何进行有效的协调以更好地发挥其应有之作用,已成为当前亟需解决的现实问题。从本质上来看,逃税刑事责任是因偷税行为之量变引起的质变而产生的,因而偷税与逃税在客观行为要件上应保持基本一致,在主观要件上亦不能忽视偷税之故意的存在。就偷逃税法律责任的具体
我国自改革开放以来,经济迅猛发展,随着国家城市化、工业化、现代化进程的不断推进,越来越多的农村劳动力流动到城市当中,发生大规模的社会流动,这也导致了农村留守青少年这一社会流动的“衍生品”产生。这些农村留守青少年在父母外出打工后,面临着挑战,经过调查发现,农村留守青少年整体具有抗压能力弱、易出现偏差行为以及情绪问题多等群体特征。本研究运用定性研究为主、定量研究为辅的研究方法,通过在研究地开展半结构式
我国正大力推广装配式建筑。作为装配式混凝土结构中最重要的体系,装配式混凝土框架结构在遭遇意外的极端荷载,例如爆炸、撞击、火灾时,其局部构件的损伤或破坏可能引发整体结构的倒塌,引发严重后果。与传统现浇混凝土框架相比,装配式混凝土框架存在节点薄弱、拼缝及节点处受力复杂、整体性差等问题,发生连续倒塌的风险性更大。因此,研究如何防止装配式混凝土框架结构发生连续倒塌,具有重要的科研价值和工程意义。本文在分析
学位
智能小车是目前常见的运动载体,随着人工智能和计算机技术的发展,与其相关的研究也受到越来越多的关注。目前,智能小车的主要研究方向为定位,路线规划,运动控制等内容,其中运动控制是智能小车相关领域研究的基础。常用的控制方法在解决智能小车轨迹跟踪问题上仍然存在响应速度慢,抗干扰性差等不足。本文主要针对上述缺点,设计控制器抵消智能小车系统在轨迹跟踪时的不稳定因素。首先,本文提出一种智能小车轨迹跟踪的多维泰勒
由于长期的物理和化学风化作用,大量不连续且不均匀的节理存在于岩体结构中,使得天然状态下的岩体成为具有复杂特性的地质体。当冲击荷载或爆炸作用产生的应力波在岩体结构中传播时,不连续的节理面对应力波传播规律产生影响,造成不同程度的应力波衰减现象。同时,节理构造改变了岩体结构的强度和刚度,极大程度地威胁到岩土工程的安全性。人们需要更深刻地认识节理构造对岩体的影响,理解和评价岩体结构的动力学响应,从而开展对
复杂网络能够用来描述社会和自然界中的许多系统.如万维网、因特网、细胞网、国际机场网、生态网、科学家合作网等等.其中网络结点表示系统的元素,两点间的连线表示元素间的相互关系.无标度特性是复杂网络的一个重大发现.实证研究表明,众多实际网络都具有无标度特性,即:网络的度分布P(k)具有幂律尾部,即P(k)~k-γ(对于大k).为了研究这类网络,已经有许多网络演化模型被提出了本文主要研究层次网络和伪分形网
目的:通过肾脏超声微泡造影(contrast-enhanced ultrasonography,CEUS)及其定量分析技术观察感染性休克患者应用特利加压素后肾皮质区域血流灌注情况。旨在探讨特利加压素对感染性休克患者肾脏血流灌注的影响。方法:(1)选取2019年9月至2020年1月,2020年5月至6月东南大学附属中大医院重症医学科收治的符合入选条件的感染性休克患者为研究对象,并随机分为对照组和实验