社交网络中多维度Top-K查询算法设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liping668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
带有社交信息、空间位置信息以及关键字信息的社交数据能够帮助人们在社交网络中找到感兴趣的数据对象和用户,为此本文提出社交网络中的多维度Top-K查询,来满足用户的查询需求。综合考虑社交信息、空间位置信息和关键字信息,根据用户指定的评价函数计算社交网络数据的偏好得分,为用户返回偏好得分最高的k个结果。本文主要研究内容包括基于内存和外存的社交网络数据多维度Top-K查询所需的索引结构和查询算法。本文设计了多种索引结构以及查询算法来满足不同场景下的社交网络多维度Top-K查询,为用户相应的决策提供支持。针对内存中的社交网络多维度Top-K查询,本文提出适用范围不同的三种查询算法。首先,基于社交网络维度的查询算法从查询节点出发层次遍历社交网络,更新未遍历数据对象的偏好得分上界,剪枝社交网络中的节点。其次,针对关键字维度建立关键字与空间网格的倒排索引,提出距离上界枢纽的概念用于社交距离估计,综合以上信息估计网格的偏好得分上界,剪枝空间网格。最后,针对空间维度建立SKR*索引,在R*树中添加社交信息和关键字信息,计算未遍历SKR*节点的偏好得分上限支持查询早终止。最终通过实验验证,本文提出的三种算法在不同适用范围内高效支持社交网络多维度Top-K查询。针对外存中的社交网络多维度Top-K查询,本文提出两种查询算法。首先,提出了以关键字信息为主要剪枝属性的SKI索引结构,并设计了外存中构建SKI索引的两阶段算法,提出了基于SKI索引结构的查询算法,通过划分社交网络来减少外存中社交网络数据对象和索引结构的访问代价。随后,提出了外存中SKR*索引的构建方法,通过先序遍历将SKR*节点信息以及子节点的位置写到磁盘,在查询过程中,利用SKR*中存储的多维度信息计算偏好得分上界,以此剪枝索引文件访问。并通过实验验证本文提出的两种查询算法分别在不同情况下高效地支持外存中的社交网络多维度Top-K查询。最后,本文以两类不同的搜索算法为核心,实现了社交网络多维度Top-K查询系统,有效地支持内存和外存中的社交网络多维度Top-K查询。
其他文献
超声成像因其无辐射、低成本、快捷便利等特点,被广泛应用于临床诊断,但同时超声图像也存在高噪声、低分辨率、依赖医生操作经验等缺点。利用机器学习和深度学习技术改善超声图像质量、定量客观的评价图像、提取有利于诊断的计算特征,帮助医生提高诊断准确率,是目前智慧医疗的热点研究问题。本文针对超声图像中的病变检测问题和图像标注问题,以甲状腺超声影像为研究对象,开展了研究,并利用研究成果开发了一个具有实用意义的超
学位
太极拳在全世界范围内的传播方式,除了由不同流派的老师教授太极拳拳法与招式之外,还包括与太极拳技击相关的,以文字为载体的,以太极拳文化内涵为主要内容的,以中华思想文化为核心的太极拳经典。太极拳经典不但汇聚各种拳法的教学,还聚合了中国传统文化,如道、儒、佛、理学、中医于一体,是中国传统文化的杰出代表。这些经典十分具有历史意义,对于扩大独具中国特色元素的太极拳来说具有巨大的优势,并且对中国文化的传承以及
学位
五年级下冊《分数的意义》,这是一节概念课,学习本节课之前,学生已经初步认识了分数,本节课的教学是将分数的认识上升到理性认识,进一步完善对分数的认识,进而总结概括分数的意义。以下是在给出例题四幅图,让学生自主探究完成看图写分数之后,笔者的感想。
期刊
本课题依托的场景为一个整合微服务组件管理、Io T设备云上管理以及第三方云服务接入的一体化云平台。由于此平台需要对第三方服务、自建微服务组件与云服务化的Io T设备进行管理,需要面对应用特性难以捕捉、应用异构与第三方服务引入的数据缺失等问题,如何在这样一个应用服务质量与服务的开放度参差不齐的云平台中构建一个同质化的云服务环境并对服务组件的能力进行有效管理和弹性扩充便是一个亟需解决的问题。本文的主要
学位
在自然语言处理领域中,基于深度学习的文本情感分类有着不俗的表现。但传统深度学习方法的性能依赖于大规模人工标注数据集,而获取这些数据是费时费力的。另一方面,传统深度学习方法主要针对句子级的文本情感分析,在篇章级文本情感分析中依然存在长程依赖问题和单一主体假定问题。因此本文针对以上两个问题,以企业文本为基础,以小样本学习和篇章级文本情感分析为研究对象分别进行了研究,并且以此为基础开发了一个具有实用意义
学位
在当今这个数字时代,人们越来越多地在网站上分享他们对于各种对象的评论意见,用户通过这些非结构化的文本评论来表达自己的意见,其他用户可以通过这些评论来进行相关决策行为。同时互联网的高速发展和近年Covid-19疫情的爆发,人们使用MOOC这类学习平台的频率越来越高。因此对课程文本评论的情感分析研究具有重要的理论意义和应用价值。首先本文针对句子级别情感分析任务,建立了一种基于双向长短期记忆网络自注意力
学位
高中生由于繁重的学业压力和巨大的升学压力,每日静坐时间过长,且可能由静坐行为引发的肥胖、健康体适能水平下降与社会体格焦虑等问题严重影响其身心健康,因此,本文对高中生的健康体适能、社会体格焦虑与静坐行为之间的关系进行研究,以期改善高中生的生活方式,促进其身心健康水平。本研究主要运用文献资料法、问卷调查法、测量法、数理统计法等研究方法,对徐州市两所高中随机抽取300名学生,对他们的健康体适能水平,社会
学位
教学前的准备是教师上课的基础、提高教学质量的保障。随着对教师教学能力研究的不断深入,教学准备能力越来越成为一个值得关注的话题,它与教师、学生、课堂的关系密不可分,也在师范类专业认证中扮演着重要角色。然而体育相对于其他学科而言,其教学存在共性的同时,也有着其个性,例如学情的分析、运动负荷的预设、教学资源和场地器材的准备等。认识到教学准备的重要性后,如何准确判断体育专业师范生教学准备能力发展水平,成为
学位
开发一个高效的智能个人助理的关键是准确的理解和识别用户的需求,而用户话语需求识别技术包括意图识别和槽填充两个任务。在现实场景中,用户的一个需求表达中通常包含多个意图,但是大多数现有意图识别模型均关注单一意图识别问题,无法处理多意图对话场景,并且这些模型忽略了显式的意图和槽值之间的映射关系,导致了槽填充任务性能的损失。此外,现实场景中的意图也不是独立存在的,多个意图之间存在树型和图型的关联关系。现有
学位
在定向运动中,识图能力是最重要的技术之一。在识别定向地图时,运动员需要从丰富的地图信息中进行高效的视觉搜索,同时要对关键信息进行编码、加工储存和提取。运动员在识图过程中对于捕获地图信息的精确程度和速度决定着选手的比赛成绩,识图能力对于运动员和教练员来说至关重要。前人研究表明视空间工作记忆影响视觉搜索和选择性注意能力,同时发现个体视空间工作记忆在处理客体和空间信息时可能会出现功能上的分离现象。在定向
学位