基于BP网的不确定图K近邻查询研究与实现

来源 :东北大学 | 被引量 : 1次 | 上传用户:chren1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂的网络中,如生物网络、社交网络,经常存在着数据的不确定性。这些不确定性存在的原因有很多,如原始数据不准确、获取技术方式不精确、使用粗粒度的数据集合、满足特殊应用、隐私保护等,这些不精确的图数据构成了不确定图模型。在不确定图问题中,一个基本的问题就是不确定图的K近邻查询问题。在现在的研究中,关于不确定图的K近邻查询主要集中在基于可能世界模型获取节点之间的概率,进而得出K个近邻节点集合上。但是这种基于可能世界的不确定图模型的查询时间复杂度已被证明是个#P问题。为了解决该问题,近年来很多学者在研究很多方法,其中在时间和准确率上有显著效果的是抽样算法。在Chernoff Hoeffding定理的引导下,抽样算法可以平衡时间和准确率两个变量的关系。虽然抽样算法可在多项式时间内给出结果,但当使用它在线查询或者进行频繁查询时,其依然表现出较长的时间等待问题。基于目前的研究现状,本文基于学习式搜索思想,采用BP神经网络学习模型,提出基于BP网的不确定图K近邻查询算法。主要的研究包括:首先给出单源点的BP-K近邻查询算法(基于BP网的不确定图的K近邻),包括BP-K近邻查询算法处理不确定图节点间概率计算的机器学习思想与训练数据集形式。在单源点的BP-K近邻查询算法的基础上,使用Cantor数方法描述了不确定图中的节点对的表示方法,使用抽样算法得出训练集,把单源点的BP-K近邻查询算法扩到多源点的BP-K近邻查询算法,在整个不确定图中进行BP网的拟合。本文提出了几点尝试:(1)在理论和实验上验证传统的不确定图K近邻查询算法耗时较长,难以处理实际问题中的图结构数据。(2)验证抽样算法在Chernoff Hoeffding定理指导下的准确率及该算法在计算部分节点间概率时时间的高效性,并证明该算法在线查询时会出现明显的时间等待问题。(3)从真实的数据集中抽取部分数据集进行BP网的拟合训练,训练网络的拟合能力和泛化能力,找到合适的BP学习模型进行预测,可以基本拟合该不确定图样本数据。(4)验证BP-K近邻算法解决实际问题的可行性。实验证明BP-K近邻查询算法的查全率较高,并给出传统算法、抽样算法和BP-K近邻算法计算不确定图K近邻查询时的时间对比。
其他文献
视觉目标跟踪是计算机视觉领域中一个重要视频研究处理分支,由于科技发展与日常生活的需求,如无人机监控、自动驾驶、人机交互、智慧交通等,近年来得以大展身手。另外,深度学
光学显微镜作为观测微观世界的有效手段,已广泛应用于生物医疗和科学研究。光学显微镜为了清晰成像,需要调整样本至成像系统的准焦面上,这个过程称之为调焦。传统显微镜调焦
随着新课程改革的深入推进,提高学生科学核心素养成为教学的核心目标。物理作为一门重要的学科,对学生物理科学核心素养培养的落实起到不可忽视的作用。而物理概念的学习是物
随着人工智能研究的兴起,人脸识别和疲劳检测技术在实际生活中应用于各行各业,为人们生活的便捷性带来了保障。当前一些重点区域如银行值班室、铁路运营室、消防监控室、重症
神经语言模型(Neural Language Model,NLM)作为自然语言处理(Natural Language Processing,NLP)领域里的基础任务,其主要目的是利用词的分布式表示,对自然语言序列建模,以克
随着无线电技术的不断发展,无线电业务不断拓宽,为人们的生产和生活提供了许多便利。与此同时,不断增加的无线电业务及日趋复杂的电磁环境为无线电频谱监测与管理带来了挑战,
平方公里阵(Square Kilometre Array,SKA)将成为国际上最大的综合孔径射电望远镜,SKA作为下一代的射电望远镜,以大视场、多波束、高动态、高分辨和大数据为核心概念,将颠覆射
英语写作,经常被中国学生认为是难度最大的一项语言技能,大部分的学生对英语写作有畏难情绪。但是,写作作为输出性技能,在英语交际过程还有高考中都是重要的组成部分。所以,
新课改的落实为小学英语课堂教学提供了新的教育理念和教育模式。以教师“教”为主的传统的英语课堂模式已经不能满足新时代对学生发展提出的要求,教育学家和教师一直在探索
作为国际民商事判决的重要组成部分,外国海事判决的承认和执行在实践中占有重要一席。外国海事判决的承认和执行因缺乏统一规则的调整面临诸多障碍,直接导致海事诉讼当事人的