极性异构信息网络的联系预测技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:pyane
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们生活在一个相互关联的世界。大多数数据或信息对象、组件等是内部关联或者相互作用的,形成了无数的、巨大的、相互关联的复杂网络。不失一般性,相互关联的网络称为信息网络。分析和挖掘信息网络已经成为计算机科学、社会学、生物学等领域的研究人员广泛关注的课题。信息网络分为同构信息网络和异构信息网络。同构信息网络只有一种类型的节点和一种类型的关系,如在朋友关系网络中,节点都是人这一类型,边只表示朋友关系。然而,现实中的大部分网络都是异构的。在异构信息网络中,节点有多种类型,而不同类型的节点之间的关系属于不同的类型,如IMDB网络中,有电影、导演、演员等不同类型的节点和电影-导演之间的执导关系、电影与演员之间的参演关系等具有不同语义的关系类型。随着网络的发展,人们在网络社交时越来越多地表达自己的情感,因此网络中的边便有了极性,即边是正的(表示信任、喜欢、朋友等关系)或负的(表示不信任、不喜欢、反对等)。我们称有极性的异构信息网络为极性异构信息网络。信息网络已有了很多的分析和挖掘方法的研究,联系预测是其中的一个重要任务。在极性异构信息网络中,联系预测包含链接预测和极性预测,分别预测边的存在性和极性。链接预测在分析演化网络、推荐、聚类等领域有重要的价值,极性预测可以应用在推荐、决策制定、网络演化模型等众多领域。虽然链接预测和极性预测都有了很多的研究成果,但大多数链接预测都以非极性信息网络为基础,极性预测多以同构信息网络为基础,而现实中大多数网络是极性异构信息网络,所以如何解决极性异构信息网络中的联系预测问题成为新的挑战。本文针对极性异构信息网络,探索了该网络下的联系预测问题,主要工作可归结于以下几点:1.提出了极性异构信息网络的链接预测解决方法。在本文中,我们提出基于规则的方法,称为RulePredict来解决链接预测问题。在RulePredict模型中,我们首先系统抽取特征,特征包括促进链接存在的正特征和减弱链接存在可能性的负特征。链接是否出现服从概率为p的二项分布,p为所有特征值的函数。然后,使用基于广义最小二乘法的监督学习方法学习不同特征对应的权重。将学习到的权重应用到测试数据中来预测链接是否存在。2.提出了极性异构信息网络的极性预测解决方法。我们提出一个新的方法HeteSign来解决极性预测问题。首先定义不同关系下的节点相似值,每个节点相似值看作一个特征,有相对应的权重。节点间的相似度定义为特征和权重的数学表达式。计算链接的极性得分,根据得分判断链接是正是负。得分表示为节点相似度和现有网络的链接的函数,现有的链接由于正负边的重要性不同,赋予相对应的系数。采用监督学习框架,使用极大似然估计算法求得权重和系数。3.在真实的数据集IMDB和Epinions网络上验证上述两种方法的有效性,实验结果证明我们的方法在准确性上比其它方法表现更好。
其他文献
近年来,视频追踪将计算机视觉、模式识别、人工智能等学科的技术很好的融合在一起,成为视觉研究领域内一个非常活跃的分支,具有广阔的应用前景。尽管已有很多目标追踪算法,但是,由
虚拟化技术在当前数据中心中应用越来越普遍。虚拟化技术通过在同一个物理机上运行多个虚拟机来提高硬件资源的利用率。大规模的数据中心应用虚拟化技术实现资源的高效利用,
随着脑科学研究的发展,一种融合了传统机器智能与大脑智能的混合智能系统的实现变成可能。混合智能系统可以突破传统的人工智能在机器智能方面的局限性,为人工智能发展领域开辟
随着云计算的兴起,软件的交付与使用模式正在发生着变化。作为云计算的一部分,PaaS平台为SaaS应用提供完整的开发、部署及运行环境。租户通过PaaS平台租用自己所需的SaaS应用
随着互联网技术的高速发展,网络中积累了大量的数字图像和视频数据,这些数据为人们的使用带来了新的技术挑战。为此,许多专家学者对图像分类、图像检索、目标识别等领域进行
随着互联网技术与信息产业的发展,以及各种图片分享类网站的出现,如今我们已经步入图像时代。图像是一种直观的媒体资源,在日常生活中扮演着重要角色。图像分类是计算机视觉
随着嵌入式系统网络化、智能化应用的不断扩展,传统软件实时操作系统作为支撑软件已无法满足需求。基于硬件化、软硬件协同等手段,在FPGA、SOC等器件上实现硬件实时操作系统已
随着互联网的飞速发展,在线社群图像的规模呈爆炸式增长,面对日益庞大的图像数据,如何对图像库进行有效的组织、管理和检索成为亟待解决的问题。标签是当前标注这些网络图像
实值优化问题在工程和学术领域有广泛的应用背景,许多问题最后都可以被定义成实值优化问题来求解。随着系统越来越复杂,需要优化的参数越来越多,优化问题解空间的维度越来越
MapReduce作为一种有效的数据分析和处理解决方案已被广泛应用于大规模数据处理领域。随着MapReduce应用的扩大,越来越多的服务提供商对外提供MapReduce商业服务。服务提供商