极性信息网络节点相关性度量问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:love_day
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们生活在一个相互联系的世界里,现实世界中大量的数据、对象或个体之间相互联系、相互作用,形成众多大型、互联和复杂的网络。不失一般性,这种相互联系的网络被称为信息网络。其中,由相同类型的节点和链接构成的网络称为同构信息网络,而由不同类型的节点和链接构成的网络称为异构信息网络。随着信息网络的不断发展,现实世界中的很多关系可以用既有正边,又有负边的极性信息网络来表示。其中,正边可以表示朋友、信任、喜欢等积极的关系,负边可以表示敌人、不信任、不喜欢等消极的关系。比如,国际关系中,国家与国家之间的合作与对抗;电子商务领域,顾客对商品的好评与差评;生命科学领域,激素对生长发育的促进与抑制等都可以抽象为极性信息网络来加以描述。在极性信息网络中,我们可以清晰地看到各对象之间的合作或对立关系,有助于我们更加准确地认识和分析复杂的系统。在信息网络上度量两个节点之间的相关性(或相似性)具有重要的意义。通常我们把同类型节点之间的相近程度称为相似性,而把异类型节点之间的相近程度称为相关性。比如在DBLP文献网络中,我们可以根据作者之间的相似性来对他们进行分类,从而将不同领域的研究人员进行有效划分;我们还可以通过衡量作者与会议之间的相关性,对作者进行更加精确的用户画像。目前,信息网络上的节点相关性度量工作主要针对非极性信息网络,极性信息网络上的节点相关性度量尚不多见。在极性信息网络上,度量两个节点之间的相关性是一个具有挑战性的问题。由于极性信息网络不仅含有正边,而且还有大量的负边,正边和负边蕴含的语义是相反的,以往针对非极性信息网络的研究思路和方法并不完全适用于极性信息网络。在极性信息网络上,如何正确处理正边与负边的关系,充分利用正边和负边的语义信息仍是一个尚未解决的问题。本文研究极性信息网络上的节点相关性度量问题,包括在同构极性信息网络上度量同类型节点之间的相似性,以及在异构极性信息网络上度量异类型节点之间的相关性。本文的主要贡献包括:1、提出了一个称为NeiSim的相似性度量模型,该模型能够度量同构极性信息网络上同类型节点之间的相似性。NeiSim能够充分利用极性信息网络中正边和负边所蕴含的语义信息,利用源节点和目标节点对相同节点的不同偏好,将Jaccard系数扩展至极性信息网络来衡量它们之间的相似性。NeiSim通过比较源节点和目标节点的直接邻居节点集合来判断源节点和目标节点是否相似。对于源节点和目标节点没有共同邻居的情况,NeiSim基于结构平衡理论采用相似度传播的方式间接衡量它们之间的相似程度。NeiSim不仅考虑了两个节点的局部特征,还考虑了网络的整体结构。在真实数据集Epinions和Slashdot上的实验表明,NeiSim能有效度量两个节点之间的相似程度。2、提出了在带权的异构极性信息网络上度量异类型节点之间相关性的度量模型WsRel。WsRel针对异构信息网络中网络结构复杂、语义丰富的特点,使用元路径技术获取不同路径蕴含的语义信息。该模型合理利用极性信息网络中的负边信息,将极性信息网络转换为非极性信息网络。通过元路径限定下的随机游走来获取源节点与目标节点之间的相关性。针对源节点和目标节点之间存在多种元路径的情况,WsRel采用一种启发式算法把基于不同元路径得到的相关性值进行组合,从而能够综合度量源节点与目标节点之间的相关性。WsRel能够充分利用异构极性信息网络的网络结构来度量源节点与目标节点之间的相关程度,在IMDB数据集上的实验表明了 WsRel模型的有效性。
其他文献
随着中国经济的不断增长,企业间的并购日益频繁。上市公司凭借其雄厚的资金实力,在并购重组中发挥着突出的作用。目前,上市公司与私募股权基金公司合作共同成立并购基金进行
生态文明体制改革推进与自然资源部新立的双重语境下,我国现行自然资源法律规范的痼疾日益暴露。此集中体现于法律体系表层的根本法涵摄狭窄、基本法鸠占鹊巢、单行法缺乏周延,以及法律规范里层的管理体制掣肘、立法理念滞后、内容配置失衡。这显然与自然资源法平衡私权利与公权力、兼顾经济与生态效益以及实现自然资源治理机制多元化、内容综合化与目标可持续的目标指向相脱节。而“自然资源基本法”的定立,即是对自然资源法应然
1992年中韩建交以来两国在政治、经济、文化等多个领域展开了广泛的交流与合作。文学作为文化传播的重要载体,架起了中韩两国人民沟通的桥梁。儿童文学作为文学的一种体裁,不仅具有极高的审美价值,而且还具有鲜明的教育意义。儿童通过对作品的阅读、欣赏、理解,在心理上得到了愉悦的满足,在精神上也受到了文学艺术的熏陶。所以笔者本次翻译实践选择的文本是韩国作家金贞的短篇童话集《影子洗衣店》。该童话集运用了大量的拟
随着社会的快速发展,人们对数据通信等业务的需求越来越高,导致通信系统必须及时更新系统容量与传输速率。因而,高速信号的传输、处理等技术至关重要。受限于电磁干扰等原因,传统电子技术发展已陷入困境。利用光学和电学方法相结合来处理高速信号已成为一种有效解决方案。在光通信与微波光子领域中,小型化、集成化的光学元器件是研究重点。其中,在超窄带宽滤波器、光隔离器、光调制器等领域,光学微腔因具有极高的品质因子、极
目的:观察和评价固本益肺汤治疗尘肺病肺肾气虚证的临床疗效及安全性,从而为延缓尘肺病进程提供新的思路和方法。方法:采用随机对照的研究方法,观察60例符合诊断和纳入标准的尘肺病患者,随机分为对照组和观察组,每组30例,两组均予以西医常规治疗,观察组加用固本益肺汤加减,观察时间为8周。及时记录并观察两组患者治疗前后肺功能、6分钟步行试验等各项指标及中医证候疗效,利用SPSS20.0对所观察数据进行统计分
随着网上购物的盛行,如何增强网上购物的体验已成为计算机应用方向研究的热点之一。在电商网站中,目前最主流的展示商品的方法依旧是照片配以文字描述。服装、饰品等对美观和
有限元法作为一种重要的数值方法,在工程、科学等各个领域有着广泛的应用。随着有限元法应用的不断深入,学者们发现有限元法对某些问题的分析具有局限性。比如:在求解大变形
由于世界经济的融合发展,国内外市场竞争充分而激烈,各行业市场情况日趋复杂。在竞争激励且变幻莫测的市场上生存和发展已经成为企业经营的第一要务,而科学有效的企业发展战
旋流喷嘴因结构简单、雾化性能好、成本低的特点在液体喷雾领域应用广泛。幂律流体的射流破碎在喷墨射流、纳米材料喷涂等工程应用领域广泛存在。由于幂律流体自身的复杂性,
太阳系外的所有宇宙天体的信息几乎都是通过光谱计算获得的,能够观察到的光谱包含了大量的重要信息,例如恒星的温度、年龄、金属丰度以及星系组成等。目前天文领域有一些经典