极性异构信息网络相关性搜索技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jjJJ012689
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中,大部分的数据对象之间存在互相关联或交互关系,形成数量众多的、互联的、复杂的网络,不失一般性,我们称这种互联的网络为信息网络。例如,社交网络、万维网、论文合作网络、生物网络,等等。信息网络无处不在,成为现代信息基础设施的关键组件。分析信息网络,或者它们的特殊类型,诸如社交网络,已经引起计算机科学、社会科学、物理学、生物学等领域研究者的广泛关注。当信息网络中存在多种类型的节点或者多种类型的链接,我们称之为异构信息网络。异构信息网络的应用非常广泛,在许多的异构信息网络中,链接可以存在肯定或否定的极性,用于表达人们的正面或负面的意见和观点。比如IMDB网络,含有用户、电影、演员等不同类型的节点,存在用户与电影之间的评价关系、电影与演员之间的参演关系等不同类型的关系,用户评价看过的电影,可以通过打分的高低表达是否喜欢一部电影。对异构信息网络上的喜好行为进行建模,,就构成了极性异构信息网络,即网络中的链接可以是肯定的(表达“喜欢”或者“信任”),或者否定的(表达“不喜欢”或者“不信任”)。相关性搜索是异构信息网络上的一个重要任务,用于度量网络中不同类型节点间的相关性,从而可以支持个性化推荐等应用。例如,在IMDB网络中,人们感兴趣搜索与某用户最相关的电影,在Epinions网络中,人们感兴趣搜索与某消费者最相关的商品,等等。由于信息网络中的不同链接路径,蕴含着不同的相关性语义,因此,在以往的研究中,通常基于元路径进行节点间相关度计算,所谓元路径,是指定义在不同类型对象间的联系的序列组成的路径。然而,以往的研究主要聚焦在非极性的异构信息网络,不考虑网络链接的极性,在极性异构信息网络中,定义带有负边的元路径的语义是一个具有挑战性的问题,尤其是路径中存在多条负边的情况下,语义更加的模糊。因此,直接使用以往基于元路径的方法来计算极性异构信息网络的节点间的相关性,无法得到正确的结果。因此,对于极性异构信息网络的相关性搜索,如何建模带有正边、负边的元路径,进而计算异类型节点间的相关性,是一个有挑战性的工作。本文研究极性异构信息网络中的相关性搜索问题,提出一个新颖的相关性搜索方法SignSim,基于极性元路径分解,度量极性异构信息网络中不同类型对象间的相关度。SignSim首先定义原子元路径,基于原子元路径,给出了结合用户正负偏好,采用协同过滤方法,计算同类型节点间相似度的计算方法,在不同的原子元路径组合的基础上,SignSim能够基于不同长度的极性元路径,度量不同类型对象间的相关性。本文的主要贡献如下:(1)提出并刻画了极性异构信息网络的相关性搜索问题。(2)提出一个基于极性元路径分解的极性异构信息网络相关性搜索方法SignSim,SignSim可以有效的捕获元路径上的正边和负边的语义,以度量不同类型节点间的相关度。(3)实验采用IMDB、Epinions两个真实的数据集,通过与非极性异构信息网络现有的相关性搜索方法的比较,验证了SignSim的有效性。
其他文献
数据挖掘(Data Mining)是在海量的数据中提取隐含在其中的有用信息和知识的过程。数据聚类(Data Clustering)是其中一项重要的数据挖掘技术,是人们认识和探索事物之间内在联系
TCP SACK通过对数据包的选择确认,有效解决了在一个发送窗口中多个数据包丢失的问题,提高了TCP的性能。由于TCP SACK沿用了传统TCP的拥塞控制机制,在发生丢包后缺乏拥塞丢包和链
随着计算机技术、网络技术、音视频压缩技术以及计算机硬件技术等的高速发展,视频媒体数据的存储和传输不再是一件棘手的事情,并且数字视频也越来越广泛地融入人们的生活中。
随着计算机网络的广泛普及,信息技术已经普遍地运用于各行各业,为经济、政治、军事、文化的发展做出了巨大贡献。然而,数字信息在传输、存储与加工处理的过程中比以往更易遭
今天随着互联网和计算机在全世界范围内的广泛使用,网络在人们日常生活中的作用变得越来越重要。很难想象如果缺少了网络和计算机,经济的发展和人们的生活将会变成什么样子。随
关联规则挖掘是数据挖掘领域的重要组成部分,旨在发掘数据背后隐藏的、潜在的、频现的相关关系与模式。多尺度科学是一个新兴的科研领域,核心是剖析研究客体多层次、多尺度的
深度摄像机的数据处理工作在图形图像及增强现实领域一直有很重要的作用。随着近年来低价的深度摄像机的产生,深度摄像机领域发生了重要的变革。Kinect等深度采集设备具有低
随着21世纪信息技术和互联网技术的迅猛发展,多媒体信息,特别是视频信息,已逐步取代纯文本信息,成为人们获取资讯的主要载体。视频会议、视频电话、远程学习和培训、远程医疗
随着移动通信技术的不断发展,传统无线网络将逐步被以移动IP为基础的无线网络所取代,但是无论是移动IPv4,还是移动IPv6,切换时延太长,都不能满足实时通信的需求。   为了满足实
现实世界中的许多系统都可以用关联网络表示,如WWW、引文网络、股票关联网络、蛋白质关联网络、神经网络等等。尽管这些网络有着不同的描述对象,它们却有许多共同点。社区结构