论文部分内容阅读
现实世界中,大部分的数据对象之间存在互相关联或交互关系,形成数量众多的、互联的、复杂的网络,不失一般性,我们称这种互联的网络为信息网络。例如,社交网络、万维网、论文合作网络、生物网络,等等。信息网络无处不在,成为现代信息基础设施的关键组件。分析信息网络,或者它们的特殊类型,诸如社交网络,已经引起计算机科学、社会科学、物理学、生物学等领域研究者的广泛关注。当信息网络中存在多种类型的节点或者多种类型的链接,我们称之为异构信息网络。异构信息网络的应用非常广泛,在许多的异构信息网络中,链接可以存在肯定或否定的极性,用于表达人们的正面或负面的意见和观点。比如IMDB网络,含有用户、电影、演员等不同类型的节点,存在用户与电影之间的评价关系、电影与演员之间的参演关系等不同类型的关系,用户评价看过的电影,可以通过打分的高低表达是否喜欢一部电影。对异构信息网络上的喜好行为进行建模,,就构成了极性异构信息网络,即网络中的链接可以是肯定的(表达“喜欢”或者“信任”),或者否定的(表达“不喜欢”或者“不信任”)。相关性搜索是异构信息网络上的一个重要任务,用于度量网络中不同类型节点间的相关性,从而可以支持个性化推荐等应用。例如,在IMDB网络中,人们感兴趣搜索与某用户最相关的电影,在Epinions网络中,人们感兴趣搜索与某消费者最相关的商品,等等。由于信息网络中的不同链接路径,蕴含着不同的相关性语义,因此,在以往的研究中,通常基于元路径进行节点间相关度计算,所谓元路径,是指定义在不同类型对象间的联系的序列组成的路径。然而,以往的研究主要聚焦在非极性的异构信息网络,不考虑网络链接的极性,在极性异构信息网络中,定义带有负边的元路径的语义是一个具有挑战性的问题,尤其是路径中存在多条负边的情况下,语义更加的模糊。因此,直接使用以往基于元路径的方法来计算极性异构信息网络的节点间的相关性,无法得到正确的结果。因此,对于极性异构信息网络的相关性搜索,如何建模带有正边、负边的元路径,进而计算异类型节点间的相关性,是一个有挑战性的工作。本文研究极性异构信息网络中的相关性搜索问题,提出一个新颖的相关性搜索方法SignSim,基于极性元路径分解,度量极性异构信息网络中不同类型对象间的相关度。SignSim首先定义原子元路径,基于原子元路径,给出了结合用户正负偏好,采用协同过滤方法,计算同类型节点间相似度的计算方法,在不同的原子元路径组合的基础上,SignSim能够基于不同长度的极性元路径,度量不同类型对象间的相关性。本文的主要贡献如下:(1)提出并刻画了极性异构信息网络的相关性搜索问题。(2)提出一个基于极性元路径分解的极性异构信息网络相关性搜索方法SignSim,SignSim可以有效的捕获元路径上的正边和负边的语义,以度量不同类型节点间的相关度。(3)实验采用IMDB、Epinions两个真实的数据集,通过与非极性异构信息网络现有的相关性搜索方法的比较,验证了SignSim的有效性。