异构信息网络中Hub实体间关系预测方法的研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:exiaodong1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构信息网络能够有效地融合网络中不同类型对象、不同的交互语义等全面的结构信息和丰富的语义信息,其分析有助于网络中排名、分类、聚类、关系预测等数据挖掘任务,正在成为一个新的研究热点。其中双Hub型异构信息网络结构特殊,由两个子网组成,子网与子网间藉由Hub实体关联在一起。对于此类异构网络,Hub实体间的关系预测对于实体间个性化推荐具有较为重要意义。本文以一种融合了社交关系子网和信息子网的双Hub型异构信息网络为主要研究对象,提出了群体性节点影响力、用户偏好基因和用户-项目兴趣度排名三阶段分析方法,并以豆瓣电影网为实验数据,最终完成社交关系子网中和电影信息子网中的Hub实体间关系预测。首先,本文研究了信息子网中群体性节点影响力问题,提出了用户关注信息介入下的随机游走节点影响力分析模型——AI-RWM模型。该模型采用类型和拓扑双驱动的随机游走模型进行节点影响力分析;进一步地在拓扑驱动的随机游走中介入社交子网中用户关注信息以关联节点影响力与用户关注度;同时,采用随机的转移概率机制优化了无关注节点。一系列对照实验说明,AI-RWM模型中引入用户关注信息能够使得信息子网中节点影响力排名避免数量敏感缺陷,又能结合了用户群体兴趣,使得排名更全面。其次,本文研究了异构信息网络中用户偏好基因问题,分析了基于元路径下的“项目”节点对和“用户”节点对相似性,并提出了基于元路径的用户偏好基因模型——MPATH-GENE模型。该模型以用户关联的信息子网为分析对象,先利用HeteSim算法计算“项目”节点与其所有属性类型节点间相关性;然后将相关性转换为链接权重,计算出所有“项目”节点对间的最短路径;最后将路径抽象成元路径,通过分析元路径权重计算出用户偏好基因。实验证明基于元路径的用户相似性与偏好基因提取之间的一致性。最后,本文研究了 Hub实体间关系预测问题,提出了基于随机游走的用户-项目兴趣度排名模型——UII-RWM模型。该模型充分结合了 AI-RWM模型提取的信息子网中群体性节点影响力和MPATH-GENE模型提取的用户偏好基因这两个方面来进行双类型随机游走节点影响力分析;同时,在拓扑驱动的随机游走中引入了协同过滤思想,设计了基于用户相似性的项目关注度填充方法,通过随机游走完成面向特定用户的用户-项目兴趣度排名,由此完成特定用户与项目间的关系预测。多组对照实验证明该模型具有一定的准确性。
其他文献
装备技术评价,是我国装备技术管理的一项重要内容。合理可靠的装备技术评价结果,对于鉴别装备技术是否达到装备上型要求、装备的技术选型、装备技术发展现状的评估以及装备研
随着我国电信运营商的重组,通信工程项目日益增多,而通信工程勘察设计的市场竞争日益激烈。为了在同行业竞争中占领优先地位,勘察设计质量的提高成为行业的发展趋势。所以在
20世纪50年代以来,广西地区发掘的汉代墓葬已有一千多座,汉墓中出土了大量的陶器,大部分器表饰有纹饰,纹饰的种类形式多样。陶器与人们的生活息息相关,其纹饰直观地反映了广西地区人们的审美追求。本文以广西汉墓出土陶器纹饰为研究对象,对其进行类型学分类,分析各类纹饰发展演变规律,总结其发展的总体特征,探究纹饰所反映的文化现象与内涵,进而对汉代广西的社会、经济、文化有更进一步的认识。本文以考古学为基础,以
从古至今,月亮总是充满了诗情画意,尤其是在中国古代诗歌中体现的尤为明显。在中国古代的咏月诗中,借月亮来抒发自己的情感,思乡怀古,总是诗人不变的主题。月亮已经成为中国
随着人们生活水平的不断提高,越来越多的技术应用到人们的日常生活中,通信技术和计算机技术与人们的生活密切相连,应用在视频监控、数码网络等方面,这些技术为人们的生活提供
气体传感器技术是在线监测变压器油中溶解气体的核心;传统半导体金属氧化物气体传感器普遍存在灵敏度低、工作温度较高、响应-恢复时间长、选择性差等问题,制约了其在变压器
现代分子生物学技术的发展催生了基因技术疗法的进步,促使了人类遗传资源商业价值的越发彰显。由于地理隔绝、经济发展等因素,我国的人类遗传资源十分丰富,却处于流失严重的现状之下,对于我国人类遗传资源的保护刻不容缓。人类遗传资源主要包括人类遗传资源实物样本及相关信息资料,其主要特征包括复合性、地域性、群体依赖性、伦理性。在人类遗传资源流失的制度及经济大背景下,人类自身基因权利之觉醒及国家对人类遗传资源权益
药用菊花为菊科植物菊花(Chrysanthemum morifolium Ramat.)的干燥头状花序,具有疏风清热、平肝明目、清热解毒之功效。杭菊(C.morifolium cv.’Hangju’)是药用菊花的主要栽
目的:我们在前期研究工作中,应用P糖蛋白(P-glycoprotein)特异性抗体检测出大鼠胰岛β细胞中存在65kDa大小的膜蛋白,我们称之为mini P糖蛋白或者小P糖蛋白,借助膜片钳技术我
当代经济社会中,企业间的竞争越来越激烈,如何避免核心人才将的流失是企业需要解决的重要难题,也是企业获取竞争优势的关键。随着员工生活水平和受教育水平的不断提高,员工在工作中不仅仅关注工作报酬等经济因素,也更加注重工作中的情感变化。H企业作为一家制造型企业,也同样面临着员工流失率高,组织结构不稳定的现象。因此,基于工作幸福感角度分析H企业员工的离职倾向有着重要的现实意义。本次研究在大量阅读国内外相关文