基于异构网络嵌入的推荐算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:ZS54902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,现实生活中的数据量急剧增长,信息过载成为当前时代的新问题。推荐系统可以快速地从海量数据中筛选出用户感兴趣的信息,在解决信息过载问题上发挥着重要的作用。然而用户和项目规模的增长产生的数据稀疏问题,导致推荐算法的精度降低,成为当前亟需解决的问题。异构信息网络描述了多种对象间的关系,可应用到许多数据挖掘任务中。知识图谱作为一种有向异构信息网络,包含了实体的描述信息和实体间在现实世界中的联系,可作为辅助信息来解决推荐中的数据稀疏问题。然而,网络数据的高维性很难直接使用。网络嵌入采用低维向量的形式保留对象在原网络中的特性,学习得到的低维向量可以很容易被机器学习算法处理,可直接应用到链接预测,节点分类和推荐等任务中,受到研究者们的关注。本文工作围绕异构网络嵌入展开,现有的异构网络嵌入算法主要通过基于元路径的随机游走来同时学习网络的结构信息和节点间的语义信息,但是在一些场景下很难选择最优的元路径。本文提出一种基于生成对抗网络(GAN)的异构网络嵌入算法HINGAN,在生成器和判别器的博弈过程中学习得到网络的结构信息,训练过程中在一定程度上最小化同种类型节点嵌入向量的相似度使其包含节点间的语义信息。相比于基于元路径的随机游走方法,HINGAN不需要设计特定的元路径且效果得到提升。为解决数据稀疏问题,本文将知识图谱作为辅助信息,提出一种基于知识图谱嵌入的序列推荐算法KGRURec,通过融合物品在知识图谱中的关系扩展用户和物品的交互信息来解决数据稀疏问题,提升了模型的效果。
其他文献
公共交通客流预测对智能交通系统建设有重要作用,准确的客流预测是交通调度、交通规划和安全监测的前提,其预测还存在以下挑战:1)复杂的天气因素及日期特征对客流有一定影响;2)站点空间环境复杂,站点间的空间相关性受多重因素影响,如站点间距离、城市功能区分布等,随着时间的推移,这种相关性也在动态变化;3)交通流量的当前流量值与过去历史数据之间有复杂的时间相关性。因此对公共交通客流进行准确预测还存在一定难度
学位
随着全球定位系统(Global Position System,GPS)的普及,基于位置的服务(Location Based-Service,LBS)已经为人们的生活带来了诸多便利。LBS可将具体的用户(如出租车、行人等)抽象为移动对象,通过GPS获取到移动对象的活动轨迹,并对轨迹数据进行挖掘,具有潜在的重大价值。其中,移动对象的目的地预测是当前基于位置服务的研究热点,该领域一直存在着“数据稀疏”
学位
目的:评估钬激光内切开联合球囊扩张术和单纯球囊扩张术治疗良性输尿管狭窄的效果差异。方法:收集2016年1月—2020年1月北京佑安医院泌尿外科行输尿管镜逆行球囊扩张术和钬激光内切开联合球囊扩张术治疗单侧良性输尿管狭窄患者的临床资料,根据治疗方式分为联合治疗组(钬激光内切开联合球囊扩张术)和球囊扩张组,分析输尿管镜直视下2种手术方式治疗良性输尿管狭窄的效果差异。结果:共纳入82例患者,其中联合治疗组
期刊
猪病毒性传染病的发生流行,严重影响猪只健康以及养猪业的发展。除了疫苗免疫外,严格的生物安全措施也是防控动物疫病的重要手段,最基础的消毒环节在养殖过程中显得尤为重要。聚维酮碘作为常用的消毒剂之一,在养猪生产中被广泛应用。笔者介绍了聚维酮碘的结构特点、作用机理及其在养猪生产中的应用,以期为聚维酮碘溶液在养猪生产中的规范使用提供参考。
期刊
由于通信科学技术的飞速发展,诸如RFID标签读取器、GPS手机和车载导航仪之类的位置感知设备被大规模的普及。这些位置感知设备可以为人们提供便利的服务,但也收集了很多移动对象的轨迹数据。随着公众对隐私保护的日益重视,研究人员开始研究轨迹数据的隐私保护问题,确保轨迹数据分析时避免隐私泄漏。本文结合差分隐私技术研究了轨迹数据发布、轨迹聚类、轨迹频繁项中的轨迹数据隐私保护。(1)针对移动对象轨迹数据发布中
学位
针对地下空间地质环境质量,前人运用三维地质信息化技术已开展了大量三维综合评价研究,但其评价结果对于规划和施工建议略显不足。其原因主要是评价过程主观性较强,综合评价结果难以充分表达地质环境的真实类别,难以关注更需受到重视的不良地质环境条件等。针对上述问题,利用自组织神经网络(SOM)和K-means算法对地下空间地质环境质量三维评价信息进行分类研究;以福建省厦门市马銮湾新城南岸片区为实例,基于三维空
期刊
随着大数据、云计算和人工智能等新兴技术的普及,越来越多的数据被收集起来进行分析和利用,推动了城市的治理和发展。在这其中,城市居民的出行流量数据和城市功能区分布数据蕴含了与城市发展和居民生活息息相关的海量信息,对于探索智慧城市的发展具有重要的理论意义和应用前景。近几年来,利用城市功能区分布数据来辅助进行居民出行流量预测已经取得了一定的成就,但是,由于这两类数据的异构性以及相关城市计算问题的复杂性,据
学位
计算流体力学(Computational Fluid Dynamics,CFD)是研究湍流模型的重要手段,在基础流体力学研究和航空航天等领域发挥着重要作用。随着所研究问题的日益复杂化,对计算流体力学数值模拟的精度要求也越来越高。高精度的数值模拟结果依赖流场方程求解时的数值格式和计算网格的质量。网格自适应是一种有效提升网格质量的方法。常见的网格自适应方法可以分为局部加密,局部提高数值格式精度和移动网
学位
大脑是人体最重要的器官,多个不同的大脑区域广泛交互,共同构成了一个复杂的网络来发挥功能。随着现代神经影像技术的发展,脑影像为研究大脑的病理生理机制提供了有力的技术支撑。特别是功能磁共振成像技术,由于其对大脑功能连接的渐进性变化具有较高的敏感性,已经被广泛应用于计算机辅助诊断。近年来,大型多中心医学数据库的建立加速了脑影像数据共享,为了克服小样本量带来的模型过度拟合的挑战,越来越多的研究开始关注如何
学位
目的探究良性输尿管狭窄腔内手术治疗后置入海马型输尿管支架的临床效果。方法回顾性分析2020年1月至2021年12月于重庆医科大学附属第一医院行良性输尿管狭窄腔内手术治疗患者的临床资料。根据置入输尿管支架类型不同分为3组:A组为单根标准形状输尿管支架,B组为海马型输尿管支架,C组为多根标准形状输尿管支架,每组20例。同时收集3组间的基线资料(包括:年龄、性别、狭窄侧别、狭窄部位、狭窄长度、狭窄程度、
期刊