基于异质信息网络的表征学习推荐方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:tkzcsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网技术的不断发展,网络结构及其拓扑日益复杂,数据规模爆炸式扩张,使得如何迅速而准确地从海量信息中搜集和获取更多有价值的数据及其特征已经成为当前关注的热点。个性化推荐算法就是一种通过对用户历史活动资料进行分析,挖掘用户潜在偏好信息的有效方法。协同过滤推荐算法作为经典的个性化推荐算法,可以准确发现其喜好与倾向,并对其倾向的商品进行筛选、预测与推荐。然而,面对数据规模快速增长,以及日益复杂的推荐问题,协同过滤推荐算法存在一些无法回避的问题:仅考虑用户与项目间的矩阵交互;同时对用户数据稀疏性以及冷启动问题也缺少有效的解决策略。近年来,由多种属性节点与边链接构成的异质信息网络(Heterogeneous Information Network,简称HIN)可以融合复杂多源异构信息,具有强大的数据建模和分析能力,已被广泛研究应用于很多大数据分析与挖掘的复杂任务中。由于这种异质信息网络在分析和处理建模表征数据的异质性等诸多复杂问题上具有较高的应用灵活性,被国内外学者用于自动推荐系统的表征建模过程中。这些异质推荐算法多基于元路径获取用户的相关信息,同时也利用网络表征学习来进行表征融合。推荐性能提升的同时,也存在以下的问题:首先,传统协同过滤推荐方法仅考虑用户和商品的历史交互行为,无法利用异质信息网络中隐藏的复杂关系,导致可扩展性问题;针对用户历史信息稀疏,结合异质辅助信息在局部推理可能发生冲突,导致稀疏不一致性问题;其次,基于异质信息网络的推荐方法通常仅考虑异质信息网络中低阶交互,而忽略其中某些高阶关系,易带来信息缺失问题;最后,用户的兴趣偏好可能会随着时间的推移而发生变化,出现兴趣漂移问题,影响推荐效果。针对上述这些问题,本文提出了一系列关于异质信息网络推荐的研究方法,利用异质信息网络丰富的结构和语义信息进行推荐,主要工作内容如下:(1)针对传统协同过滤推荐方法的可扩展性问题,提出了一种异质信息融合网络嵌入的注意力偏好推荐方法(MFFHINE),通过联合优化矩阵分解模型和融合函数,可有效利用属性信息。进而采用了一种基于注意力机制的融合策略,将不同权重元路径产生的偏好特征有机融合,用于解决异质信息网络推理过程的局部稀疏不一致性问题。(2)针对基于异质信息网络推荐方法的信息缺失问题,提出了一种在异质信息网络中采用三角嵌入的高阶推荐方法(RLTE),通过多层级嵌入为指导的异质网络嵌入方法,分别利用skip-gram模型和局部三角化结构挖掘异质信息网络中隐藏的低阶和高阶关系,通过这些潜在信息的特征融合缓解信息缺失问题。(3)针对动态推荐过程中用户兴趣漂移的问题,提出了一种用时序因子追踪用户兴趣偏好的策略方法(DRLTE),结合三角高阶多层级信息融合进行动态推荐,解决兴趣漂移的不确定性问题。最后,全文工作以Python语言实现,并与相关的基准和SOTA推荐算法进行比较及参数分析,在真实大规模数据集实验也表明本文提出的相关模型方法有效可行。
其他文献
智能驾驶技术是目前高新科技领域的重点研究对象,它对社会发展、经济建设和科技进步等都有着重要的影响。传统智能驾驶环境感知领域是通过图像传感器、激光传感器和雷达等多传感器信息融合感知环境信息,该方法存在传感器数量多、计算复杂和成本高等缺点,而利用视觉图像来进行道路静态目标的检测识别具有无可比拟的优势,通过一次视觉图像的获取可同时获得路面的多种目标信息。基于聚焦形貌恢复技术的原理,本文提出一种利用车载单
综采支运装备是综采工作面支护与推进的核心设备,实现综采支运装备协同推进是综采工作面协同推进的关键环节之一,对实现综采工作面无人化、透明化开采具有重要意义。由于连接综采支运装备的浮动系统的运动具有自由性、空间性的特点,使得刮板输送机无法被推移至既定位置,进而对其协同推进过程中的刮板输送机的直线度产生影响,最终影响整个综采工作面的协同推进。由此,对综采支运装备的浮动连接机构的空间运动进行建模与分析成为
对于大面积的自生林和野生林,需要有效地检测具有代表性的可燃物区域,进行针对性的火警监测。当前森林可燃物普查的有效手段是通过飞行器拍摄获取森林影像数据集,但获取的数据集庞大,需要从中选出具有代表性的可燃物区域进行监测,同时也会带来数据处理复杂的问题。从数据集中选择小部分代表性数据的问题可以称其为数据摘要问题,而数据摘要问题常通过传统子模集合覆盖方法来解决。数据集庞大造成的计算复杂则可通过引入流式算法
本课题是山西省研究生联合培养基地人才培养项目(2018JD09)“无人值守工作面液压支架电液控制系统的研制”的重要组成部分,它是针对井下无人值守工作面在实验室和监控中心如何再现的问题而提出的。课题以煤矿井下综采工作面液压支架电液控制系统为研究对象,将虚拟仿真技术应用于液压支架监控平台,基于实验室现有的无人值守工作面模拟实验系统,以智能化综采工作面液压支架动态仿真平台为目标,开发出一套液压支架远程控
挖掘机广泛应用于各种施工场合,在工程机械中占有十分重要的地位。挖掘机作业环境复杂多变,常伴有噪音、粉尘,一些场合甚至存在塌方、辐射等危险,挖掘机自主智能化作业已成为未来发展趋势。工作装置姿态信息是智能控制系统的重要参数,实时精准地获取姿态信息对自主智能化作业起着至关重要的作用。在挖掘机工作装置姿态测量方面,大部分是以电位计、关节角度编码器等接触式传感器来实现。近年来一些研究人员针对姿态测量中接触式
传统的肺癌诊断主要通过人工读片的方式,找到肺结节所在的位置并判断其良恶性,这对于医师的经验有着较高的要求,同时极大的工作量很有可能造成诊断疲劳,甚至造成漏诊或误诊,耽误患者的最佳治疗时期。计算机辅助诊断技术的出现,实现了肺结节的自动诊断,减轻了医生的工作量,也在一定程度上缓解了不同地区医疗水平差异的问题。但目前与肺癌相关的计算机辅助诊断技术大多数针对独立时期的肺部病灶影像,通常是对肺部影像进行肺结
互联网上存在海量形式异构的用户生成内容,包括公开点评网站、电子交易平台中用户针对某些服务或产品所发表的评价。通常,用户会通过多种形式分享他的消费体验,比如上传照片等图像数据,发表文字评论,在平台限定范围内给出评分。随着个性化推荐、用户画像、文本挖掘分析等研究的不断深入,这些体量庞大的用户反馈数据越来越成为其不可或缺的研究支撑。某种程度上,在线评论会影响甚至引导其他新用户的购物决策,从而与品牌信誉、
随着工业生产规模的不断扩大,工业生产过程变得愈发复杂,对于系统中一些关键参数的测量变得更为重要。传统的测量技术主要基于新型的过程测量仪表,以硬件形式实现过程参数的在线测量。但受限于过程机理、物理环境、传感器和仪器硬件特性等因素的影响,工业生产过程的某些关键参数难以通过硬件设备直接在线测量。软测量技术采用间接测量的思路,利用过程中易获取到的辅助数据信息建立相应的数学模型,实现对难测主导变量的估计。传
近年来,随着大数据相关技术的发展,不光数据维数在增加,计算量也呈指数倍增长。特征选择是解决该问题的方法之一。根据数据的来源,特征选择分为单视图特征选择与多视图特征选择,根据分类模型中是否使用标签,特征选择分为监督、半监督、无监督三种类型。由于多视图数据能够发挥各个视图的优势,因此收到了广泛关注。而有监督特征选择方法因标签的获取成本很高,因此无监督特征选择方法受到了广泛关注。但是目前的无监督多视图特
音频水印算法将表示特定含义的信息(音频创作者的相关信息、音频文件的下载及传播记录)嵌入到音频文件中,不影响原始音频文件自身的品质;在发生版权纠纷的情况下,能够将嵌入音频中的水印信息正确地提取出来,即使嵌入水印后的音频受到信号处理攻击,水印提取的正确性也不会受到影响。在音频中嵌入水印可以实现音频版权的追踪,它的有效性不仅取决于嵌入水印后算法的不可感知性,还取决于提取时的鲁棒性。两者之间是相互制衡的,