基于全貌特征表示的异质电商平台用户实体对齐方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:gumozaoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动智能终端的普及和网络服务平台的快速兴起,如今,我们每个人都会在各种各样的服务平台拥有着自己的账户。然而由于平台的互斥性,我们很难知道,某两个或多个用户是否是同一个人,如何对跨平台的用户进行识别匹配,即异构网络用户对齐,如今成为了一个有趣且很有挑战的问题。本论文从异构电商平台网络用户对齐的技术和应用层面出发,深入研究电商平台用户关系结构特征和用户兴趣偏好,实现跨电商平台用户对齐以及深入挖掘用户兴趣群组进行个性化商品推荐。本文的贡献可以总结如下:1.在异构电商平台网络用户对齐的技术层面。首先,针对跨异质电商平台网络数据节点类型众多,有效数据稀疏的问题。本文提出了基于元路径的实体-关系聚合方法,聚合丰富的邻居信息,获取实体节点之间的关键信息。其次,在信息聚合的基础上,针对电商平台用户属性信息的复杂性、用户-商品关系的多样性。本文分别提出了用户属性关系UARE(User Attribute Relations Embedding)和用户交互关系EIRE(User Interaction Relations Embedding)的结构关系表示模型。对电商平台用户实体的全貌信息空间进行更加有效的表示。最后,为了提高用户特征的表达,解决单独使用用户属性关系或用户交互关系特征的单一性、片面性。本文提出了用户关系序列模型URSTA(User Relations Sequence Transformer for Alignment),把用户属性关系和用户交互关系进行融合起来,充分结合利用了实体个人属性及实体-关系之间的关系并捕捉重要信息,进行用户对齐预测。2.在异构电商平台网络用户对齐的应用层面。首先,本文通过用户对齐模型对跨平台用户建立用户兴趣群组,从而对数据进行有效地补充,缓解电商平台用户有效行为数据稀疏性以及随之产生的冷启动问题。同时考虑用户的不同关系以及用户兴趣的时效性对于推荐精度影响的问题,提出一种基于用户兴趣群组和异构序列融合的个性化推荐算法。通过引入时间序列化处理,充分考虑时序特征和语义特征的相关性,利用注意机制对用户的长、短期行为序列进行建模分析,挖掘用户的长期偏好和短期兴趣。结合用户的兴趣活跃度,商品的流行度,计算用户的对兴趣群组中商品的兴趣度,预测出来用户当前活跃兴趣及当前兴趣向量,并生成Top-N推荐列表。最后,通过在真实的书城电商平台数据对本文提出方法模型的有效性和可靠性进行了实验验证。通过实验表明,所提出的模型能够有效的对异构电商平台网络用户进行较好的对齐,通过对对齐后的用户建立用户兴趣群组,挖掘用户行为序列背后的隐藏信息,捕获用户的长期偏好和短期偏好,能够提升个性化推荐的准确度。
其他文献
在计算机技术飞速突破下,人工智能不仅在学术领域有了较大突破,其应用也越来越广泛,例如,智能家电、人脸识别、自然保护、机器翻译等。广泛的应用离不开基础图像识别的精度提升。早期图像分类因为目标差异较大,所仅通过手工提取细节特征就能达到不错的效果,但这些方法在处理复杂图像,即同类别的子类别区分时表现不好。这是因为这类图像往往存在背景干扰、同种类别姿态不同、不同类别姿态相似的难题,因此细粒度图像分类的关键
学位
随着我国经济的快速发展和人民生活水平不断提高,用电需求逐渐扩大,越来越多的地区面临着电力资源短缺的问题。如何合理管理电力需求和供给至关重要,而短期电力负荷预测可以在需求侧为制定发电计划、电力调度提供参考。伴随智能电网的发展,电力系统的负荷数据逐渐丰富,传统的短期电力负荷预测算法在性能上已无法满足需求。近年来,新兴人工智能算法在电力负荷预测研究领域表现优异,本文将结合传统算法和人工智能算法对短期电力
学位
<正>髓内钉内固定是股骨近端及股骨干骨折的一种成熟治疗方法,其在骨折复位和固定方面都有很好的效果。在生物力学和减少对周围重要组织损伤方面,髓内钉内固定优势明显,具有良好的抗旋转能力并且防折弯的能力更为突出。目前有一种适用于从股骨大粗隆周围置入的偏角型顺行髓内钉已经成为治疗股骨近端骨折的主流趋势[1-2],
期刊
在线社交网络的出现,让信息的传播速度得到了质的飞越。社交网络的出现给人们带来了诸多好处,但是谣言的出现却给社会造成了巨大的隐患。谣言指的是没有官方来源,并且没有被相关工作人员审核就进行了发表的不实言论或信息。谣言本质上是虚假的,任何敏感的谣言话题都可能造成社会的动荡,而网络谣言传播的主要途径是社交网络,用户无需审核就可以进行各种信息的发布。如今,谣言已经成为了舆论爆发的导火线,谣言的传播极大地影响
学位
软件老化效应的存在会极大影响软件运行效率,甚至造成系统崩溃进而可能导致灾难性的后果。为了减少老化效应的影响,软件再生作为一种预防式的维护技术应运而生。但由于软件再生行为本身存在系统开销,因此不能频繁地执行再生计划。在尽量避免系统失效的前提下,适时触发软件再生以最小化系统维护成本是一个重要的优化问题。传统基于检测的再生策略研究中,检测周期往往是固定的,即采用相等间隔时间对系统退化状态进行检测,进而评
学位
为了更好地促进故障预测与健康管理(PHM)技术在地面预警监视雷达中的发展与应用,提升部队自主保障能力和效率,以及降低部队保障压力,文中首先从系统架构、数据采集、数据处理、状态监测、故障预测、健康评估、维修决策等方面阐述了与地面预警监视雷达相关的PHM技术的研究现状;然后指出了地面预警监视雷达PHM技术在走向有效的工程化应用方面所面临的状态参数和特征信号难以获取,故障预测技术还不成熟,雷达PHM研制
期刊
心脏听诊和心电图是早期诊断心脏疾病最常用的非入侵和成本效益高的方法。然而,在一些服务缺乏的社区,能够进行心脏诊断的训练有素的医生和医疗工作者的严重短缺加剧了这种威胁,因为心血管疾病的早期诊断变得不太可能。这就需要开发基于机器学习的心脏筛查辅助技术。由于受到环境、不同的数字听诊器间差异以及数据采集协议的影响,心音信号的模式非常复杂,固定模式的特征提取或直接从信号中学习特征不足以实现最终的准确分类。针
学位
<正>智力和智商有什么区别?为什么智力高的人吵架容易输?相同的智商,不同的人生兰根是全美国目前智商最高的人,其智商测定结果在195~210。他自学了高等数学、哲学、拉丁语和希腊语。但是,他在生活和学术上几乎是个失败者:他从小就被同龄人欺负,被继父殴打;大学期间,他认为自己比教授懂得更多,便辍学了,而一生大部分时间都在做体力工作,收入卑微的工作和他的天才头衔形成鲜明对比。奇怪的是,被誉为“原子弹之父
期刊
随着遥感技术的进步,高时空分辨率NDVI时间序列数据在植被监测、城区变化检测等众多领域中均得到了大范围的应用。然而,受到气候条件以及技术和资金等因素限制,在一种卫星传感器上很难获取到同时满足高时间与高空间分辨率的NDVI时间序列数据。本文旨在利用遥感数据时空融合方法来解决上述问题,并获取到了高时空分辨率NDVI时间序列数据。首先,本文选用中国山东省德州市的西北部地区作为研究区域,并通过谷歌地球引擎
学位
目的 探讨老年综合评估(Comprehensive Geriatric Assessment, CGA)在老年慢性疾病患者健康管理中的应用效果。方法 选取2019年1—12月于深圳市龙华区中心医院出院的200例老年慢性病患者为研究对象,利用随机数字表法分为对照组与观察组各100例。对照组采取常规健康管理,观察组采取基于CGA指导的健康管理,两组均随访18个月,对比两组自我管理能力评分、生存质量评分
期刊