融合人格特征的推荐系统研究与实现

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:jasonzheng1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人格是一种心理构造,可用于描述和解释人类的行为,是一种推荐系统领域内尚未被应用的非结构用户数据。人格作为人类心理特质的直接映射,可对人类偏好产生重要影响。近年来,互联网的海量数据给人们带来严重的信息过载问题,导致用户难以准确获取与其需求相符合的信息。推荐系统能够根据用户历史行为数据,分析其潜在偏好,为用户提供个性化推荐,成为缓解信息过载问题的有效手段。现有推荐系统主要是基于历史信息的推荐,以用户评分矩阵作为主要的用户偏好信息。用户评分矩阵通常较为稀疏,而推荐系统模型期望稠密输入,稀疏输入带来推荐准确性的下降,因此现有推荐算法普遍面临的评分矩阵稀疏,难以分析提取用户偏好的问题,也造成了实际推荐效果不佳。基于用户评论和其他隐式反馈信息的推荐算法在解决冷启动、推荐准确性以及可解释性等方面具有重要潜力。然而当前受到文本信息挖掘技术、用户潜在特征建模技术等方面的限制,基于评论信息分析的推荐算法进展并不明显。目前的研究广泛认为基于模型的推荐结果优于基于历史信息的推荐,特别是在稀疏数据上效果更好。但当前以模型为基础的协同过滤推荐系统存在仅对项目特征深入分析建模,未对用户特征进行分析建模的问题。没有用户特征,推荐结果无法匹配用户个性。用户特征模型的缺失,同时也导致了冷启动问题和数据稀疏问题,需要大量的用户数据和历史行为信息才能为用户推荐满意的项目。针对上述问题,提出两种融合人格特征提取的推荐算法。算法一融合人格特征的概率推荐模型,构建人格特征提取神经网络,从评论信息中获取人格特征进行用户建模,将人格这种非结构数据转换为结构数据。提出的Per-Bert MF概率模型依据用户人格得分和其他上下文信息计算得出最终预测评分矩阵;算法二融合人格特征的图神经网络模型,参照用户-项目关系对构建异质二部图结构,将用户及项目作为图节点。构建人格特征提取神经网络,从评论信息中获取人格特质进行用户建模,将用户及项目的人格得分作为节点信息存入图节点。提出基于图注意力机制的P-GAT图神经网络模型获取用户及项目节点的最终表示,使用向量内积获得推荐系统预测结果。通过人格模型的引入,解决推荐系统“用户-项目”模型面临的用户特征缺失问题,提取人格特征作为用户本质特征,为个性化推荐系统的改进提供了新的思路。
其他文献
原子层沉积(ALD)设备作为制备纳米薄膜材料关键设备,对其进行国产化自主研发有助于加快国内在半导体领域的研究进程。目前的ALD设备在自动化程度上存在缺陷,无法满足半导体产业上的工作环境。本课题借助校企合作平台,对自主研发带有转送系统的Load Lock(送样取样)型ALD设备控制系统展开设计与研究,结合目前先进PLC技术完成控制系统的设计。该系统提高了ALD设备自动化程度以减少人工操作实现高度自动
学位
学位
老挝人民民主共和国(简称老挝)是与我国相邻的东南亚重要国家。作为我国在东盟自由贸易区的重要贸易伙伴,随着我国“一带一路”倡议的实施,老挝与我国经济和文化方面联系更加密切。在这样的背景下,对老挝语进行自然语言处理(Natural language processing,简称NLP)研究具有重要的经济和文化价值。命名实体识别(Named Entity Recognition,简称NER)是关系提取、构
学位
信息物理系统(Cyber-physical system,CPS)作为一种将信息世界与物理世界连接的重要手段,得到了广泛的应用。而无线传感器网络作为信息物理系统的重要感知网络,是由许多小型的节点设备组成的监测网络,主要目的是用于实现人们对于该物理区域的远程监控,以获取人们所需要的各种信息,实现信息物理之间的交互。其中,在大多数的信息物理交互应用场景中,人们在获取其感知信息的同时,更关心其发生事件的
学位
随着互联网、5G、大数据、人工智能的飞速发展,媒体传播生态发生了根本性改变,人们获取信息的渠道和方式变得越来越多元化。第49次《中国互联网络发展状况统计报告》显示,截至2021年12月,我国网民规模达10.32亿,其中手机网民规模达10.29亿,网民使用手机上网的比例为99.7%。移动互联网迅速发展,导致舆论生态、媒体格局和传播方式等发生深刻变化,人们的信息获取方式也随之发生变化,每个人既是信息的
期刊
随着中老铁路的开通,中国与老挝的交流日益紧密,对老挝语的研究也显得越来越重要。本文通过研究汉语与老挝语在句法、词语形态学等语言学的差异性和相似性,将汉语与老挝语的语言学特征融入文本相似度计算模型,力求缩小语言差异给模型造成的影响,提高模型的泛化能力与准确率。老挝语属于低资源语言,语料匮乏,针对此问题,本文根据词性、非关键词等方法对词语进行分类,并提出一种基于同义词替换的数据增强技术,旨在扩充汉老平
学位
由于近年来很多行业对互联网技术的高度关注,以及网络和社交媒体技术的快速发展,信息传播变得更加多渠道化,对有关部门而言实现网络信息的有效管控十分关键,尤其是关于网络上涉案领域舆情信息的监管。涉案舆情信息与一般的网络信息相比更具有敏感性,也对信息汇总与监管的技术提出了在性能方面上的更高要求。面向涉案舆情新闻信息汇总描述相同话题的新闻,以及生成与话题描述相关的简短摘要,对有关部门掌握舆情新闻的关注动向,
学位
输电杆塔上的鸟巢检测作为电力系统巡检的一项重要研究内容,这是因为鸟类在输电杆塔上的筑巢活动所导致的输电线路安全事故频频发生。在我国鸟类数量巨大,鸟类的活动可能给高压输电线路的正常安全运行带来隐患,对国家电网造成严重的经济损失,所以针对输电线路上存在的鸟巢有必要提出一套行之有效的解决方案。本文针对如何识别高压输电杆塔上的鸟巢,通过对国内外鸟巢检测方法的研究,找到了一种融入纹理特征的鸟巢自动检测方法。
学位
现如今,输电塔线路作为国家规划建设输电网络的生命线,其安全状态对稳定安全的电力运输有着极为重要的影响,输电线路一旦发生故障,会引起线路瘫痪及一系列其他危害,因此,对输电塔线进行安全状态的监测和评估具有实际意义。导致输电塔线路中出现的故障的原因是多种多样的,而且其中,影响最为严重的是覆冰现象所导致的故障。输电塔线路覆冰不仅会直接导致线路荷载增大,覆冰的导线所受风力的作用也会被放大。因此对输电塔线进行
学位
太阳光球亮点与磁场有着密切的联系,光球亮点近似旋转的曲线运动意味着磁通量管发生了振荡,继而以波的形式通过磁通量管向色球和日冕传送能量,从而加热日冕。所以,光球亮点的曲线运动对研究太阳内部的能量如何传输到日冕层具有重要意义。本文基于深度学习的方法,提出一种多尺度多模态的策略对光球亮点的曲线轨迹段检测方法展开研究。本文建立了可靠的光球亮点轨迹数据集。数据集由光球亮点的真实轨迹数据集和模拟轨迹数据集两部
学位