【摘 要】
:
社会经济的发展极大地改善了人民的生活,人民群众对物质文化生活的美好愿景不断增强。同时,人类已步入大数据时代,如何从海量数据中挑选出用户感兴趣的信息并将其推荐给用户,已成为商家和用户共同关注的焦点。因此,个性化推荐系统应运而生。用户评论蕴含了丰富的情感信息,传统推荐方法对此考虑较少。一些研究虽引入文本处理方法,但也仅是对用户评论这种单一文本进行处理,并且无法根据用户偏好对评论进行细粒度的情感分类,这
论文部分内容阅读
社会经济的发展极大地改善了人民的生活,人民群众对物质文化生活的美好愿景不断增强。同时,人类已步入大数据时代,如何从海量数据中挑选出用户感兴趣的信息并将其推荐给用户,已成为商家和用户共同关注的焦点。因此,个性化推荐系统应运而生。用户评论蕴含了丰富的情感信息,传统推荐方法对此考虑较少。一些研究虽引入文本处理方法,但也仅是对用户评论这种单一文本进行处理,并且无法根据用户偏好对评论进行细粒度的情感分类,这些因素限制了情感分类的准确率。在情感分类中综合利用多元文本和用户偏好,可以得到更加准确的情感极性。另外,现有推荐方法也没有充分利用用户偏好中的时间特征,时间特征是用户偏好的重要组成部分,对其加以利用可使用户偏好建模更加准确。同时,用户的兴趣爱好也在不断变化,这种变化既有用户随时间和阅历的增加自主产生的变化,又有其他用户对其产生的影响,现有方法往往只注重对用户偏好进行建模而缺乏对社交关系的利用,综合考虑这些因素可以提高商品推荐的准确率。本文针对上述问题开展商品推荐研究,提出了一种融合多元文本信息与用户偏好的商品推荐方法,该方法由两部分组成:第一部分是融合多元文本信息和注意力机制的方面级情感分类方法,该方法的功能是对用户评论进行情感分类,以提取出评论文本中用户观点的情感极性;第二部分是基于多维特征的商品推荐方法,该方法对所得到的情感极性加以利用,并结合时间因素得到了更加准确的用户偏好向量,又综合利用用户偏好和社交关系得出了更加准确的推荐结果。下面分别对这两个部分进行说明。(1)融合多元文本信息和注意力机制的方面级情感分类方法。本文针对现有情感分类方法对评论文本中的用户情感信息挖掘不充分的问题,综合利用多元文本、注意力机制以及用户偏好提出了一种新的情感分类方法。对于商品来说,其简介文本是对该商品最为直观的描述,传统的情感分类方法往往只对用户评论进行处理,而本文综合利用商品简介和用户评论这两种不同的文本。首先分别对两种文本进行切片处理,得到多个子序列,利用注意力机制使两种文本互相作用,即可得到融合商品简介和用户评论的文本表示;然后在正向和反向分别对文本信息进行处理以此更加充分地提取文本信息的隐藏特征;最后对文本信息中涉及的不同方面分别用对应的方面处理模块进行训练,根据用户偏好得到用户最感兴趣的方面,将文本特征向量输入该方面处理模块,进行方面级情感极性计算,最终得到更加精确的情感分类结果。(2)基于多维特征的商品推荐方法。本文针对现有推荐方法对用户偏好建模不准确以及缺乏对社交关系利用的问题,综合利用情感极性、时间因素以及社交关系提出了一种新的商品推荐方法。本文首先分别根据用户评论得到用户对于商品的情感极性,根据用户的历史行为得到用户对商品时间属性的偏好;然后通过在GRU模型中增加门控单元使两种信息得到融合。之后利用用户兴趣演化网络捕捉用户兴趣的变化过程,即可根据用户兴趣向量得到基于用户偏好的商品评分;同时,根据用户的评论行为构建其社交关系网络,通过对社交关系的抽取可以得到基于社交关系的商品评分,将两种评分利用自适应时间函数加以融合,即可得到最终的商品评分,进而可以产生更加准确的商品推荐结果。最后,本文对所提方法进行了实验验证,采用准确率、查准率、召回率和F值作为评价指标。实验结果显示,本文提出的融合多元文本信息与用户偏好的商品推荐方法相较于其他对比方法在各项指标上表现更为优秀。
其他文献
计算机视觉技术领域的研究进入了深度学习时代后,人脸检测作为计算机视觉领域中一直都在研究的问题,也跟随人工智能技术不断向前发展,深度学习时代的人脸检测算法也可以从跟通用目标检测的关系来从两个不同的角度看待,分别是专为检测人脸目标而设计的检测器,此类算法大多从人脸与其他目标相比而独有的特征出发而设计,另一种就是在通用目标检测算法的基础上,做一定针对于人脸目标的调整,此类算法的设计往往更加简洁,且具备更
在当今的数字化时代,我们对图像质量提出更高的要求,各个领域的发展都离不开图像。但是由于采集设备的传感器缺陷,或通过通信信道传输的过程中图像容易被脉冲噪声所破坏,具体表现为图像中随机出现的黑点和白点,故也可叫做椒盐噪声,椒盐噪声不仅影响我们视觉对图像质量的判断,而且还会对后续其它图像处理任务造成影响。去除椒盐噪声的方法有很多,有学者提出基于模糊理论的两阶段噪声检测与去除方法,优点是结合模糊理论处理不
漏洞检测一直是软件安全领域的一个重要研究问题,近年来,基于深度学习的代码漏洞检测技术取得了长足的进展,相比于传统方法,它不依赖领域专家,能够自动提取漏洞模式。然而,已有研究表明,深度学习模型具有脆弱性,在样本上施加一个精心设计的小扰动,就有可能成功欺骗模型,使模型输出错误结果,如果稍加扰动就可以让漏洞程序逃避检测,这将对软件安全造成巨大的威胁,施加扰动的方法即是对抗攻击方法。目前,针对对抗攻击方法
在流行病学中,时空数据可以帮助追踪传染病的传播过程,由于这些数据在现实中涉及到如溯源等具有重要实际意义的应用,所以对数据的真实性有较高的要求,同时目前时空数据大多由各个企业、机构单独集中式存储,从而形成了一座座“数据孤岛”,极大的降低了时空数据的流通性和数据价值,并增加了数据造假的风险。区块链技术的不可篡改性与透明性可以为时空数据的存储、共享与溯源需求提供良好的支持,但是当前区块链的数据结构并不是
随着数据相关理论和技术的快速发展,金融、医疗、电力等各领域均产生了海量数据。这些数据来源分布广、格式多变、规模庞大。然而,由于网络传输、人工审核校验等原因,数据集当中某些属性存在缺失甚至错误,数据质量难以保证。良好的数据质量是支持分析、决策以及可视化等的重要基础。如何提高数据质量,成为当前数据处理领域研究的热点问题。本文对其中的数据填补问题展开了研究。在数据填补问题上,许多学者进行了研究,提出了一
无线传感器网络是指在特定区域内由若干个带有监测、传输数据功能的微型节点形成的自组织网络,可向用户传输监测信息。早期无线传感器网络路由协议着重于节能,但随着应用环境的改变,数据传输的可靠性变得十分重要。针对异常事件监测场景下,以保证数据可靠传输、均衡网络能耗为目标,提出一种基于分簇与信任的可靠传输路由协议。该协议主要包括基于节点多指标的信任评价模型和改进的基于梯度分簇模型,将二者应用在分阶段传输的路
软件测试作为保证功能交付,提前发现软件项目问题的主要手段日益受到学术界和产业界的重视,自动化软件测试是其中一个热门领域。自动化软件测试技术通过程序分析等方式,不断生成测试用例执行程序,目的主要是覆盖尽可能多的程序路径以及发现能够导致程序崩溃的漏洞。基于覆盖率引导的模糊测试与动态符号执行作为两大主流的自动化软件测试技术已被广泛研究并应用到学术界与工业界中,这两种技术有明显的特点:模糊测试通过对测试用
随着移动设备的普及和网络资费的提速降价,智能手机迅速走进每家每户,并扮演着极其重要的角色,其中安卓手机在市场中占据了相当一部分份额。智能手机普及以后,各式各样的手机应用也如雨后春笋般涌现出来,现如今,人们的衣、食、住、行,绝大多数事务都可以通过手机上的一个个应用程序解决。然而,这些手机应用在提供便利的同时,也极有可能造成用户隐私数据的泄露。例如一些攻击者可能会发布恶意软件窃取用户的隐私数据,如手机
随着信息技术和人工智能的迅速发展,智能化微震定位和成像技术被广泛应用于火山、煤矿、油田等众多地区。近年来,随着我国煤矿开采深度的增加和开采强度的提高,大能量矿震事件频发,造成大量人力物力的损失。因此,精准有效的微震定位和成像方法是煤矿监测领域研究的热点问题。微震定位和成像技术依赖于微震发生时,微震源发出能量波信号的监测数据。受地下介质速度结构异构性影响,能量波信号大多不沿直线传播。同时,受背景噪声