融合新闻图片和用户反馈的新闻推荐方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:liarcher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的新闻推荐算法已经不能够满足用户的浏览需求,特别是在如今的人工智能时代,如何提高用户的浏览体验成为一个研究热点,所以个性化新闻推荐算法应运而生。它和传统的新闻推荐算法相比,考虑了更多维的因素,这提高了推荐内容的可解释性,还有的算法引入了外部的知识图谱,这提高了推荐的多样性,但是存在下面两点因素给个性化新闻推荐算法造成困难,其一是新闻本身的特性,例如其数量大且内容覆盖广,更新快且时效性高;其二是在构建用户画像不容易统一,例如对不同用户的行为和兴趣,需要构建不同的用户画像。虽然目前主流的个性化新闻推荐算法取得了较好的推荐效果,但是大部分的算法忽略了新闻中的图片信息,而这些图片是具有潜在的价值。因为图片传达给用户的信息更为直观,更容易影响用户的阅读兴趣,所以本文提出了重构新闻标签的模型,并基于这些新标签提出了自适应标签算法,详细的研究内容概括如下:
  (1)本文提出了融合新闻里的图片和文本来重构新闻标签的模型(MRNT)。考虑到新闻的原始标签数目少,并且很少包含新闻图片信息,又考虑到这些标签通常是由人工来编写完成的,仅能代表着部分人对该篇新闻的看法和理解。本文首先介绍了开源的图片识别器和词向量,其次是介绍神经网络和Word2Vec模型的基础知识,最后以原始的新闻标签为参考,去除掉从新闻图片和文本提取到的低相关性的特征,用余下的特征作为新闻的新标签,这些新标签是后文提出的标签相关性图和AT算法的基础。
  (2)本文提出了一个关注用户短期兴趣的自适应标签算法(AT)。由于新闻的特性,导致用户的短期兴趣容易受到新闻内容的影响,如果用户的兴趣模型构建不好会降低用户的浏览体验,所以本文针对如何构建用户的短期兴趣模型提出了AT算法。该算法是通过用户的反馈,筛选出用户当前最感兴趣的标签。为了筛选出用户最感兴趣的标签,本文为用户当前感兴趣集合中的每个的标签进行打分,首先计算某标签在用户的浏览历史中的比重得分,然后计算该标签的热度得分,随后计算该标签在候选新闻中的比重得分,其次是计算该标签的延深得分。最后把前面四个的得分加起来就是该标签的最终得分,再选出得分最高的标签就是用户当前最感兴趣的标签。
  (3)实验结果和分析。基于新闻推荐的性能评估标准(F1,AUC,MRR),验证了本文所提出的方法,在推荐条目较小的情况下,与其他基线相比具有较好的推荐效果。
其他文献
监狱面向的人群较特殊,监狱的安全出现问题将会引起社会治安问题。监狱安全管理即控制监狱风险事件的发生。监狱风险事件既可能因外部因素而引起,如形势政策等,也可出自于内部因素。当前大多数影响恶劣的监狱危害性事件都来自监狱内部风险。监狱内部风险是监狱风险的重点,是监狱面临的最普遍的风险。但目前我国的风险评估尚处于起步阶段,评估过分依赖监管人员主观判断,缺乏科学有效的评估方法。与此同时,我国已经建立起监狱基
学位
随着创新市场的竞争不断加剧,传统的生产管理方式已无法满足客户需求的多样性。在生产活动中,越来越多的企业以供应链为单位展开紧密的合作,然而此种方式研发成本较高,且创新效率较低。随着产学研协同创新理论的不断发展,越来越多的供应链企业选择与具有相应创新能力的高校与科研院所展开更为广泛的合作活动。因此,产学研合作背景下供应链协同创新模式越来越受到人们的关注。其中联盟的利益分配问题将直接影响各大主体参与项目
学位
2015年政府工作报告中提出要创新社会治理,加大结构调整力度,积极作为,夯实经济社会发展根基的社会治理理念。2017年党的十九大对社会治理能力进行再一次强调,要求各级党委、政府要打造共建共治共享的社会治理格局。本文所指代的地方政府是指县级政府,作为功能最为齐全的基层政权,是国家治理的基本单位。构建评价体系对县级政府的治理能力进行有效评价,对于促进县级政府治理能力的提升具有重要的理论意义和现实意义。
学位
近年来,由于社交媒体的广泛传播,在线群组活动也变得愈加频繁,从而使得群组推荐逐渐成为研究的热点。另一方面,伴随着深度学习在语音、图像、文本等方面取得的巨大成功,推荐系统中关于深度学习的研究也在如火如荼的进行着。本文正是在这样的背景下尝试在多任务学习框架中,通过利用注意力网络来动态地捕捉用户偏好来强化用户群组推荐,通过多层次注意力网络来强化社交网路中的群组推荐,以及通过自注意力网络和门控网络来强化物
学位
慢速拒绝服务(LDoS)攻击是拒绝服务(DoS)攻击的一个变种,其利用网络协议中自适应机制的设计缺陷发动攻击,具有较好的隐蔽性。LDoS攻击具有周期性和平均速率低的特点,这导致传统DoS攻击检测方法难以检测LDoS攻击;其次,现有的LDoS攻击检测方法普遍存在检测准确率不高和自适应能力不足的缺点。因此,LDoS攻击已对网络安全形成了严峻的威胁,对其检测方法进行深入的研究具有重要的理论价值和现实意义
随着信息技术和多媒体传输的普及和广泛应用,秘密信息的保护和多媒体安全问题引起了人们的普遍关注。在包括文本、图像、音频和视频等数字媒体中,以数字图像得到最为广泛和便利的应用,其具备内容丰富,视觉效果佳,占用空间小的特点,因此基于数字图像的秘密信息隐藏具有更重要的研究价值。目前数字图像中的可逆信息隐藏仍然存在失真度较大,嵌入率过低的问题,尤其是在加密图像中,因为像素之间不存在冗余性,所以面临着更大的挑
学位
随着物联网技术的发展,RFID作为其关键技术得到了广泛的关注和应用。在物流以及仓库管理等物品管理应用中,所管理的物品不可避免的需要经常移动。物品的移动会造成库存的变化,加大了管理的难度。将RFID应用于这些领域的一个重要性难题是如何在动态复杂的环境下对系统中的标签进行高效监测,从而实现对物品的高效管理。本文主要围绕动态标签数量估计、标签搜索这两类标签监测问题开展研究工作,主要贡献总结如下:  针对
随着各种数字媒体记录设备的普及,数字图像已经成为人们日常生活中传递和获取信息的重要载体。与此同时,功能强大且易操作的媒体编辑工具的快速发展,使得数字图像的修饰和编辑越来越便捷。因此,面对日益严重的图像篡改形势,迫切需要发展相应的取证技术,进行数字图像真实性和完整性的验证。图像被动取证技术通过分析图像自身固有特征,实现对数字图像的真实性、完整性检测。作为图像取证领域的新兴分支,图像操作链取证是信息安
学位
射频识别(RFID)是一种能够有效的感知和收集信息的非接触式自动识别技术,普遍应用于仓库管理等场景。在RFID系统中,RFID阅读器通过无线射频信号识别和收集RFID标签的相关信息,而读取标签的吞吐量则是衡量系统工作效率的一项重要指标。大型RFID系统通常需要部署多个阅读器来对监控区域进行全覆盖,而阅读器引起的信号冲突问题很大的限制了系统的读取效率。如何有效地协调多个阅读器共同工作对于RFID系统
监控大型网络的性能对于网络状态跟踪、性能优化、流量工程、异常检测、故障分析等至关重要。然而,要想获得全网性能视图,存在测量代价高的挑战。为了降低测量代价,可以测量网络的路径或时间间隔子集,同时利用它们的时空相关性推断剩余的网络性能数据。缺失数据恢复的质量很大程度上依赖于推测算法。张量填充以其利用多维数据结构进行更精确的缺失数据推测的能力引起了人们的关注。然而,传统的张量填充算法仅通过内积建模数据特