基于文本的可解释性推荐系统研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:a595420725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,人类社会正式进入信息过载的时代,推荐系统已经成为电商网站、社交媒体和新闻门户等在线服务平台的重要组成部分。推荐系统的目的在于有效地挖掘用户兴趣并缓解信息过载的问题。目前主流的推荐系统倾向于从用户和商品的历史交互行为中挖掘出用户的兴趣爱好并形成推荐。虽然基于交互数据的推荐系统取得了不错的推荐性能,但当交互数据比较稀疏时,这类推荐系统往往会面临性能严重下降的问题。此外,仅基于交互数据的推荐系统也无法为自身的推荐结果提供合理的可解释性。近年,为了解决基于交互数据的推荐系统所面临的挑战,基于文本的推荐系统开始流行。用户的评论是用户除在线消费行为以外,另一个体现用户在线消费体验和情感的数据(例如:用户为什么要购买该商品,用户对该商品最满意的属性等)。基于文本的推荐系统尝试通过把用户的评论信息和商品的描述信息等文本内容作为新的数据源,旨在解决用户交互数据的稀疏性问题。同时,基于文本的推荐系统可以利用从评论中挖掘出的语义信息为推荐系统的推荐结果提供语义上的可解释性。本文主要针对当前基于文本的推荐系统所存在的问题,从以下三个方面展开研究:(1)能感知购物场景的用户和商品的动态表示学习研究目前的基于文本的推荐系统中,大多依赖平行网络结构分别从用户文档和商品文档中学习出用户和商品的潜在表示。这类模型善于挖掘用户的一般爱好和商品的基本属性,而对用户当前的购物场景缺乏感知能力,导致目前基于文本的推荐系统无法有针对性地捕捉用户和商品之间的复杂关系。因此,本文通过分析用户在电商平台的购物场景,结合深度学习技术和注意力机制,提出一种具有场景感知能力的用户和商品联合表示学习模型。其核心思想在于:利用从用户文档和商品文档中所提取的语义交互结果,针对性地学习具有购买场景感知能力的用户和商品的联合表示,最终改善推荐系统的推荐性能并同时从语义层面为推荐结果提供更细粒度的可解释性。(2)根据用户爱好和商品属性间的关系推理用户购买商品的潜在原因根据用户对商品的评论和评分来推理用户购物行为背后的原因和情感是如今主流电商平台关注的重点。现存的具有可解释性的推荐系统无法揭示用户对商品的不同属性所携带的情感及其携带情感的强烈程度,因此也无法很好地推导出驱动用户购物行为背后的原因。本文通过使用深度学习领域里的胶囊网络结构,基于情感的两极性对用户兴趣和商品属性之间的关系进行建模,推理用户对同一个商品的不同属性所携带的情感及其程度,在电商领域构建一种可解释你喜欢与不喜欢的基于胶囊网络的商品推荐模型。(3)解决文本数据的稀疏性虽然基于文本的推荐系统可以有效缓解交互数据的稀疏性,但当文本数据稀疏的时候,现有的基于文本的推荐系统无法维持鲁棒的推荐性能。本文尝试将与目标用户具有类似打分行为的用户视为同好用户,并通过提取同好用户所写的辅助评论中的语义信息来缓解文本数据稀疏性的问题。其目的在于把同好用户所写的辅助评论文档视为额外的文本数据信息,用以保证基于文本的推荐系统在文本数据稀疏的情况时推荐性能的鲁棒性,并同时利用从辅助文档中提取到的语义信息提升推荐系统的性能。
其他文献
当前随着全球经济一体化的发展,越来越多的跨国企业开始将目光放到国际市场上,其通过在海外其他国家中设立子公司或跨国并购的方式来进行海外扩张,从而在国际市场上打造竞争优势。当前,企业的这种海外扩张行为得到了学术界和商业界的广泛关注。即使是对于跨国企业来说,他们绝大部分的生产经营活动却依旧是在母国市场中完成的,也就是说跨国企业具有很高程度的母国足迹。而跨国企业在母国市场上的经营情况是否能够对其后续的海外
胚胎是一个新生命的开始,胚胎发生和发育受到极其严格且精细的调控,以保证传宗接代正常进行。无论动物还是植物,胚胎都被母体组织层层包裹,多年来的研究揭示了胚胎发育过程中周围母体组织形成的微环境对胚胎发育至关重要,特别是早期胚胎发育极其依赖于这种微环境所传递出的发育信号。对动物胚胎的研究表明,母体-胚胎间存在着复杂的信号交流。母体组织发育缺陷或母源性信号分子异常会导致胚胎发育异常或胎源性疾病。植物胚柄连
虽然生成对抗网络(Generative Adversarial Network,简称GAN)已经被广泛应用于很多实际领域,但是GAN仍然存在缺陷导致无法生成高质量的模拟数据。虽然当前GAN的变体尝试解决这个问题,但是他们在实际运用中仍然存在不少问题。现存的GAN的变体或存在梯度负数(如WGAN)或者生成的数据仍然存在相同图片或者图片模糊等问题(如MGAN)。本文研究的对象主要是在三个方面,即如何解
自“大数据”的概念在2005年被提出以来,“大数据”在全球范围内的学术界和商业界掀起一股革新的热潮。空间大数据(SBD)特指具有空间信息的大数据。智能技术和传感器技术的快速发展使得空间大数据成为了目前最具价值的空间产品之一。SBD可以被分为对地观测大数据与人类活动大数据两类。目前,运用先进的技术手段从SBD中提炼知识已经成为学术界以及相关产业中的重要范式;SBD也在地球科学,城市学,环境科学等多个
当前,各国越来越重视空天地网络信息系统(GASNIS)的建设。GASNIS是以空中平台,包括空间站、高中低轨道的卫星、平流层的气球、有人或无人驾驶的飞行器;以及地面平台、包括地面站点或地面移动终端;水域平台,包括海洋观测船舶或有其他特殊任务的船舶为载体所组成。GASNIS是实时获取,传输和处理相关信息为主要任务的网络信息系统。其发展涉及到国家的政治,经济,军事以及民生等各个重要领域。GASNIS是
登革病毒属于黄病毒科黄病毒属的一个血清型亚群,根据其抗原性的不同可以分为5个不同的血清型。同一血清型中又可因为抗原性的差异分为不同的基因型。登革病毒是一种虫媒病毒,其主要通过埃及伊蚊和白纹伊蚊进行传播。登革病毒主要流行于热带和亚热带地区,在亚洲,太平洋群岛及中、南美洲等许多国家均已造成严重的威胁。登革病毒感染人体后主要引起登革热以及发病率和死亡率都很高的登革出血热和登革休克综合征。其中登革热的症状
三维(Three-Dimensional,3D)视频技术的迅速发展,也让三维音频技术受到了广泛地关注。3D音频系统可以重建具有水平方向、垂直方向以及距离共三个空间自由度的空间音效,在空间任意位置生成虚拟声像,提供具有沉浸感的听音体验。传统的3D音频系统主要是基于声道的,如国际标准组织MPEG指定的三维多声道音频参考系统--NHK 22.2,该系统可以通过24个指定空间位置的扬声器播放对应的多声道信
研究背景:放射性骨损伤(Radiation-induced bone injury,RIBI)是四肢恶性肿瘤和口腔颌面部恶性肿瘤放疗后的并发症之一。对于接受放射治疗的患者而言,一方面,其本身可能存在病理性骨折或术后的骨缺损,放射治疗的电离辐射会降低骨折的愈合能力;另一方面,电离辐射还会直接损伤骨组织,导致骨损伤和骨量丢失,进而增加病理性骨折的风险。严重的放射性骨损伤可以导致骨坏死和骨髓炎,此时甚至
恶性肿瘤严重影响患者的身体健康与生活质量,目前肿瘤的治疗仍然是世界性医学难题。由于个体的差异性以及肿瘤的异质性,传统的肿瘤治疗很难彻底根除肿瘤,并会在治疗过程中引起一系列副作用。光热治疗(PTT),作为一种新型无创肿瘤治疗技术,逐渐引起人们的广泛关注。在近红外激光照射下,PTT通过光热制剂将光能转化为热能,产生局部高温诱导肿瘤细胞凋亡坏死。这种物理治疗手段具备穿透力强,疗效好,毒副作用小等诸多优点
随着互联网数据量的增长以及用户交互模式的发展,各种元数据之间逐渐形成一张巨大的网络结构。图模型是数据库和数据挖掘领域常见的用来表示相互关联的元数据数据模型,许多实际应用离不开基于图模型的数据分析管理方法。现实世界的图数据不仅是稀疏的,而且由于节点度数的随机性而常常出现局部密度分布不均匀的特点。在局部密度较大的部分,元数据之间的关联度高于全局平均值,蕴涵的信息量较大,因此在实际的应用中具有较高的商业