融合评分矩阵和评论文本的推荐算法研究

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:pmlypmly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
融入用户生成信息(User generated content,i.e.,UGC)的推荐系统在近年来得到了研究和应用。在众多的用户生成信息中,基于评分的反馈信息广泛存在,因此基于评分数据的推荐算法吸引了研究者的兴趣,例如,协同过滤算法、聚类、关联规则、隐因子模型等。随着推荐系统的成功应用,用户参与度不断提高,各类信息可以不断的被加入到推荐算法中,用户撰写的评论文本内容成为最能反映用户喜好的信息之一,越来越被研究者关注,与之相关的文本分析及观点挖掘的方法不断提出和优化。然而将评分矩阵与评论文本挖掘结合的方法并不多见,本文在前人研究的基础上,改进和提出四种融合评分和评论信息的推荐算法以提高推荐效果,并研究有用性评论的识别问题。论文的主要工作如下:一、评论文本包含丰富的用户情感和商品特性,现有方法却没有充分的融合评分与评论文本,本文提出改进的HFPT及DLMF算法,用于试图改进HFT(item)算法。在Amazon的28组评分评论集中进行实验,平均均方误差(MSE)作为指标,发现HFPT算法稍逊于HFT(item)算法,其中存在的原因是单条评论内容大多数属于短文本,LDA主题发现算法在短文本中不及长文本有效,因此,DLMF算法将评论集分解为更能反应用户喜好和商品特性的用户评论集、商品评论集,将两者的主题特征同时融入到矩阵分解模型来改进上述问题,经过实验发现DLMF算法优于HFT(item)算法,数据子集提升效果最高达到3.68%。二、用户的偏好会受到自身和他人对商品的偏好影响,所以将主题偏好作为引导项有利于提升效果,本文提出两种加入主题偏好引导的改进算法PGMF及DPGMF。Amazon的28组数据上实验发现两种算法在平均均方误差指标优于HFPT、DLMF和HFT(item),相比HFT(item)的提升效果最高达到7.31%。三、在过往的研究中都是以单个商品为目标,对所有隶属于该商品的评论进行排序,本文提出基于上述四种算法的个性化的用户评论有用性识别,能够得到与用户偏好和商品特性最为相关的评论排序,并提供给不同用户。然而,由于在本数据集中并未能够对单个用户的评论进行有用性标记,因此无法完整的验证个性化的识别效果,但是在后续研究中可以针对可行数据做进一步研究。
其他文献
《敞开心扉》是法国女演员英格丽·肖万的作品,于2016年3月出版。全书包含13章节,讲述了作者的成长经历、家庭背景以及丧女之痛。童年的孤独和与父母的关系造成作者极为重视
投资者关系管理(Investor Relations Management,简称IRM)植根于成熟的资本主义市场中,首先在西方发达资本主义国家出现。在过去的几十年中,由于完善的资本主义市场,IRM已经
我国自2001年加入WTO以来,对外开放格局逐渐扩大,引进外资力度和对外投资的规模都在不断增大,尤其在次贷危机后,我国OFDI规模扩张速度变得更快。在此背景之下,学界对于OFDI的
组织管理的本质是一种实践活动,而这种关于人的实践活动最终形成了组织文化。组织文化反映一个组织的基本价值追求,体现组织成员的精神状态,组织成员所认同并遵循的价值观是
基于利己和利他理论的视角引入自发性群众体育群体探索领导者需要与行为的关系问题,以物质需要和精神需要作为变量,探讨酬劳需要、荣誉需要、交往需要、尊重需要和成就需要与
总所周知,全球很多知名企业都是来自美国,有相关数据资料显示2016年GEI能够看出,如果依照对创业的最基本态度等指标评价的话,美国绝对常年处于第一的位置。本项目为一堂名为
《淮南子》是西汉时期重要的学术著作,由淮南王刘安等人编著,是一部涵盖了多种学科类别的史学资料,《淮南子》中涉及到的音乐资料在全书的各个篇章中都有提及。本文以《淮南子》中“内”与“外”思想对音乐创作的影响为主要研究内容,在前人的研究成果基础上,以“内”“外”划分音乐创作中的形式与内容,将淮南子的“内”归为“礼乐之美”“天人合一之美”“中和之美”,把音乐创作中的形式结构与音乐思想联系,研究其音乐思想对
经过近四十年的探索和努力,我国保险业取得了飞速的发展,与经济发展关系极大。保险市场分工逐渐成熟,从而诞生了保险中介市场,作为其关键构成。保险行业快速发展,保险中介市
随着行政审批制度改革的纵深推进,旧有的审批体制消极作用日渐凸显,给社会带来负面影响越来越大。要进一步完善政府职能转变,建设服务型政府,使经济建设更为健康有序发展,进
序列模式挖掘是挖掘相对时间或其他模式出现频率高的模式。相对于正序列模式挖掘仅考虑了已发生的事件,负序列模式挖掘还考虑了缺失的(未发生的)事件,能够提供更全面的决策信息