基于文本情感分析的个性化影片推荐模型的研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hbbzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务快速发展,推荐系统成为电子商务里是必不可少的工具。目前推荐模型面对的最大问题是原始数据的强稀疏性和高维度,这些问题将会导致模型个性化低和计算效率低。传统的推荐算法是直接利用用户已观看过的行为数据来做分析,但是观众会随着心情随意打分以及某些制片商通过恶意刷分来提高自己的收益,这些行为都会影响最终推荐结果的准确度。针对上述问题,本文对推荐算法中最主流的协同过滤算法进行研究,并且引入文本情感分析来提高推荐精确度。主要研究内容包括:1.针对待分析的原始数据存在强稀疏和高维度等问题,在最近邻模型基础上引入矩阵分解构成混合算法。首先对皮尔逊相似度做改进,使其考虑到更多的隐式特征,可以更精确地计算出用户和项目的各自“邻居”集合。然后用获得的两个“邻居”集合来构建评分矩阵,这个过程相当于提前把信息过滤了一遍,避免遍历其它稀疏数据,从而降低稀疏数据对实验的影响。利用矩阵分解的方法可以加快运算速度,降低时间复杂度和提高推荐精确度。2.传统的推荐算法只分析了用户评分等历史行为数据,这些数据质量的好坏会影响推荐的精确度。通过影评情感分析对泛推结果进行过滤,从而达到精确推荐。针对影评上下文信息带有自身的属性特征和语序不合理性,引入一种特征增强的深度学习模型。在输入层和卷积层之间引入权重分布层,对重要部分进行分析,减少噪音,使处理的特征得到提升。再分别利用卷积层提取不同局部特征,另外在卷积层中加入门控机制来降低使用梯度下降法带来的梯度弥散风险。最后引入序列标注层,使其能够获得高级的抽象特征来表示正确的文本语义。通过实验证明,利用字和词粒度词向量结合为输入,从而解决了歧义词的切分问题,并且证明了利用该模型进行影评情感分析分析效果好于其它几种模型。最后将文本情感分析的结果与推荐模型相结合,增强模型健壮性的同时提高个性化推荐精确度。
其他文献
<正>各位乍一看,流量还分公私?之所以流量有公私之分,是因为在2019年有一个比较火的概念——私域流量。既然有私域流量,那么对应的就有公域流量,今天我们就来谈一谈流量的公
"玄学"是中国哲学史中一个尚未被深入发掘的称谓。其一般的含义是指魏晋玄学,但是深入文献考察,会发现这个称谓从刚出现时其含义就带有儒释道三教争鸣与暗合的特点。从两晋南
《人面桃花》一改作者前期对各种创新手法的尝试,选择"疯癫"叙事的方式思考人类当下的生存困境。这里的"疯癫"指的是与正常"规范"的行为与思想相对峙,它们在语言、精神空缺、
一个廉洁高效的政务环境,为社会提供优质有效均等的公共服务和社会管理,能够促进经济和社会的良性运行和发展,提升政府的形象、提振百姓的信心。这里所说的“廉洁高效”,简而言之
报纸
<正>O2O与私域流量是目前最火的两大互联网风口。风口流量能够为实体经济带来巨大的流量和成交额,这一点已经被苏宁小店,小象生鲜等多个行业、多家公司证实。"线上宣传+到店
在全民健身的大背景下,广场舞、排舞、中国风等项目相继推出,节奏体语是2013年中国大学生体育协会健美操艺术体操分会推广的我国本土原创的体育运动项目。该运动的创始人刘甑
有声书:增长迅猛 不同地区特点各异$$2019年12月2日,英国《泰晤士报》以德勤年度技术和媒体趋势预测报告为消息源报道,全球有声书市场2020年将增长25%,达到近40亿英镑(约合36
报纸
我国是个能源大国,而建筑节能又比较落后。目前各国对建筑节能都非常重视,我们国家的建筑节能不能落后。我国的建筑节能改造已经发展了一段时间,在一些地方也进行了实践。为
在城市化发展类型和模式趋于多元的背景下,体育小镇建设在西方发达国家早已积累了大量的实践案例和丰富经验,有一整套完善且成熟的建构体系和发展模式。体育小镇的理论溯源和
【正】供应链风险管理的重要性,已经被管理者充分认识。然而,常见的供应链风险管理手段,如增加库存、增加不同地区存量、维持多个供应商,会同时增加经营成本、降低企业效率。