一种结合主题模型的推荐算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:AJGSUN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统协同过滤推荐算法存在的冷启动、数据稀疏以及相似度度量的准确性问题,基于LDA主题模型对文本隐式主题挖掘的有效性和KL散度在主题分布相似性度量的准确性,提出了结合LDA主题模型的矩阵分解推荐算法。首先,利用改进的LDA算法输出项目-主题分布,并用困惑度作为主题数设置的修正函数;然后分别基于余弦相似度和KL散度计算得到项目相似度矩阵,将得到的相似度矩阵结合原评分训练集输出预评分,再将预评分填充到训练集;最后将训练集输入ALS矩阵分解算法得到推荐结果。通过MovieLens数据集的实验结果表明,该算法在不同隐式参数设定下均能得到比ALS推荐算法以及更小的预测误差,并且最优预测误差小于传统推荐算法。该实验说明了通过集成LDA主题模型的ALS算法效果要优于其他推荐算法。
其他文献
前人从信息视角对双及物结构的研究以自然语篇为语料基础,通过对与事和受事的信息或曰语篇-语用因素进行考查,发现该因素极大地制约着二者的语序,因而可以很好地解释并预测双
1993~2004年,瑞金市开展了31条小流域的综合治理,累计治理水土流失面积39 112.9 hm2,投入资金11 726.78万元.在多年的水土保持综合治理中,瑞金市紧紧围绕改善生态环境、服务全
接枝淀粉是以淀粉为骨干,由具备上浆性能的单体接技共聚的产品,是今后纺织经纱上浆的主要浆料.对淀粉预处理、引发剂及单体选择、接枝工艺等关键技术进行了试验研究.依据这些
近年来,结肠定位给药系统(oral colon targeting drug delivery system,OCDDS)因具有毒副作用低、药物生物利用度高等特点,受到药物剂型研究者的广泛关注。其中,以天然高分子
本文从航空复杂装备等一系列产品的特殊性角度出发,考虑制造商选择的影响因素,运用层次分析法,构建复杂装备制造商选择的评价指标体系。本文分析现有条件下航空复杂装备研制
本文首先探讨了群体类型、群体特征这两个变量对群体关联性品牌和自我品牌联结之间关系的影响,然后研究了身份表达与由于对独特性的需求所产生的模仿恐惧之间的冲突。结果表
目的:评价pH敏感双层型苦参结肠靶向微丸的体内外结肠靶向性能。方法:采用桨法对微丸的体外释药性能进行评价,采用多层螺旋CT扫描技术,实时监测微丸在人体消化道内的运转情况