基于堆栈降噪自编码器和用户标签增强的混合的推荐算法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:hldxiesj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息技术的飞速发展,信息过载问题愈加严重,用户难以在海量的数据中,快速、精确的定位到感兴趣的内容,因此为用户提供个性化信息推荐成为了目前的研究热点。传统的推荐算法仅仅利用评分等结构化数据产生推荐依据,没有利用非结构的用户原创信息(User Generated Content,UGC),如评论、标签、文本描述内容等,在海量数据场景下,无法精确识别用户的兴趣,推荐质量低且数据稀疏时容易过拟合。为了解决以上所述问题,本文提出了基于深度学习算法“堆栈降噪自编码器”改进的推荐算法,从用户的海量自由文本标签中提取特征,并结合协同过滤算法,为广大互联网用户提供更高精准度、更具有个性化的推荐服务。本文的主要工作包括如下4点:(1)引入标签信息传统的协同过滤推荐算法仅仅利用了用户的评分信息,推荐结果难以精匹配用户的兴趣关注点,因而需要引入额外的辅助推荐信息,提高推荐结果的准确性。而用户对物品标注的自由文本标签可以反映出用户对物品的兴趣偏好,本文通过引入标签信息作为辅助推荐依据,增强推荐算法的兴趣匹配度。(2)建立标签特征提取模型由于用户标签是非结构化的自由文本,数量庞大且分布稀疏,针对稀疏分布会导致模型过拟合问题,本文采用标签扩充的方法降低数据稀疏性对算法性能的影响;在海量数据集场景下,标签词组的词典将会非常庞大,使用传统的独热码对标签编码将会导致计算维度爆炸,本文使用词向量压缩算法word2vec对标签进行编码压缩,可以有效的降低推荐算法训练时的计算复杂度;对于文本特征提取,本文使用堆栈降噪自编码器(Stacked Denoising Autoencoders,SDAE)模型,可以从标签数据中提取到有效的兴趣表达特征;(3)动态标签权重传统算法认为标签之间是独立的,没有考虑标签和用户兴趣偏好之间的关系,本文提出基于用户情感表达和评分反馈的动态标签权重,将用户标签分为积极和消极两类,分别进行特征提取,然后使用因子分解机(Factorization Machine,FM)进行特征归一化处理,提高标签特征的兴趣表达能力。(4)改进的协同过滤模型在协同过滤推荐的基础上引入用户标签特征,在生成“用户-兴趣”关注矩阵和“物品-兴趣”质量矩阵时,施加标签特征的约束,同时利用评分反馈,提高推荐算法的兴趣匹配能力和推荐结果的准确性。本文算法在大型开源数据集“MovieLens”上进行了实验验证,结果表明本文算法可以提高推荐算法的准确性和推荐结果覆盖率,在模型复杂度和训练性能上与其他基于深度学习的推荐算法相比无明显差异。
其他文献
随着我国经济的快速发展,居民的生活水平也进一步提高,但社会阶层固化、收入差距扩大等问题逐渐凸显,这引起了人们对代际间社会流动的关注。目前在收入代际流动的研究中,教育
诺如病毒(Norovirus,No V)已成为全球非细菌性肠胃炎的首要病原,摄入被污染的食物或水等是造成病毒感染的常见方式。牡蛎等贝类被报道已成为No V传播的最重要载体之一。近年
为有效解决微细颗粒机械法规模粉体制备中团聚和粉磨极限等问题,采用空化射流冲击耦合磨介碰撞的微细颗粒制备方法。为探究空化冲击作用下的颗粒-磨介液相粉碎机理,以及有效
在啤酒的生产过程中不可避免会产生废啤酒,在当今提倡绿色生产,节约能源的背景下,将废啤酒进行利用,既可以减轻环境的污染,又可以增加啤酒行业的经济效益。本文以废啤酒为原
唇语识别技术是指仅根据说话人唇部运动的视觉信息,从而识别出其所说的文本内容,目前在唇语交互控制、静音信息输入、噪声环境下的说话识别和静音视频的处理识别有着重要应用
明清“得遗失物”律的相关规定最早可追溯到《尚书·费誓》中的相关记载,至迟在汉代出现了关于拾得遗失物“大者公之,小者庶民私之”的规定;唐代关于遗失物法律规定主要集中在“得宿藏物”和“得遗失物”两条;宋代沿袭,并制定相关例文,辅律而行;明律纂为“得遗失物”一条,内容未有明显变化,清律在沿袭明律的基础上增加律小注或律总注,进一步明晰律文的内容。本文共分为四个部分,首先在强调研究意义与研究方法的基础上,梳
在收集资料的前提下,通过野外勘查和室内研究工作,理清了该矿的地层、构造和岩浆岩特征,查明了矿体分布、形态、规模、产状、厚度和矿石质量,利用变差函数对该地区铁矿矿体品
本文针对可燃气体爆炸防控的严峻形势,在容积100L的密闭容器内开展了甲烷/空气混合物的爆炸特性及爆炸抑制研究。基于主动式抑爆技术,以粉体抑制剂作为抑爆介质、气体发生器
能源短缺和环境污染是全球性问题,储能技术对于提高能源利用效率和保护环境具有关键性作用。其中储能方式中的相变储热,可以解决能源供需之间的矛盾、克服可再生能源的间歇性
随着科学的发展与制备工艺的进步,研究人员们根据光学原理设计出了各式各样的传感设备与检测仪器,例如光学计量仪器、激光干涉式、光栅以及光纤式等光学传感器及仪器。光学传