基于分解机i-FM的书籍资源推荐算法

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wodeblog1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与信息技术的发展,人类步入了大数据时代,出现了信息过载现象,出现的海量信息急需以主动形式及时准确地推荐给潜在对其感兴趣的用户。而推荐系统难以避免的存在数据稀疏性问题,2010年问世的因子分解机相较其他机器学习模型对数据稀疏性具有更好的适应性。但是对于推荐领域中另一难题,即冷启动问题,因子分解机模型仍有待改进。本文提出了交互式分解机模型,它将一个交互项整合进因子分解机,使其具备训练冷启动环境下的稀疏性数据集的能力。交互项被设计成为一种计算书籍文本相似度的函数,有别于协同过滤原理需要积累一定数量规模的用户与信息特征间接计算相似度,交互项能够以提取文本关键词的方式直接计算两个及以上文档的相似性,并将结果返回进分解机中。设计了一种交互强度控制机制,通过定义交互强度因子,控制交互项介入分解机的程度。交互强度因子能够根据冷启动环境的强弱适时减小交互项的介入的程度,甚至是关闭交互项。实验证明交互式分解机i-FM较常用的机器学习模型SVM对稀疏性数据集学习更加有效,即使在冷启动环境中,也能有相对较高的预测精度。本文主要创新如下:(1)提出了交互式分解机的机器学习模型,通过整合交互项于因子分解机中,使其不仅能适应书籍推荐中稀疏性数据集的训练,并且能适应冷启动环境下的训练任务。(2)设计了一种全新的记忆衰减型交互强度因子,它是一个关于新增特征数量的递减函数,通过检测新出现的特征数量来控制交互项适时启用与停止,在冷启动环境下部分或者完全代替分解机中的交叉项来训练新增数据特征,并且适时控制交互项介入分解机的程度。(3)从理论与实验双重角度分析了交互式分解机模型在随机梯度下降法与交替最小二乘法这两项学习算法下的运行性能,证明了交替最小二乘法对i-FM的训练效果相对较佳。模型与算法中相关理论推导过程连续完整,引理与定理均予以数学证明。
其他文献
创新是经济发展和社会进步的核心动力,长期以来人们对于儒家文化如何影响创新存在争议,部分学者认为儒家文化包含不利于创新的因素会阻碍创新,然而随着儒家文化影响的地区经
经济适用住房政策当是我国现阶段解决住房问题的主要途径,但就其政策框架的内容而言,尚有许多具体政策条款需加以填充,此间的一些看法和建议,对于政府决策部门来说,当是雪中送炭。
中职阶段的学生在进行英语知识学习的时候,基础普遍比较弱,再加上学生大多更加注重专业课程的学习,导致学生不重视对于英语知识的学习,甚至一部分学生缺乏对于英语知识学习的
新课程改革的深入推进和发展,对初中数学的教学要求提出了愈来愈高的目标,要求初中数学教师不仅要能够培养初中生形成良好的逻辑思维能力、自主探究学习能力、动手能力以及观
湖南省人民医院位于湖南省长沙市湘江之畔,始建于1912年,是一所以医疗为主,集教学、科研、预防保健和社区服务于一体的综合性三级甲等医院。医院自1990年起就开始进行整体的改扩
广州市城建开发集团虽然因故没赶上参加建设部等部门联合举办的“放心房”承诺活动 ,但是他们根据“放心房”承诺活动的精神结合企业实际 ,推出了富有广州特色的“三项承诺”
场景化是未来金融发展的重要趋势。2015年以来,传统金融业务与大数据、云计算、移动互联网等元素叠加后,金融互联网化加快推进,金融业务越来越密切地嵌入人们日常生活之中,场
1.从卖方市场转变为买方市场,90年代房地产市场发生根本变化90年代与80年代相比,广州市房地产市场供求关系对比发生了根本性的变化。80年代房地产业刚刚复兴,商品房供应量极为有限,面对如饥
在高中英语教学中,教师在进行高中英语教学评价时,要过程性评价和终结性评价二者合一。