基于领域知识图谱实体消歧的协同过滤推荐算法研究

来源 :天津师范大学 | 被引量 : 2次 | 上传用户:show800811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今互联网飞速发展,人们生活中充斥着越来越多的选择,因此各大网站的推荐功能应运而生。当朋友推荐一部书籍,访问图书网站查找,目标书籍出现在返回表单中,同时网页会列出一些你可能喜欢的书籍,这就是推荐系统的应用。对于传统的协同过滤推荐算法,只凭借原有参与者的过去意见和行为来进行预测。本文结合知识图谱技术构建图书领域知识库,针对实体语义进行消歧处理,对实体消歧处理后所得到的实体进行语义相似度计算,再将语义相似的邻域与传统协同过滤推荐算法的推荐邻域按照不同比例进行融合,从而将有关中文实体的消歧语义信息融合到传统协同过滤推荐算法。目的是改善传统协同过滤算法未加入实体语义信息的弊端,理论及实验证明本文所改进的算法能有效改善协同过滤算法在推荐过程中的效果,尽可能改善推荐过程中所存在冷启动问题。本文提出基于领域知识图谱实体消歧的协同过滤推荐算法,构建领域知识库并通过网络爬虫技术所获取的图书文本信息构建知识图谱模型。通过基于图谱的随机游走算法对该领域内的实体进行语义相似性计算,将未消歧处理的实体所在的文本关键词与知识库里的实体备选关键词,通过建立模型进行语义相似度的交叉计算,将计算值最大的备选实体选定成所选目标,以实现实体消歧的操作处理。最后针对实体消歧处理后的中文语义数据进行语义相似性矩阵构建并寻找语义邻域,最终将语义邻域与推荐算法计算的邻域按照相应实验比例进行融合,通过调整语义邻域和传统协同过滤算法推荐邻域的融合比例以及领域知识图谱融合维度进行训练,最终实现实体的语义层面融合到推荐领域中。本文采用维基百科数据库中图书类别下的实体信息构建知识库,采用知识库中实体与通过网络爬虫技术所获取的图书文本信息,测试集是图书网站上爬取推荐读的好书列表,通过Word2Vec工具构建知识图谱和词向量模型。实验评估结果将召回率和准确率以及F值作为实验效果参考依据值,通过实验证明,该算法可以在一定程度上提高传统协同过滤推荐的有效性。
其他文献
<正> "2007年全国电视观众抽样调查"是中央电视台委托国家统计局进行的第五次(每隔五年一次)全国电视观众抽样调查。开展全国电视观众抽样调查是为了及时了解全国电视事业发
光电开关原理与应用第一讲光电开关概要(上)上海市020-047信箱中沪电子技术研究所(200020)梅豪,梅杰光电开关是以光辐射驱动的电子开关,当一定强度的光辐射投射到其中的光敏器件上时,它便会产生开
<正>联墨,即对联和书法。这两种艺术形式在泱泱大千世界中,是唯我中华民族独有的传统文化。作为书法,又是对联的唯一、最佳载体,即表现形式。对联文字稿创作完成之后,需要以
期刊
XW──1型油脂酸价快速测定仪通过省级技术鉴定四川省粮食局科技处杨胜华XW—1型油脂酸价快速测定仪是由成都曙光电子化学高新技术研究所和四川省粮食局科技处应用库仑滴定原理联合
根据增强现实在视频对象跟踪中的应用需求,提出一种综合利用尺度不变特征变换(SIFT)算子、K聚类算法和轮廓检测的视频对象跟踪算法。该算法利用简易SIFT获得输入图像的特征点,通
青藏±400 kV直流联网工程OPGW光缆线路是中国第1条高海拔、超低温地区长距离架空通信线路。根据青藏工程的技术和应用难点,必须研制具有超低光衰减、超低温度附加衰减性能的
【正】 做学问搞学术不是件容易的事。首先,得甘于寂寞,阅读大量的书籍来充实自己。其次,得费大量的脑筋,去研究前人的成果、分析手头的资料,从中拎出自己的观点。第三,要有
他在周恩来总理身边工作整整15个春秋,日日夜夜照料着总理的生活;他陪伴总理夫妇走完了生命最后的岁月,并亲手撒下周恩来和邓颖超的骨灰……
提出一种用于语音信号处理的基于matlab/FDATool的的FIR滤波器设计方法.该方法首先通过Matlab产生两个高频的正弦波噪声,加入到语音信号中;然后,根据信号与噪声的频谱特点,选
用模型研究方法对两几何相似的封闭空间内自然对流换热进行了对比实验。两者的Gr数和边界条件都尽量保持一样,结果获得了良好的一致性。实验还证明即使在高Gr数范围内(Gr≥10