基于异构实体学术网络的个性化文献推荐模型研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:lovechenhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日益增长的学术数据为众多学者提供了有利帮助,学者们在已有研究工作的基础上不断改进创新,推动了科学研究的进步。然而另一方面,在海量的文献中快速且准确的找到适合自己研究方向的科研文献对学者来说也是一件非常困难的事情。近年来借助学术数据进行文献个性化推荐研究逐渐引起学者们的关注,然而现有的文献个性化推荐工作主要基于文献内容的相似性,而忽略了学者本人的研究领域、研究机构等重要信息,导致推荐结果个性化不足且准确率偏低。为了解决这个问题,本文融合了文献、学者、研究领域、研究机构和发表地五类学术实体,构建了异构实体学术网络(He AN),并提出了一种基于异构实体学术网络的个性化文献推荐模型(PR-He AN)。本文的主要工作内容包括以下几个方面:(1)通过微软学术搜索API和AMiner学术平台获取数据,搭建Hadoop和Spark分布式大数据处理集群,对原始数据进行预处理,构建实验所需数据集。以学者搜索的文献为核心,构建动态K阶文献共引网络(DKnn-LCN)。利用NLP技术对搜索文献进行个性化意图识别,重新定义网络中边权重值的更新公式,基于DKnn-LCN计算搜索文献与网络中其他文献的余弦相似度并进行排序,排序后的结果视为整个推荐任务的初步召回层为后续的研究工作提供支撑。(2)基于DKnn-LCN构建He AN,提出PR-He AN模型。模型融合了He AN中多维实体属性构建DKnn-LCN的异构信息特征矩阵,并将其输入图卷积神经网络进行训练,最后将推荐文献的概率与基于DKnn-LCN的文献相似度加权求和得到最终的推荐分值,依据推荐分值进行排序生成Top-K个性化文献推荐列表。本文共抽取了21000名学者数据和120450条文献数据,其中14700名学者搜索的83627条文献数据作为实验训练集,6300名学者搜索的36823条文献数据作为测试集。分别从不同实体属性的推荐效果和不同推荐模型的推荐效果两个维度进行实验对比,最终得到结论:当学术实体属性越多的时候,模型的效果越好;在同一数据集下,PR-He AN模型的推荐结果在召回率、准确率和F1值上均优于对比的其他算法。
其他文献
《人民音乐》创刊于1950年,是我国最早以“评论性”为定位且具有权威性质的音乐核心期刊,“包容性”的办刊宗旨为音乐学术界提供了一个健康、多元的批评空间。20世纪90年代,流行音乐创作迎来第二个高峰期,以《人民音乐》为代表的音乐学术期刊陆续发表了若干流行音乐批评文章,尚处于萌芽期的流行音乐批评,对维护流行音乐创作的健康有序发展起到了至关重要的作用。本文以《人民音乐》1990-1999年发表的流行音乐
学位
随着新能源汽车保有量的不断增加,与之配套的充电设施也得到了快速发展。随之而来的建设、安全、监管、结算、维护等方面的问题日益凸显,文章对新能源汽车充电设施现状进行了分析,总结了一些问题,并提出了相关建议。
期刊
由于市场经济的发展以及民众生活水平的提升,导致了道路交通需求量的快速增加,在城市道路和高速路上产生了严重的交通拥堵问题,从而引发了环境污染和道路交通安全问题。为了缓解交通拥堵,提高道路资源的利用率,需要对交通拥堵的成因进行分析,探究引起交通状态变化的规律,找到控制交通拥堵的方法。利用分支理论对交通流状态突变的情况进行分析研究,对于发现交通流状态变化的机理及缓解交通拥堵有着重要意义。本文从分支理论的
学位
大学生的校园在线行为分析对于其过程管理至关重要。鉴于大学生的校园行为具有个性化、多元化等特点,采用传统的方法对其进行跟踪监测极具挑战。本文基于大学生的校园网访问日志、Wi-Fi接入点日志以及校园一卡通记录等在线数据,探讨一种学生校园在线行为的特征表征模型以及基于此模型的行为分析方法,以促进学生的个性化和过程化管理。主要研究工作包括如下三个方面:(1)基于心理学注意力的学生校园在线行为分析方法。将学
学位
马斯内与普契尼是19世纪两位杰出的歌剧作曲家,他们都曾对法国作家普莱沃的小说原著《骑士德·格里厄和曼侬·莱斯科的故事》产生极大的兴趣,加以改编并创作成歌剧作品登上舞台。本文以歌剧《曼侬》与《曼侬·莱斯科》为研究对象,对其进行比较研究,了解两位作曲家不同的戏剧意图。笔者将综合运用音乐本体分析、诠释学、性别研究等多种研究方法,分别从创作背景、歌剧脚本比较、音乐本体分析与比较、歌剧艺术特点与内涵等不同角
学位
随着各种网络社交平台的飞速发展和不断进步,互联网中文本信息的种类和数量也呈爆炸性增长,这为人们对有效信息的利用带来了巨大挑战。自动文本摘要技术作为自然语言处理的一项重要任务已经得到了广泛研究,在这当中,生成式文本摘要技术逐渐成为主流技术。然而,现有的文本摘要研究大都集中在新闻报道类的文档,对话作为人们生活中最常见的一种交流方式,具有话题漂移、冗长、信息密度低等特点,人们对此类文本摘要生成任务的研究
学位
目的 探讨运动疗法对妊娠糖尿病血糖的作用。方法 选取2021年1—9月中国科学院大学深圳医院产科收治的70例妊娠糖尿病患者为研究对象,依据随机数表法分为对照组和观察组,各35例。对照组采取常规模式护理,观察组采取常规护理+运动疗法。对比两组血糖水平、不良妊娠结局、心理状况评分。结果 护理后,观察组空腹血糖和餐后2 h血糖水平均优于对照组,差异有统计学意义(P<0.05)。两组产后出血和新生儿窒息发
期刊
本文从社交媒体中采集并处理了2012–2018年海南所有4A及5A级景区的评论数据构建了海南旅游景区评价数据集。本数据集旨在用于对海南旅游景区的质量评估、景区的容量管理、景区传播效果评价、景区网络舆情监测预警、景区网络口碑管理、景区形象管理、景区个性化推荐等研究。同时,结合多源化数据,本数据集可为研究海南省旅游发展提供数据支持。
期刊
本杰明·布里顿(Benjamin Britten,1913-1976)是二十世纪杰出的英国作曲家、指挥家和钢琴家。他的作品数量和体裁繁多,包括歌剧、合唱、交响曲和室内乐等,其中歌剧作品就多达16部。《比利·巴德》创作于1951年,这部歌剧改编自美国作家赫尔曼·梅尔维尔(Herman Melville 1819~1891)的短篇小说《水手比利·巴德》,是布里顿创作的第五部歌剧,也是继《彼得·格莱姆斯
学位
云计算的快速发展为用户提供了强大而便捷的数据存储和共享服务。然而,对云中海量数据在机密性和隐私性等安全方面的要求却制约了云计算相关应用的发展,特别是对于金融和医疗领域敏感数据的泄露和滥用无疑会给用户带来巨大的经济损失。为了保护用户数据安全,数据需要被加密后存放在云端,但这又使云服务器检索密文数据变得困难。具有等值测试功能的加密技术可以满足用户检索密文数据的需求,该技术可以在密文不预先解密的前提下判
学位