基于LDA的国内数字图书馆研究主题发现与演化

来源 :南昌大学 | 被引量 : 0次 | 上传用户:eyx001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于科学技术的快速发展、文献出版周期的大大缩短,文献成果目前呈现数量庞大、主题多样的特点,在这样情况下,如何快速获取当前领域的研究热点、把握研究趋势是摆在科研工作者及科研部门面前亟待解决的问题,也是数字图书馆需要解决的难题。数字图书馆作为知识经济实现的基础设施,是国民经济运行不可缺少的必要条件;同时作为社会的公共信息存储中心、信息中转站,数字图书馆为社会公众提供综合的信息服务,发挥着素质教育、文化保护与传播的作用。数字图书馆自上世纪90年代提出并付诸实施以来,经历了近20年的理论研究及其实践发展,现已进入相对成熟的阶段,对其学术成果进行主题分析,将有助于发现学术发展脉络、学术热点及学术发展趋势,有利于学者寻找新的研究切入点,也有助于延续和提升数字图书馆生命力与活力。LDA(Latent Dirichlet Allocation)作为一种经典有效的概率生成模型,包含文本-主题-词项三层贝叶斯结构,能挖掘出文本中的潜在语义信息,已在文本分类、信息检索、情感分析、话题挖掘等领域广泛应用,在科技文献主题发现与演化研究中的作用也日益凸显。同时,科技文献中的题目、摘要、关键词是一篇文献的重要组成部分,通常代表了作者对文章内容要点的浓缩和总结,在进行文献主题分析时能发挥巨大作用。遗憾的是,现有数字图书馆相关主题研究未能重视和利用这些元素。本文利用LDA模型对2007-2016近十年的国内数字图书馆研究论文进行内容挖掘,分析其主题结构,揭示热点主题及主题演化过程,最后结合实际背景对演化结果进行讨论,以期为数字图书馆的相关研究及工作开展提供参考与支持,进而促进数字图书馆的健康发展。具体内容如下:(1)总结现有的主题识别演化分析方法,从基本原理、研究现状、优缺点等方面对这些方法进行详细分析。对利用LDA进行建模的完整过程进行研究(其中包括:Gibbs参数估计方法、最优主题数确定方法、基于信息熵的主题过滤技术、热点主题选取方法、后离散主题演化方式以及主题演化度量方法等)。将其中关键问题进行提炼研究,在此基础上提出了一种基于主题强度聚类的主题趋势的识别分析方法。(2)选取国内数字图书馆2007-2016十年的期刊论文,引入时间因素,运用LDA对其进行主题演化分析,识别出数字图书馆研究的主题结构(用户研究、建设对策、评价研究、信息服务、教育与培训、知识管理、资源组织、资源共享、版权研究、移动图书馆、资源存储与安全、领域研究述评、应用技术研究、云计算下的数字图书馆),可以作为数字图书馆研究人员以及数字图书馆管理人员、建设人员的决策实施参考方案。(3)利用上述同样数据,通过热门主题选取方法发现,信息服务、发展对策是研究者们稳定且高度关注的研究主题,资源组织与建设、应用技术、版权问题是数字图书馆领域的稳定研究主题;引入时间因素,使用后离散主题演化方式进行主题演化分析,绘制出14个主题10年来的强度演化趋势曲线,利用基于强度聚类的主题趋势分析方法将14个主题演化趋势分为上升型、下降型、平稳型、曲折型,判断用户研究、移动图书馆是数字图书馆的新兴研究主题,其主题热度将在未来攀升。
其他文献
近年来,聚合物/二氧化硅纳米复合乳液越来越受到人们的关注,这不仅是由于聚合物/二氧化硅复合乳液兼有有机材料和无机材料的优点,即具有有机相的易加工性、柔韧性以及无机材
在信息化社会环境背景下,随着网络通信技术、计算机技术和数字化技术的发展,改善了用户获取信息的方式和途径,提高了人们工作学习的效率,越来越多的用户通过Web获取信息。摆
球形硅微粉是航空、航天、电子信息等高端产业的重要材料,同时也在新型涂料、特种陶瓷,高档化妆品等领域有着广泛的应用,具有很高的实用价值。本文旨在通过乳液法制备粒径可
<正>韭菜子,为韭菜的干燥种子。于秋季果实成熟时采收,晒干后除去杂质即可。作为传统的壮阳固精药,韭菜子历来受到医家的重视。《名医别录》说,韭菜子"主梦泄精,溺白";《日华
本文基于中国营养和健康调查的数据采用离散选择方法检验了新型农村合作医疗制度对参合农民健康改善的影响。结果表明,新农合减少了农民过去四周患病率、疾病严重程度以及慢性
广州万亩果园湿地是罕见的城中次生湿地和农耕湿地,在该区域建设湿地公园将有助于加强对湿地资源的保护和合理利用,提升周边环境质量,开发旅游资源。结合该地域的条件和发展历史
在经济全球化与知识经济到来的今天,越来越多的企业意识到并购对企业发展的重要性,纷纷加入到并购的队伍中来。一个全球范围内的并购时代正在向我们走来。但通过对许多并购案
21世纪是一个科学技术高速发展的信息社会。文献资源是信息社会经济发展的重要资源和支撑。知识经济的发展导致对我国创新的需求,而高校的知识创新离不开信息的支撑。加强高校
学习的迁移是指在一种情境中获得的知识、技能或形成的态度对另一种情境中知识、技能的获得或态度形成的影响.迁移能力是学习能力的重要方面.按照过去形成的知识、技能、态度
随着中国经济体制改革的深入,中央政府考虑到各地自然、经济与社会发展的不平衡,经济和社会领域的决策权越来越下放给地方;财税制改革使地方享有较大的财政开支自主性,地方政