基于主题模型的科技监测研究与实现

被引量 : 0次 | 上传用户:wjz_512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在知识经济、大数据时代,随着科学技术的蓬勃发展和科研成果的大量涌现,如何从海量的科技文献环境中提供有效的科技监测服务,从而为科研管理部门、学术科研人员提供有效的科技知识支持,已经受到了广大学者的高度关注与重视。一方面,科技文献“量”呈指数级增长,成为一座巨大的知识宝库;另一方面,面对海量、快速增长的科学文献数据,从文献数据库中快速有效地提取知识信息的需求变得非常迫切。如何在海量信息环境下进行有效抓住科技发展的脉络,并及时地把握研究热点是科技文献领域面向科技监测研究的核心和关键问题。目前,在面向科技监测的研究中,采用的研究对象主要是科技期刊和专利文献,所应用的方法主要是文献计量和社会网络分析。为了使科技监测研究的数据来源更加多样化,研究方法更加完善、研究结论更有说服力,需要应用各种科技文献载体,并不断突破现有的研究方法。因此,本文在对现有研究进行系统地调查与综合分析基础上,提出有效的、基于科技文献三大载体形态的基于LDA主题模型的科技监测方法。通过挖掘科技文献中蕴含的科技知识,以期实现揭示科学研究主题的演进过程与脉络目的,把握科技发展动态,提升其科技创新价值。首先,本文以科技文献中“主题”的建模为切入点,以科技报告载体形态为例进行主题分析,构建“文档—特征词—主题”三层拓扑结构的内容主题模型;其次,重点研究如何实现对海量科技文献的动态“主题”自动发现及其在时间序列上的“演化”脉络的科技监测内容,具体包括主题挖掘、主题强度衡量、主题数量的确定和主题演化方式等四个问题;再次,设计并构建了基于开源平台JGibbLDA的科技监测原型系统。最后在相关主题模型研究的基础上,将相似度运算作为面向科技监测的主题模型方法应用的突破口,提出了科技报告相似度计算模型和基于用户兴趣的推荐模型,完善了面向科技监测的衍生应用研究。
其他文献
目的:探讨Discover人工颈椎间盘置换术治疗颈椎病的临床疗效、置换节段活动度的保留情况及曲度的维持情况、颈椎总体活动度(range ofmotion, ROM)的维持情况及对术后颈部轴性症
纵观我国高校在校园文化的实践及其探索,改革开放三十年来,各个高校都比较重视校园文化建设,大学校园文化作为社会文化的敏感点,其建设从内容到形式,从方法到手段不断探索与
冠心病(coronary heart disease, CHD)严重威胁人类的健康和生命,具有较高的致残率和致死率。动脉粥样硬化((Atherosclerosis, AS)是冠心病和其他心脑血管疾病的病理病变基础
背景与目的:左心发育不良综合征(HLHS)是以左心室发育不良或缺如及升主动脉严重发育不良为主要表现的先天性心脏畸形。HLHS在1岁以内先天性心脏病诊断中约占7-9%,如果不尽快手
<正>中国科学院上海植物生理生态研究所王成树团队完成的研究成果,认为冬虫夏草不可能含抗癌成分虫草素和喷司他丁。据媒体报道,北京十多家药店部分工作人员仍宣称冬虫夏草有
期刊
本文提出地声信号时域分析的方法——过零点率分析。这个方法可以分析环境地声信号的时变结构。文中给出了理论描述和初步实验结果。
目的:探讨ERK在大鼠后足切割后脊髓的表达情况及帕瑞考昔的作用机制。方法:以大鼠右后足切割作为急性疼痛模型;用免疫组织化学法测试脊髓磷酸化ERK (pERK)表达情况。U0126(1μg)
目的:应用超声组织多普勒成像(TDI)技术对正常人和二尖瓣狭窄(MS)患者行二尖瓣置换(MVR)术前后的左室长轴功能指标进行检测,了解术前左室功能受损情况及术后左室功能恢复情况;探讨MS患
本文利用一些软件开发的基本理论与方法,开发满足适合江西信息应用职业技术学院实际需要的系统。遵循开发系统所使用的合理模式,利用ASP. NET强大的后台开发功能,并通过SQL S
目的:了解卵巢早衰患者的生活质量状况,探讨中医证型与生活质量的相关性,为中医药治疗卵巢早衰及开展临床疗效评价、健康教育提供新的思路和方法。方法:通过门诊收集POF的患者,