基于主题模型的机构研究状况可视分析

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:w_mz2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,由于信息技术的迅速发展,数据呈现出一种爆炸式增长。对于学术研究领域来说,科研人员的增加导致学术文献也与日俱增。利用和理解这些数据能更好地了解科学本身的结构和动态,这就需要数据分析和可视化的结合。不同的研究机构所涉及的研究领域、方法以及模型有很大的区别,对学术文献进行主题建模和可视分析能反映一个机构在各个研究领域的发展和态势。主题模型成为研究学术文献的主要文本挖掘算法,用来提取文献中隐藏的信息—主题。然后结合可视化方法将主题和其他数据信息通过可视化图元展示并分析,以此来了解和掌握一个机构的科研发展趋势。针对以上需求,本文提出一种基于主题模型的机构研究状况的可视分析方法。帮助用户了解机构当前的研究状况,寻找最有影响力的科研领域,发现学科优势。本文主要做了如下研究工作:1.提出了基于主题模型的机构研究状况分析的研究方法。该方法的主要流程为:首先对收集的SCI学术文献进行数据清洗得到主题建模的语料库;其次利用主题建模算法提取语料库的主题,然后进行文献聚类;最后将文献数据的其他维度信息与提取的主题进行数据融合,从不同角度对机构研究状况进行可视分析并做出预测。2.结合本文所提出的方法设计并实现一个基于主题模型的机构研究状况的可视分析系统。本文系统包括三个部分,分别是整体研究趋势、主题层次结构和学科优势的发现。每个部分的子模块中包含不同信息维度,并且提供相应的交互操作。本文将所有的功能模块集成在一个可视化系统中。本文设计的基于主题模型的机构研究状况的可视分析系统为可视化应用在学术数据的方向上提供了新思路,通过对真实数据集的案例分析评估了本文系统的有效性和可行性。
其他文献
云环境中的虚拟机部署问题作为云计算中资源分配和管理的重要组成部分,一直是学术界的研究重点。虚拟机部署是在满足虚拟机资源需求和约束限制的条件下,根据一定的方法和策略
Volterra积分方程(VIE)是积分方程中的一个热点问题,其研究涉及多个领域。随着积分方程的发展,自卷积Volterra积分方程(AVIE)也吸引了许多学者的研究,由于其精确解很难得到,
随着新一轮高水平对外开放和第四次国际产业转移浪潮的不断推进深入,一方面,我国企业在相关领域与外资企业的全面竞争中处于“劣势地位”,亟需摆脱价值链“低端锁定”困局;另
在互联网技术高速发展的大时代,随着系统的业务量和用户量的不断增多,许多企业级应用在性能和业务扩展上面临着巨大压力,提升企业级应用的性能问题以及在扩展方面的问题是一
马修·帕克是伊丽莎白一世时期第一任坎特伯雷大主教,他不仅经历了亨利八世和爱德华六世时期不成熟的新教改革,还经历了玛丽一世时期激进的天主教复辟。这些经历促使帕克在担任大主教后,采取温和的方案对国教会进行改革。本文以马修·帕克担任伊丽莎白一世时期的坎特伯雷大主教,对英国国教会进行了多方位改革为主线进行论述。首先,以玛丽一世时期到伊丽莎白一世初期,英格兰复杂多变的宗教状况作为时代背景进行介绍。这段时期,
铟属于稀散金属,其很难形成可独立开采的矿床,通常与锌矿、铜矿和锡矿等伴生。铟是一种国家战略储藏金属,由于它有良好的机械性能和物化性能,在众多领域得到广泛应用。近年来
通过转基因技术改良植物遗传性状,培养周期短,收益效果较好,可定向诱导改变植物性状,在农作物、观赏花卉等领域被广泛应用。漆酶可应用于造纸工业、有机合成、食品工业等领域
图像分割是图像处理与图像识别的一个关键步骤,图像处理和计算机视觉领域的核心在于如何精确高效的分割图像。图像分割的目标是把图像划分成各具不同特征且互不重叠的区域,然
高质量GaN和InGaN晶体的外延生长对于实现高性能射频、电力电子和光电器件具有重要意义。基于平片蓝宝石衬底,由卤化物气相外延(HVPE)生长制备的GaN厚膜或衬底存在表面龟裂、
本文主要探讨了银行业结构对创业行为的影响,基于被解释变量“创业”是一个二值变量,所以采取了Probit模型进行实证分析。实证结果分析发现,地方性小银行的市场份额与该地区