基于文档嵌入和引文分析的学科主题分析：内容演化与爆发模式

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：a139471569

【摘要】

：

【作者】

：

张爽

【机构】

：

大连理工大学

【出处】

：

大连理工大学

【发表日期】

：

2019年期

【关键词】

：

学科主题分析

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着知识爆炸性增长和学科体系日益复杂，如何有效地从海量文献中挖掘学科主题以及分析其演化模式成为一个值得深入探究的研究课题。解决这一问题，对理解科学的结构和发展，以及制定科技政策具有重要意义。然而，现有研究多聚焦于“常态科学”的内容演化分析，而对学科主题的爆发式发展模式关注甚少。并且，常见的主题发现与内容演化分析方法往往忽略文献的语义信息且未能结合文本挖掘和引文分析各自的优势。针对上述两方面存在的局限，本文开展了相关研究。
　　在探究学科研究内容的演变方面，本研究提出一种基于文本嵌入的主题演化分析方法。首先，利用Doc2Vec挖掘文献的语义主题特征，依据文献间的语义关联构建网络并使用社区发现算法探测主题结构，这样便实现了在语义层面发现学科主题。在此基础上，借助UMAP绘制领域地图并以关键词词云图进行主题内容标注，从而可视化主题间的结构。同时以密度等高线刻画文献分布的异质性，分析主题内的层级结构。最后，根据相邻阶段的主题间引用关系构建主题演化冲积图，以最大引用强度准确识别演化主路径。所提方法在机器学习领域识别出十二个全局主题以及“岛屿型”、“多山头型”和“星系状”三种主题“地貌”。然后利用冲积图清晰地展示了各个主题的生长、消亡、分裂和融合的演化现象。结合关键词和主路径分析，进一步揭示了近20年来机器学习领域的发展历程。实验结果表明，该方法是现有学科主题分析方法的有益补充。
　　在探究学科主题的爆发模式方面，本研究提出一种无参数的、基于量化引文曲线爆发程度的主题爆发模式识别方法。主题爆发模式刻画的是某些主题在出现数年后才迎来影响力高速攀升的特殊发展情形，这种爆发式主题往往会推动该领域产生重大内在变革。首先，本研究以主题历年的被引频次作为度量指标，并设计了“去泡沫化”方法用以解决引用膨胀问题。接着提出爆发系数，即通过计算主题的实际引用曲线与理想引用曲线的差距来衡量主题爆发特征的大小。然后将引用曲线突变年识别为主题爆发年。实证分析发现，计算机科学领域存在大量的睡美人文献和主题爆发模式，如“Topicmodel”主题和“Mobilecomputing”主题的发展模式呈现较大的爆发特征。通过分析主题在爆发年前后研究内容的变化，并探究主题的被引多样性与其爆发程度的相关性，本研究发现主题爆发的主要因素在于主题自身取得了重大的创新突破或出现了新兴研究方向。
　　本研究一方面提出了一种综合Doc2Vec、UMAP和引文分析的学科主题与演化分析方法，另一方面关注了“睡美人”现象背后的主题爆发模式并提出识别方法，进一步在方法以及实证分析层面加深了对当前学科演化和学科发展模式的探索和理解。

其他文献

大黄素对SAP早期磷脂酶A的拮抗作用及机制研究

背景：重症急性胰腺炎(SAP)病情严重而复杂，并发症较多，预后凶险，病死率高达20﹪-50﹪，甚至达50﹪-90﹪。炎性介质等生物活性因子在AP的发生发展中的作用倍受关注。磷脂酶A(PLA)做为在炎症反应过程中起重要调节作用的酶类，在生物膜的恒稳过程、脂质介质的激活、白细胞-内皮细胞的黏附级联的形成过程中起关键性的中心环节。目前临床应用细胞因子拮抗治疗来阻断炎症反应，大都处于动物实验阶段，尚无理想

学位

大黄素

噁唑烷酮类抗菌药物的设计、合成及构效关系研究

水溶性差是目前开发第二代噁唑烷酮抗菌药物面对的共同难题。我们选取活性较好的Ⅱ-63、Ⅱ-74和Ⅱ-88三个化合物，结合其结构特点，进行了一系列前药化研究。研究结果发现三个化合物的磷酸酯盐在水中的溶解度都提高了1000倍以上.其中Ⅱ-74磷酸酯二钠盐Ⅲ-03经大鼠灌胃和静脉注射给药后，其血浆Ⅱ-74的暴露量分别提高了1.5倍和1.3倍，口服生物利用度由44.8％提高到52.4％。　　综上，Ⅱ-74磷

学位

抗菌药物

航天物资集中采购风险评估与防控措施研究

物资采购管理在现代企业中的作用日趋重要。在建设航天强国进程中，及时、保质保量的物资供应和保障，对于确保型号飞行试验和科研生产任务完成，是必不可少的前提和保障。总结以往经验，不乏因为在供应商准入、合同管理、质量控制、价格管控、大宗采购等关键环节发生问题，给企业和航天事业的发展造成严重影响，教训极其深刻。物资采购过程中往往蕴含较高风险，如何有效管控、降低风险，成为保持航天物资集中采购高效运转的重要研究

学位

航天企业

标准不熟悉对项目绩效的影响：中国承包商应对方法的调节作用

每个国家都有其独特的工程技术标准体系，而承包商在他国承揽工程项目时可能并不熟悉项目所在国标准，这往往会给项目带来很大的风险。目前已有的研究对标准不熟悉风险在风险识别层面进行了大量分析，然而很少有研究系统地总结过应对该风险的方法，更缺少定量模型说明该风险及其应对方法对国际工程项目的影响。因此本研究收集了中国承包商的案例，结合已有研究，从中归纳出三类应对方法，然后提出以应对方法做调节变量的标准熟悉程度

学位

工程项目

基于凸包和最近异类的样本选择算法研究

随着电子商务和互联网技术的发展，数据规模日益庞大，如何在存储空间资源有限的情况下，快速、准确地分析处理数据，是目前众多大数据应用领域亟需解决的问题之一。样本选择算法通过删除数据集中的冗余样本、离群样本和噪声样本等，保留对分类器的分类过程有贡献的典型样本，在不影响数据分析性能的基础上，降低了计算资源和所需时间，成为大数据背景下进行数据预处理的重要手段之一。　　本文针对传统样本选择算法无法有效选择凹面

学位

样本选择算法

公交系统时间表与车辆排班调度集成优化研究

随着社会经济的发展，城市化推进不断加快。交通是城市各部分互相联系的重要渠道，决定着居民出行的便利度。随着车辆数目的不断增加，城市道路的拥堵情况日益严重，公共交通对改善这一情况有着显著作用。公交车仍是所有公共通出行方式中普及度最高的方式，在各级城市中都有公交车为市民服务。随着城市的不断扩大，对公交车的载客量及公交车的服务水平有着更高的要求，对公交车的优化就显得更为重要。　　为了使公交车更好地满足城市

学位

公交系统

平台内容保护策略建模与分析

随着互联网时代下信息技术的高速发展，双边平台为用户带来了更多的机会，双边平台也成为了商业交易中的重要市场。但是由于信息技术的发展，平台的内容更加容易复制，盗版成为了信息服务行业中的一个十分严重问题。盗版为平台的参与者带来了巨额的损失，这使得平台重视并开始实施平台保护。因此双边平台的保护策略与定价策略研究具有十分重大的理论意义与现实意义。本文分别研究了考虑到内容可代替性和消费者公平关注下的双边平台的

学位

商业交易

公众有效参与对政府治理农村人居环境的影响研究

随着国家乡村振兴战略的提出，改善农村人居环境的重要性和紧迫性逐渐显现，而农村人居环境的改善离不开治理主体的有效参与和积极作用。近年来，农村人居环境的治理问题引起了众多学者的关注。在已有研究中，学者大多对公众参与环境治理以及政府治理环境问题进行了研究，而将公众参与、政府治理与农村人居环境结合起来研究的相对较少。因此，本文探讨了公众有效参与、政府环境职能、农村人居环境治理效果之间的作用关系，以寻求农村

学位

政府治理

政府和社会资本间信任对PPP项目绩效的影响——合作行为的中介作用

PPP强调政府和社会资本间长期、稳定的合作，越来越多的学者强调在PPP项目中建立和维持信任的重要性。然而，通过调查300多个社会资本组织，大部分PPP/PFI项目关系是消极的，缺少信任和信心。信任缺失可能导致参与方之间的合作只是一种“表象”，不利于提高项目绩效。虽然许多学者意识到信任与项目绩效之间可能存在一种函数关系，但实证研究常常存在不一致的结论。针对实证研究分歧，信任可能是提高项目绩效的一个必

学位

ppp项目

库存绩效对产品质量的影响——一个有调节的中介作用模型

随着中国加入国际贸易，成为全球价值链上的成员之一，企业产品质量成为企业在其全球供应链上长久生存和获得话语权的关键因素之一。然而企业产品质量如何提升，一直以来都是运营管理领域所考虑的问题，同时该领域的实证研究对于企业所处外部环境关注较少。因此本文选择研究财务绩效对于库存绩效与产品质量关系的中介作用和全球价值链嵌入对于其三者关系的调节作用，主要试图回答三个问题：第一，库存绩效的提升是否可以促进产品质量

学位

企业产品质量

基于文档嵌入和引文分析的学科主题分析：内容演化与爆发模式

与本文相关的学术论文