知识网络演化的关联关系层次特征研究

来源 :信息化建设 | 被引量 : 0次 | 上传用户:linsc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  探究学科领域知识网络当中知识主题及其演变过程,有助于快速掌握领域知识网络研究现状及其变迁行为。
  21世纪以来,随着科技技术的进步,各种科技文献数量与日俱增。对于科研工作者们而言,从早先对相关研究领域文献获取的困难转变为当前文献资源选取的困难。如何有效地在海量科技文献当中,识别出科学研究主题以及其变化行为成为研究重点。近年来,学术界对于领域知识网络的探测开始注重从知识之间的结构关系出发。如在图书情报界,学者们在知识网络当中基于宏观结构发现了“小世界”网络以及“无標度”网络的特征,基于微观结构则发现了网络当中的“模体”特征。而知识群落则是介于宏观与微观结构之间的网络结构特征。知识群落基于时间序列的演化变迁,为揭示领域知识网络科研主题的演化过程、规律以及对于新兴主题的探测具有至关重要的意义。
  本研究以复杂网络分析方法融入关键词网络,基于关键词之间的结构关系进行关键词网络层次提取,结合时间序列因素,在层次提取的基础上,采取兼顾节点以及节点之间的关联频次改变的Louvain(鲁汶)算法对知识群里演化进行分析研究。
  研究数据与流程
  在图书情报领域,对于某一领域的研究主题识别和发现,传统的计量学方法存在着种种缺陷,而且研究发现,即便通过知识群落算法将网络分成了不同的知识群落,但是在知识网络演化生长过程中充斥着大量频次为1的关系结构,网络当中许多知识之间的联系存在偶然性或随机性。知识关联频次的强弱不同,代表知识群落当中紧密的知识团体的区分。为了排除这种随机性,需要基于关联频次进行层次提取,将不生长的知识体系剔除,使网络当中更加紧密、显著的知识结构凸显出来,从而了解网络中成长的核心知识体系。
  本文以中国知网的数据库为数据获取来源,以主题词“Folksonomy”或“社会化标注”或“社会标注”或“大众分类”为检索公式进行高级检索。期刊级别锁定为CSSCI,检索时间跨度从2002—2018年,累计获取相关文献194篇,关键词数量369个,关键词关联关系对数1019对。具体数据如表1所示。
  文中构建的关键词知识网络,节点代表关键词,不同的关键词出现在同一篇文献当中,所形成关联关系构成网络当中的边;以关键词之间的关联频次作为权重,所构建的关键词知识网络为无向加权网络。随着时间序列的推移,网络当中比较活跃的关键词知识节点将与其他活跃的关键词知识节点建立关联关系,从而形成关键词网络当中更加密集、显著的知识群体。
  四项研究结论
  通过基于复杂网络的理论方法融合时间序列因素,对中国知网中的特定领域的相关文献以及文献当中的关键词、关键词关联关系进行抓取,分别对原网络、层次网络展开分析,以及通过层次知识网络与原网络的对比,初步可以得出以下结论:
  第一,采取关联频次提取使得原始关键词知识网络一些规模较小的动态知识群落得以突出呈现。原网络当中2018年时间窗口下,知识群落KC2—5最大仅有5个节点。在经过频次提取后仍然保留两个节点“网络信息检索工具”“因特网大众分类法”,并且形成唯一的知识群。提取包含该关键词的两篇相关文献发现,文献《因特网大众分类法的本质属性》被引频次达到25次,另一篇《因特网大众分类法若干问题的探讨》则达到7次。这也间接说明,即便是小规模的知识群里也同样有较大的学术价值。采取关联频次提取,则使得这些动态生长的小规模的知识群落当中的核心知识得以凸显。
  第二,经过层次提取后的知识网络所形成的知识群落更加规则。在原关键词知识网络当中,度值较大的关键词知识节点经常出现在规模小的知识群落当中,高Hub(多端口转发器)节点往往没有良好的成团优势,这不利于对网络当中的Hub知识群里进行追踪。而在经过层次提取的关键词网络所形成的知识群演化过程中,规模越大的知识群里其当中拥有的Hub节点的度值更大。知识群落更加有序化,这有助于捕捉Hub节点以及知识群落的演化路径。
  第三,经过层次提取后的知识网络仍然保留了原网络当中的重要属性,并没有破坏原有知识网络的演化变迁特征。在原网络当中,2013年时间窗口下知识群里发生裂变行为,这一特征在经过层次提取后关键词知识网络所形成的知识群落演化过程中仍然保留。另外,经过层次提取后,剩下的知识节点覆盖了原网络中几乎所有动态生长的知识群,这一现象在网络中后期越发突出,并且包含了原网络当中大部分高度的节点。原关键词知识网络当中显著知识节点,以及动态生长知识群落等重要的属性特征都得以保留。
  第四,经过关联频次提取后的知识节点更加紧密。以关联频次为层次提取标准,保证了每一个节点都具有生长性,同时保全高Hub节点与低度值节点的可能紧密结构关系。对比核心知识体系的组成,依托知识间共同生长的紧密关系,而非完全来源于Hub节点构成,使得一些潜力或者重要的知识节点得以保留。同时也反映了真实知识网络核心知识团体的重要特征,并非度值越高的知识节点关联关系就越紧密。
  采取层次提取后的知识网络,极大地简化了原有的网络规模,凸显了原网络当中所有生长型知识群里和显著性知识节点。这些将有助于在当前海量的文献资源当中,快速精准定位某一领域中所有热门,以及具有潜力的知识群里以及当中的核心知识。但同时这种方法也存在局限性,需要下一步的研究当中,采取动态阈值的提取方来保障提升基于知识之间关系结构层次的有效性。
  (作者单位:宁波大学科学技术学院)
其他文献
到2020年普及网络学习空间应用,网络空间人人通在学校教学管理中应用成为必然。2016年,教育部发布《教育信息化'十三五'规划》,其中要求:到2020年普及网络学习空间应
领复资产管理有限责任公司 祝毛尉  现任领复资产合伙人。拥有华东师范大学金融学学士,美国布兰戴斯大学世界经济与金融学硕士学位。10年金融投资经验,历任迈仑凯资本合伙人、上海博卡执行董事等,是拥有实业创业经历的投资银行专家、并购专家。近年来,专注于欧洲、非洲的跨境投资和并购机会,主要交易包括冀东水泥、南非水泥、比利时HIS公司中国投资、卢旺达国家水泥公司出售、恒缘新材收购上海奉利等项目。  浦软孵化
六六脑:做点“头等”大事  六六脑(智精灵科技)由来自哈佛大学、麻省总医院、欧洲脑科学研究所、美国纽约长老会医院、北京宣武医院等科研及临床机构的脑科学博士们创建,是国际上专注于前沿脑科学成果的创意应用先驱公司之一,也是国家引进的海外高层次人才创业企业。  六六脑包揽式参与了多项国家级课题,其中包括1项863课题、8项“十三五”课题、30多项国家级脑科学基金课题;还参与了10多项国家、行业标准/共识
8月23日,“直通乌镇”全球互联网大赛·深圳站在深圳市南山区软件产业基地顺利举行,并迎来了国内选拔赛收官之战。  深圳站大赛经过一个多月的筹备,征集了上百个大数据、人工智能、物联网、智能制造、移动互联网等领域项目,其中近30个项目融资轮次已在A轮及以后,且不少项目投资金额破亿,整体呈现出涉猎领域广、项目质量高的特點。通过国内顶级投资机构、投资专家、产业专家的层层筛选,最终精选了17个优质项目进行路
杭州市经信局作为涉企管理和服务部门,阶段性出台的产业政策和行业政策较多,企业关注度也比较高。通过持续多年的大规模走访企业活动,已经建立了服务专员服务企业长效机制,市
为满足群众需求,开发区经数十次走访调研,确立了开展政务"一件事"乃至"多件事"联办的理念,尝试在钉钉软件平台中搭建智能政务联办平台,在办事群众自愿基础上,为群众办好"一件
如此大规模投入,以及从原油炼制至各类细分化工产品的产出工艺,只有通过数字化制造管理手段才能运营,而一个传统制造企业的数字化要转型,必须通过三个维度:第一个维度是产业
制造业是国民经济的主体,制造业与互联网深度融合,将是数字经济的主战场,工业互联网平台逐渐成为制造业数字化转型的关键目标。1月27日,由浙江省信息经济联合会主办,传化集团承办
政府管理部门履职信息化、评价更透明。日前,记者在温州乐清、瑞安采访亩均论综合评价情况,发现凡"亩均论"考核成绩优秀者,大都是专注实业、重技改创新投入的企业。履职信息化
随着社会的不断发展,物联网技术在信息化与自动化融合之中,起着日趋重要的作用,越来越多的技术公司和工业公司试图将物联网技术应用在工业生产领域,来洞察生产过程,实现基于