基于小世界理论的中文关键词自动抽取与标引

来源 :上海大学 | 被引量 : 0次 | 上传用户:ssss426
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“小世界”现象源于社会学家Milgram在十九世纪六十年代对社会网络的分析。近年来,随着Watts与Strogatz等一批数学家,物理学家创造性地将这个社会学概念构建了数学模型,小世界网络已成为探索复杂网络拓扑结构等基础研究领域的一个新的理论视角。 大量研究发现,无论是人造网络还是自然网络,都普遍存在小世界网络的结构特征。若用特征路径长度L和集团化系数C来刻画复杂网络系统中各节点间的平均距离与类聚特征,可以证明,小世界网络有着较短的特征路径长度和较高的集团化系数,能较好地反映现实社会网络特征,有助于我们深入探讨网络结构对网络功能的影响,因此,“小世界”理论一经提出,就在各个领域激起了广泛的研究热潮。但在情报学领域,应用小世界网络结构特征和属性进行文献信息的自动处理还前所未有。基于前人的理论基础,作者在深入研究了小世界网络及复杂网络的基本理论后,创造性地将小世界理论引入情报科学领域,主张从网络结构的几何特征来分析中文词汇的语义网络,并以数值模拟证明了该网络具有小世界网络的特征,有利于我们应用该特征进行中文关键词的自动抽取与标引。 众所周知,关键词以其灵活、易用的特点成为网络时代最重要的情报检索语言,它既是情报存储的标识,又是情报检索的依据。因此,关键词抽取与标引的质量直接影响信息检索的效率。作者通过分析网络关键词的幂律分布规律,提出以词汇对文献网络结构的贡献度作为提取关键词的衡量标准,突破小世界网络理论的物理意义,建立了以文献语义的小世界网络为基础的关键词自动抽取与标引的方法。实验发现,用该方法抽取的关键词更直观地揭示了文献的中心思想与重要概念,深度挖掘了文献潜在的知识内涵,若用它们作为表达文本知识的标识,则在一定程度上可改善集中式搜索引擎的全文检索质量,提高查准率。因此,能满足网络时代情报用户对网络信息检索的要求,有广泛的适应性与应用前景。
其他文献
阅读教学是初中语文教学的一个重要方面,也是培养学生语文综合素养的重要组成部分。语文新课程标准提出:"阅读是收集处理信息、认识世界、发展思维、获得审美体验的重要途径。阅
  临床实践指南已经成为一种日益普遍的用于控制卫生费用、规范医疗实践行为的工具。本文从指南开发严格性方面对循证性指南的质量进行了系统评价以了解其循证程度。文章使
随着信息传播形式及信息接收条件的改变,电子政务信息网络传播出现了信息服务不均等的问题。为促进政府信息服务公平,保障弱势群体公平的信息权利,我国政府正加快实现政务网
音乐课对学生进行审美教育,是由它的学科特点所决定的。音乐教学在审美教育方面具有的独特功能和作用是其它学科所不能比似的。但长期以来,音乐教学偏重"专业化",习惯把音乐课仅仅看作是一门学习识谱、唱歌,传授技能、技巧的所谓调剂性课程,以至音乐课的美育功能和作用不能充分地体现和发挥。这种思想认识上的片面和狭隘与全面贯彻落实教育方针的要求是不相适应的,必须及时纠正和改变。为了使美育落到实处,在音乐教学过程中
逐臣群体构成中晚唐水墨画坛的核心力量.逐臣水墨画分为:王维平和渲淡,张璨、刘商忧郁苦闷型破墨,顾况、王墨狂放型泼墨.中晚唐水墨画形成以下审美特征:粗笔浓墨,直抒性灵;水
随着社会的进步和经济的发展,人们的生活水平日益提高,健康意识也日渐提升,“奔小康、要健康”的理念逐渐深入人心,尤其是现代社会经济日趋富足的情况下,健康话题日益引起民
  本文从两个较新的角度对数字图书馆开发应用平台进行了研究,并借鉴其他信息技术的发展,指出了平台今后的可能发展方向。  本文首先从数字图书馆开发应用平台的概念出发,从
新的时代给高校图书馆的信息资源建设带来了难得的机遇,同时给高校图书馆的信息资源建设带来了新的课题。如何迎接新时代的挑战,搞好信息资源建设,提供优质的信息服务,这是摆在每
  本文采用材料研究和比较分析的方法,从文化选择和传承的视野深刻的探讨文化选择与档案鉴定的内在关系,揭示档案鉴定工作所具有的内在的文化选择的本质,从文化的高度开门见山
本文的主旨是以政策科学为依托对信息政策及信息政策系统的运行进行系统地研究和阐释,把信息政策的决策问题放在社会科学的核心地位,进而提倡一门以人类社会的信息政策系统及