基于逆文献频率加权和N元分析算法的自动标引研究

来源 :图书馆工作与研究 | 被引量 : 0次 | 上传用户:g19801218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对逆文献频率加权标引和N元分析进行对比分析,同时引入统计学领域的条件概率和信息论中的信息熵这两个工具,针对文献信息的处理提出了基于N元分析与逆文献加权的标引方法,以期提高文献的标引质量,避免自然语言处理中的一些问题。 In this paper, we compare and analyze the frequency-weighted indexing and the N-element analysis of the reverse literature. At the same time, we introduce the conditional probability in statistical field and the information entropy in information theory. Based on N-element analysis and inverse literature weighting, In order to improve the indexing quality of documents and avoid some problems in natural language processing.
其他文献
关于西欧“封建主义”是否具有普遍性以及中国有无“封建社会”问题,中外学界长期以来一直争论不休。对于这样一个投入了学者大量精力、且尚未有结论的重大问题,应该遵循学术
本文利用浙江兰溪的清末鱼鳞图册样本,计算出该地区地权分配之吉尼系数,其数值与江苏、安徽地区的吉尼系数同样的低,这反映出江南省份的高人口密度,并与华北地区较高的吉尼系
本文试图从历史与法律的角度,去伪存真,分析明治时期日本政府官书(政府文书)对“尖阁列岛”的“无主地先占论”及其依据。本文认为,日本方面宣称对钓鱼列岛“无主地先占”的
俄罗斯是目前国际上唯一与伊朗伊斯兰共和国进行核合作的国家.对于两国在核方面的合作,俄罗斯有着政治、经济等多方面的动机,俄伊之间围绕核问题也存在着深刻的矛盾.俄罗斯的
作者鼓励图书馆专业人员,不单要为自己的图书馆尽心尽力,也要走出自己的图书馆,贡献才智与全世界数字图书馆链接。为了达到提供更快的服务,把好的资源信息送到更边远的地区,
《语文新课标》指出,初中学生要能阅读浅易的文言文,能借助注释和工具书理解基本内容。了解基本的语法知识,用来帮助理解语言上的难点;了解常用的修辞方法,体会它们在课文中的表达
幽默是一种巧妙的语言方法,主持人在运用这种方法时应力避浅、飘、直、露,枯燥乏味。而是应采用意在言外,婉转曲述,妙语回避等艺术手法,委婉含蓄表达感情和想法。
有些惯用同义成对词已经成为陈词滥调(cliché),似乎失去生气。使用此表达的人往往受到不公正评价。其实,只要运用恰到好处,同样也有其新意。本文将从同义成对词的表层语义关系着
目的:观察美托洛尔联合卡托普利治疗原发性高血压的临床效果。方法选取轻中度高血压病患者(收缩压140~179 mmHg ,舒张压90~109 mmHg)60例,随机分成两组。对照组给予卡托普利25
目的观察米索前列醇联合缩宫素预防孕产妇产后出血的临床效果及安全性。方法 423例孕产妇分为两组,对照组肌注缩宫素,观察组直肠给药米索前列醇,肌注缩宫素,比较两组产后2 h