基于语义角色标注的文献相似度检测研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:alyue_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测.提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图.语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度.实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间.
其他文献
[题目一]在昼半球上各地太阳高度角为正值,在夜半球上为负值,图1中H1为正午太阳高度,H2为午夜太阳高度。图2为某纬线某时刻太阳高度分布图,此纬线上各地正午直立地表物体日影
随着用户对知识需求层次的提高,越来越多的人早已不满足于以往所得到的知识,为了应对这一趋势,本文研究的主要问题集中在提高知识发现的效率,尤其是随着数据库技术的飞速发展
以大豆干旱敏感型品种绥农26为材料,采用室内培养法,研究不同浓度褪黑素(0、100、300、500、800μmol·L-1)浸种对6%PEG-6000模拟干旱胁迫条件下大豆种子萌发的影响.结果表明:
提出基于概念格的实体档案用户行为研究方法。对实体档案用户行为进行实践调研,以此形成实体档案馆用户行为的单值形式背景,构建实体档案馆用户行为概念格,将实体档案馆用户
通过搜采和分析方志艺文志的史料,从地方性的角度对于其典型作品进行解读,阐述方志艺文志所具有的地方文学价值和文化价值,从不同角度展开研究。指出方志艺文志在展示地方学
通过对《书目记录的功能需求》(FRBR)概念模型体系结构中实体、属性及关系这3个基本要素的分析,探寻由FRBR模型抽取出的馆藏资源元数据关联网络的构成要素,并对符合FRBR的馆
随着经济全球化趋势不断增强,数字鸿沟问题正日益成为信息时代全球性的难题,越来越引起世界各国的高度重视。尽管目前我国信息化发展迅猛,但对我国来说,数字鸿沟同样是一个不
口述档案资源建设是档案馆馆藏资源建设的重要方面,是丰富和优化档案馆馆藏资源的重要途径之一,也是推动我国档案事业进一步发展的重要契机。本文在实际和文献调研的基础上,结合
随着信息技术地快速发展及现代医学信息化程度的不断提高,信息素养已成为乡村医生的基本技能之一。同时,学界对信息素养研究已从理论探讨阶段进入到实践创新阶段,针对信息素养评价标准研究的文章也层出不穷。然而,对乡村医生信息素养评价问题的关注却相对较少,目前仍处于探索阶段,为更好地指导乡村医生信息素养教育,需要构建符合其特点的信息素养评价标准。本论文基于已有的国内外信息素养评价标准研究成果,以乡村医生为研究
基于通过健康、体育课程让所有儿童拥有健康、良好的身体素质的体育教育理念,通过梳理体育教学分层干预的文献,发现一般的分层干预仅能满足运动低效能学生的体育需求,未能有