基于段落检索和段落内容分析的知识化检索系统研究

来源 :中国科学院文献情报中心 | 被引量 : 0次 | 上传用户:fenghui111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有信息环境下,用户能够快速便捷地检索出大量的相关文档,但用户还需要从这些大量的文档中挖掘出与自己需求真正相关的段落并分析归纳这些段落之间的内容关系。现有主流的信息检索系统只提供相关文档列表,并线性组织检索结果,很难满足用户这种深层次的信息需求。   针对这种用户需求,本文对相关研究和系统包括QA、多文本自动文摘等相关领域的研究及Vivisim、Grokker,TileBars、orion等系统和算法进行分析,指出现有系统和相关研究对检索结果中与检索式直接相关的内容及其间构成的知识结构和存在的复杂关系的揭示上存在很大的不足。   在此基础上,作者提出一个基于段落检索和段落内容分析的知识化检索系统的框架模型,并实现一个原型系统对模型的逻辑过程进行验证。通过段落检索,获得与检索式之间相关的具体段落内容;通过段落内容分析,发现相关段落构成的知识结构并揭示相关段落之间在内容上的复杂关联关系;基于相关段落的知识结构和复杂关系组织检索结果,并以可视化的形式展示出来,以易于用户理解。   在段落内容分析方面,本文提出并实现一个多层次的段落关系分析模型,分别从段落、概念、特征词三个不同细粒度的层次对段落间可能存在的多种复杂关系进行分析和揭示,是本文研究的重点和主要技术创新。实现对段落内容间在段落层、概念层、特征词层三个层次上,基于概念关系的逻辑语义关系、基于特征词共现规则的隐含关系、基于段落向量的段落相似度、基于与检索式相关度和段落相似度的段落内容的价值度及聚类等五个角度的关系分析。   本文采用了系统分析与建模、系统设计、系统实现的研究方法,完成原型系统的设计和实现,并对原型系统进行测试和评价。
其他文献
文章论述了世界上不同民族的不同文化底蕴所形成的足球流派和风格差异,给亿万球迷带来了多式多样的审美情趣.在中国,从长远发展来看,要想跟上世界足球发展的潮流,就必须坚持
街舞的学习相对简单,不需要学习者有深厚的基本功,而且舞蹈的动作也相对简单,这样就导致人们对街舞十分的青睐.相对而言,对于民族民间舞蹈的喜爱程度就有所下降,这一现象也很
大量统计数据表明,学科发展生命周期的阶段性特征可以反映在科研经费、科研人员、科研活动、科研内容和科研成果等多个方面。学术合作作为科学活动的基本模式,存在于学科发展的
体育不仅能强健体魄、增长技能,还能培养学生的社会主义核心价值观.本文对体育教学中社会主义核心价值观的渗透进行了探讨,以期最大程度地发挥社会主义核心价值观的渗透力度,
武术教学是高校体育教学的一个重要组成部分,近年来,随着高校体育教学改革的不断深入,许多高校的武术教学水平也不断提高,不过武术文化教学始终是高校武术教学中极其薄弱的一
人文精神指是教育的灵魂.本文分析我国高职体育教学中人文精神的作用,探析了高职体育教学中人文精神的教育策略,希望能够对高职体育教学改革提供一些帮助.
随着人们生活水平的提高,“竞技体育”逐渐成为当下人们生活中必不可少的一部分.在科学技术水平逐渐提高的今天,运动竞赛已不仅仅是单方面加强运动员的运动技术水平.而是更科
为研究社会体育专业建设问题,本文以银杏酒店管理学院社会体育专业毕业生为研究对象,对该专业2014届-2016届毕业生就业现状进行了调查.研究发现,该学院社会体育专业毕业生就
网络环境的发展给高校图书馆的信息资源建设提出了新的要求,使高校图书馆的信息资源建设面临如何合理配置各类型信息资源、如何整合高校内部信息资源、如何有效利用网络信息资
学位
学校运动会是学校体育竞赛活动的重要组成部分,从我国第一次有学校举办学校运动会至今已有100多年历史.本文通过文献查阅、专家访谈、问卷调查,都发现学校运动会应该要受到学