基于可读性的信息检索模型研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:yindiend
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是指从一个信息资源集中获取与信息需求相关的信息资源的活动。随着文本资源多样性和用户多样性的提高,如何为不同用户提供既相关又可读的文档已经成为一个亟待解决的问题。为了有效解决这个问题,本文尝试将可读性融入到信息检索模型中,从而提高用户的满意程度。针对可读性问题比较突出的特定领域,本文分别提出了基于本体和基于序列化主题的可读性检索模型。在基于本体的可读性检索模型中,综合考虑文本专业概念覆盖度以及序列依赖信息进而从概念层次和文本语篇层次评估文本可读性。基于序列化主题的可读性检索模型则通过自动构建主题层次结构,提高了模型的灵活性。该模型符合用户认知理解过程,并能从主题层次和文本语篇层次评估文本可读性。此外,鉴于可读性计算过程中用户主观因素的存在,本文最后针对如何通过运用用户阅读认知水平等优化现存可读性计算方法。该方法的使用为后续将可读性融入交互式检索过程中指明了方向,具有重要意义。针对所提可读性模型,本文分别从用户实验与系统实验角度予以验证。通过使用用户实验探索所提模型与用户主观判断的一致性程度。而系统实验则主要用于评估所提模型的检索效果。实验结果表明,基于本体的可读性计算模型对文本被识别概念中序列信息的利用具有重要意义。基于序列化主题的可读性检索模型,既能与用户可读性判断得到较高一致性,又能有效提高系统检索结果。而通过将用户阅读认知水平融入到可读性计算模型中能有效提高可读性预测的准确性。
其他文献
无线传感器网络是当今国内外上高度重视、有很多技术结合在一起的重点研究对象之一。无线传感器网络结合了无线通信技术、分布式信息处理技术、嵌入式计算技术、微电子技术和
测序和基因组学产生的海量数据促成了生物信息学这门交叉学科的诞生,它的最终目的就是利用这些数据分析和解释各种生理活动,而基因表达和调控的研究是这门学科的重要内容。生
指纹识别技术作为生物特征识别的主流技术,是国内外研究和应用的热点。目前已有的指纹识别系统大部分只利用了第一级别和第二级别的指纹特征(方向场和细节点),极少使用像汗孔
移动Ad Hoc网络(移动自组网或MANET)是指由一组带有无线收发装置的移动节点组成的一个多跳的、不需要固定中心接入点或者基站支持的自治系统。以其组网灵活、快捷、不需要预
在临床医学实践教学中,医学工作者和学生很难接触到多种真实的病例,因此如何提供大量、不同病症的模拟病例对于医学教学和研究非常重要。  本文采用.net技术、虚拟仪器技术
数字图像处理起源于20世纪20年代,此后在医学、遥感、模式识别等领域广泛应用,使得图像处理在现代信息处理领域中迅速发展。其中图像分割是一般图像处理领域的基础,图像分割
本文为了解决面向最终用户编程问题,提出了一种基于动态语义的服务虚拟化模型。该模型以SOA思想理论为基础,采用面向服务计算和Web服务技术,建立服务虚拟化模型,并结合本体服
目前Internet、分布式网络、移动通讯技术以及企业信息化得到了快速的发展。软件的系统架构基本上采用B/S和C/S两种。C/S架构能提供丰富的用户体验,运行效率高,能够有效使用本地资
随着互联网的发展,人类大步迈入信息时代。互联网使人们足不出户就能阅读到世界各国的信息,更使得人们可以在弹指挥手间不受时间和地域的限制获取想要的信息。互联网已经成为
以保障安全为目的而建立起来的技术防范系统,称为安全防范系统。它包括以现代物理和电子技术及时发现侵入破坏行为、产生声光报警阻吓罪犯、实录事发现场图像和声音提供破案