论文部分内容阅读
随着当今信息量以几何级数的速度增长,人们发现其所需要的信息变得非常困难。如何有效得组织、管理和维护海量信息,并为各种用户提供有效的服务成为一项重要而迫切的研究课题。信息检索就是研究如何根据用户的信息需求,从文档集中检索出与用户需求相关的文档子集。信息检索系统由信息组织和信息检索两大部分组成,信息检索性能的提高需要良好的信息组织,而信息检索满意度的提高有赖于良好的人机交互界面。 传统的论文文献信息组织方式,多是根据文献的外部特征,如题名,责任者,索取号等作为建立索引的依据,缺点是无法反映文献的语义特征,只能够对其进行精确查找。而本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,可以有效的应用于信息的组织,为信息检索系统提供语义支持。随着信息检索应用的普及,传统的基于点选和关键词输入的人机交互方式已经不能满足日益扩大的信息检索用户群的需求,适应于非专业用户的人机交互界面也成为研究的热点,自然语言处理在智能人机交互中扮演了重要的角色。 本文着重对信息检索中的文献组织和检索过程中的人机交互作了深入研究。通过找到有效组织信息的方式,从而为检索者提供认知帮助以达到提高检索质量和效率的目的。本文的主要工作包括对本体和多本体研究现状的调研,对传统信息检索技术的弊端的研究,在此基础上,提出了基于多本体的信息组织方式,文献相似度计算方法,和多本体概念放宽的算法。在人机交互方面,提出了采用自然语言对话的方式向用户进行启发式提问,逐步了解用户的检索要求的方法。分别设计了英文和中文的自然语言处理算法,从而实现检索接口的人机对话功能。最后在总结本文工作的基础上,对多本体在其他领域的应用以及智能人机交互的应用前景做出了展望。 在实验方面,本文选择了论文文献信息检索这一应用环境,设计实现了一个论文信息检索原型系统,通过原型系统对所提出的理论和模型给出了实验验证:分别设计了C/S和B/S两种架构下的智能人机交互界面。通过英文的句法分析和中文的多文字切词,实现了人及自然语言对话,并且为用户提供良好的认知支持。