面向中医药领域的信息检索关键技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:shanlai_lu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的快速发展,网上信息资源越来越丰富,网络已经成为人们获得信息的必要途径和重要手段。搜索引擎是目前人们检索网络信息的主要工具,它在给人们带来很大便利的同时,也日益暴露出许多弊端:关键词匹配的方式检索准确率不高,返回的相关文档过多且重复率高。人们期盼着新的、具有智能性的、结果表示形式更为简洁的新一代搜索引擎的出现。在这种需求推动下,本文致力于基于Ontology领域知识指导的信息检索系统的研究和开发,该系统基于特定领域Ontology中概念、实体以及它们之间的关系等信息,回答用户用自然语言提出的问题,帮助人们快速而有效地找到所需的特定领域的信息。 本文结合教育部“数字博物馆”项目,通过对中医药领域知识的考察,以及对Web相关论坛上的求医问药问题的统计分析,进行面向中医药领域的信息检索系统的研究和开发,对其中的一些关键技术进行研究,提出解决思路,并在原型系统上进行了实验。本文的主要工作如下: 1)中医药领域知识库的组织和建立 求医问药的信息检索有其特殊性,检索系统根据用户的问题,在大量的资料中寻找问题所需的答案,势必需要借助一定的领域知识作为推理和判断的基础。如何组织和建立领域知识库是本文的关键,它决定着知识使用的效果和效率。针对中医药领域知识的特点,本文采用Ontology的思想进行领域知识的组建,包括领域词典的建立,以及Ontology中概念、属性、关系等的建立。 2)查询请求处理技术的研究 本文在Ontology指导下来处理用户提交的查询请求,更为准确地分析自然语言形式问题中的词法等信息,识别出问题的类别,得到一些关键词,并进行扩展,然后将问题类别和带权值的关键词序列提交给系统的后继处理模块。而这些问题类别也是与Ontology中的概念及概念中的属性相对应的,关键词也会根据Ontology中领域词汇的关系进行扩展,并赋予不同的权值。 3)相关反馈技术的研究 本文的相关反馈是建立在Ontology的基础上支持多兴趣主题的反馈处理技术。论文基于Ontology,采用显式反馈的办法来得到用户的兴趣,然后将用户的兴趣信息参照Ontology中信息实体的形式来存放,用来指导用户查询请求处理结果的调整,包括关键词的扩展和调整。考虑到求医问药的特殊性,该技术支持用户兴趣漂移,但并不立即删去用户旧的兴趣,可同时保留若干个用户兴趣主题,使之既能够反映用户长期的兴趣,又能体现用户当前短期的兴趣,具有很好的适应性。 4)原型系统的设计与实现 结合本文的工作,我们设计和开发了面向中医药领域的基于Ontology的信息检索原型系统,本文提出的中医药领域Ontology的领域知识库、基于Ontology的查询请求分析处理以及基于Ontology面向多主题的相关反馈处理技术在原型系统中得到了较好的验证。
其他文献
包装辅助设计是一个方兴未艾的产业,纸盒包装又是包装业的重中之重,而在包装辅助设计中,包装效果的三维仿真是一个包装辅助设计软件不可缺少的重要组成部分,其质量的好坏直接影响
在计算机网络世界中,无线网络起到了越来越重要的重要,移动手机GSM网络已经在全世界广泛部署,无线局域网络在IEEE802.11系列标准的推动下也越来越完善,本文介绍了一种新型的无线
传感器网络(SensorNetworks)综合了传感器技术、嵌入式计算技术、无线通信技术和分布式信息处理技术,能够协作地实时监测、感知和采集各种环境或监测对象的信息并对其进行处理
互联网和信息技术的空前发展,加速了人类活动信息的产生,互联网信息总量急剧增加,人们对信息的获取和处理的需求不断提升,需要更加智能化和定制化的网络爬虫,以满足不断增长的网络
与一般的软件系统相比较,实时系统具有实时性、并发性等特点,并且此类系统往往要连续运行很长时间,这对系统的健壮性和安全性提出了很高的要求。实时软件系统的复杂性和高安全需
工作流管理系统(Workflow Management Systems,WFMS)就是对多个人按照多个步骤完成的商业流程进行管理的一个主动化系统,它的功能就是在合适的时间以合适的工具将合适的数据发
网格化是未来网络服务的发展方向,网格中间件可以有效地整合网络中的计算资源和存储资源,为网络用户提供强大的计算能力支持。在网格环境下,服务广泛地分布于不同的地理位置,用户
随着互联网技术的不断发展,网络和信息技术已经成为驱动社会经济发展的重要力量,成为人们生活密不可分的组成部分。与此同时,网络与信息安全问题层出不穷,各种网络攻击造成了巨大
贝叶斯分类器作为著名高效的有指导学习算法之一,受到广泛的关注,但是其在聚类分析(无指导学习)上的应用还非常有限,基于贝叶斯分类器的聚类算法和其它常用聚类算法的比较工作几
随着技术的发展和需求的增长,计算机网络越来越多的融入了人们的生活。与此同时,网络的规模也变得非常的庞大,结构也异常复杂。如何管理和规划好迅速膨胀的计算机网络,让它更好的