论文部分内容阅读
数据库全文检索技术的出现大大提高了数据库对于海量数据的检索效率。但是,在中文应用系统尤其是一些指挥信息系统中,采用全文检索技术的并不多,主要是由于特殊原因这些系统不能与互联网对接,无法针对多个数据库表多个字段实现全局数据联合查找,也不能结合具体的作战指挥和平时应用灵活的展示给指挥员感兴趣的内容。因此,急需研究一种能够完善支持中文应用系统、采用全文检索技术、并具备一定智能特性、可以进行摘要提取的通用搜索引擎,能够在相关指挥信息系统中加入全中文智能搜索和摘要提取功能,以便于用户及时查找到所需要的内容,以提高指挥的信息处理能力、快速反应能力和辅助决策能力。以目前单位XX指挥系统的大型数据库无法有效处理中文数据信息的问题为背景,针对中文数据库应用系统数据搜索不灵活的问题开展了深入研究,以大型数据库的全文检索技术为核心,构建了一个全库多表多字段的全局智能搜索引擎,在其实现流程和应用方式上都作了改进和创新,能够真正帮助用户从海量数据中快速的检索有效的信息。针对目前多数数据库在面对大量数据进行检索时出现的信息表现力差的问题,对大型数据库的全文检索机制进行了研究,提出了全局智能搜索的技术,设计了搜索引擎的工作流程;研究了文档去格式化技术和基于XML的文本联结技术,实现了多表多字段的联合数据查询;提出基于正则表达式的摘要提取方法和改进的基于Oracle Text的排序算法,有效地提高了全文检索结果的质量;对搜索结果的展现技术进行了研究,结合用户的具体应用需求,智能搜索引擎能对查询结果做出不同的处理,以最合适的方式展现给用户,体现全局智能搜索引擎的智能化。在单位XX指挥系统中设计了智能搜索与摘要提取工具,建立了全文索引,开发了良好的人机界面,解决了目前大型数据库应用中用户或开发者必须知道数据存放位置才能实现数据搜索的问题,实现了通用的全数据库多表多字段的全局智能联合数据搜索,并进一步实现了结果自动排序、关键词突显、摘要显示等功能,同时在数据的展现上能有效地针对数据的类型和特点,将搜索结果以最直观、最合适的方式展现给用户,使数据库的检索功能能够真正结合具体应用,以满足XX指挥系统的作战指挥、训练演习和平时办公等多项需求。