用于考古数字博物馆的受限自然语言查询系统

来源 :山东大学 | 被引量 : 0次 | 上传用户:wjwjwwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语自然语言查询系统是自然语言理解、数据库技术、人工智能、人机界面相结合的产物。它使用户可以直接以汉语自然语言的方式,向数据库系统发问并获得所需的信息,从而大大改善了人机交互的容易程度。近年来,它作为人机交互中智能接口的重要部分受到重视,成为具有重要理论意义与广泛实用价值的研究领域。 本论文主要的研究目标是结合考古数字博物馆特定的应用需求,研究与实现一个基于受限的汉语自然语言查询系统。它允许用户在界面层输入受限汉语查询语句,然后通过一定的算法把用户的输入转换成标准的SQL语句,并在文物数据库中完成所要求的查询,输出查询结果。 本论文的工作与贡献主要有: 1.提出符合汉语语法并能满足查询要求的受限文法规则。本论文首先通过对山东建筑工程学院计算机系2001级的24名学生进行问卷调查得到汉语查询语句的四种句型,分别为:祈使句、疑问句、省略句和多语句。且分析得到祈使句是使用频率最高的句型(约占70.2%),并据此提出本系统所采用的符合汉语言习惯并能满足考古数字博物馆查询要求的受限文法规则。 2.研究设计了适合考古数字博物馆的系统词典。如何建立一个简单适用的系统词典是自然语言查询系统研究工作的基础和难点之一。本文通过对考古数字博物馆的数据进行了详细地分析,提出并设计了三种系统词典:通用词典、专用词典和关联词典。这三种系统词典在查询语句的分析中分别起到了不同的作用:通用词典可以支持进行汉语查询语句的分词操作,并得到切分后的各单词的词性序列,从而可以利用词性序列和受限文法规则得到查询语句的查询目标和查询条件;专用词典可以用于得到汉语查询语句的标准化形式,为SQL语句的形成进行预处理操作;关联词典可以用于得到各表之间的关联路径,从而解决了汉语查询语句中比较复杂的表间相互联系的表述问题。本文采用SQL SERVER数据库表的形式对它们进行定义。这样既可以和查询中用到的后台数据的定义形式统一起来以便于系统的实现,又可以提高系统对查询语句的分析速度,从而提高了系统的性能。 3.提出了一种改进的分词算法——WSDS(Word Segmentation on Database Semantic)算法。该算法参照和单词相关的系统词典中给出的数据库语义,应用考古数字博物馆的领域知识,利用信息论和运筹学的相关知识消除了切分的歧义
其他文献
随着移动通信的高速发展和因特网用户数目的急剧增加,越来越多的人希望在移动过程中使用移动终端通过无线方式接入因特网,以获取所需的信息。移动通信与因特网的结合导致移动
移动Ad Hoc网络(MANET)是由一系列带有无线收发装置的移动主机节点组成的多跳、没有固定基站和中心节点的临时性自治网络系统。它具有组网快捷、灵活,且不受有线网络约束的特
嵌入式系统日趋复杂化和网络化,因此嵌入式系统的实时性和网络嵌入式设备的安全性面临严峻的挑战。基于此,本文研究了适用于复杂嵌入式系统的实时任务调度问题和嵌入式网络设
在市场经济条件下,企业为了应对竞争需要采用各种方法提高生产率、降低成本和改善管理,而信息技术一直以來都是企业提高竞争力的重要手段之一。随着信息化的深入,企业内部和
随着城市化进程的加快,城市交通网络的规模也在不断扩大,交通设施日益发达,但这也使城市交通变得异常复杂。而且伴随着各种交通管理措施的实行,限高通行、限速通行、禁止通行
模型检测是一种被广泛应用的验证有限状态系统性质的自动化验证技术。经过三十多年的研究发展,时态逻辑LTL和CTL的模型检测问题已经得到了很好的解决。不仅提出了各种高效的
数字水准仪是集光学电子技术、图像处理技术、计算机技术于一体的当代新型水准测量仪器.它具有测量速度快、精度高、操作简便,能显著减轻作业强度等优点,受到了广大测量工作
随着Web应用的快速发展,Web数据挖掘正成为数据挖掘的热点之一,根据Web挖掘的目的和数据对象的不同,Web数据挖掘可以分为Web内容挖掘、Web结构挖掘、Web用户访问信息挖掘。we
数据挖掘可视化有多个分类,而电信企业最为关心的是数据挖掘结果的含义,因此本文研究的是电信数据的数据挖掘结果可视化,同时引入了社群网络分析技术,增加了分析的深度。研究内容
地理信息系统(Geographical Information System,简称GIS)集现实世界对象的空间位置和人文经济信息的管理于一体,如何选择一个好的计算机实现模型,达到信息存储、处理的高效