基于本体的数学表达式检索技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:PresentScore
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科研、教育和工程等众多领域中,数学表达式作为一类复杂的、语义强的重要信息。人们对它的检索有着表达式二维结构识别和表达式内容语义识别的要求。然而现有的数学表达式检索系统大多是基于表达式字符文本化和基于表达式内容展示形式进行处理的,很难满足对表达式内容语义的识别。因此,实现数学表达式的语义检索对学习和工作都有着现实的意义。本论文以支持数学表达式内容语义和关联关系的表达式本体库为基础,对查询条件进行语义扩展,以期达到数学表达式的语义检索的目标。论文主要开展以下工作:1)论文分析了数学表达式的检索过程,提出了一种基于本体的数学表达式语义检索模型。其思想是以表达式中数学公式部分作为基点归纳出四类数学表达式多元信息的关联关系,再使用改进后的通配符表示方法来构建数学表达式本体库。基于构建出的本体库对查询条件进行语义拓展处理,将语义拓展处理后的关键词汇返回给用户进行关键词精确操作或是直接传递给检索框架,实现数学表达式的语义检索。2)本文提出了一种改进后的数学公式DOM树的相似度匹配算法来实现上述模型中的语义扩展功能。该算法的基本思想是根据编辑操作对象节点类型的异同和其父节点的异同赋予不同的操作代价,枚举叠加出操作代价总值,得出相应的相似度,实现用户查询条件的语义化和精准化拓展。同时借助数学表达式本体库中归纳的关联关系和上下位层次关系,减少匹配次数,提高匹配的效率。3)在上述研究工作的基础上,论文使用Protege4.3工具构建出一个初级的数学表达式本体库,再以Lucene检索框架为基础引擎进行实验,验证了基于本体的数学表达式语义检索模型和方法的可行性和有效性。并对改进后的DOM树相似度算法进行对比实验,实验结果表明,改进后的算法在响应时间、查全率、查准率和F-Measure值四项检验指标上均有提高。
其他文献
众所周知,密码技术和安全协议是保证通信安全的关键所在。但是随着计算机和通信技术的迅猛发展,各种密码破解方法和协议攻击算法不断出现,传统的密码技术和安全协议已不能满足日
聚类是一种重要的数据挖掘技术,它可以在不了解数据背景的情况下完成数据的划分,使得同一个划分中的数据相似度尽可能大,不同划分中数据的相似度尽可能小,以方便数据的分析与
事件的可信度表示文本中事件的事实性状态,对理解篇章中事件的确切语义起着至关重要的作用。目前,只有英文方面有事件可信度信息研究和少量确定性信息语料库,中文方面暂时还未起
随着移动互联网的日趋成熟以及移动终端的逐渐普及,用户在手机上进行图片搜索的需求也越来越强烈。本文将图像检索系统与智能手机相结合,分析和研究基于手机的分布式图片检索
随着各行各业信息化的程度不断的提高和移动互联网的飞速发展,传统的计算模式和存储模式已经不能满足日益增长的业务需求,云计算就是在这种背景下提出的一种计算模式,它是一
近年来,社会生活日新月异,纸质档案的数量不断累积、日益增多,对大量的纸质档案的管理和利用方式值得关注。传统人工纸质档案管理方式会带来档案的查询费时费力、纸质档案容易损坏以及占用存储空间大等一系列问题,为了摆脱这种模式所带来的不便,对纸质档案的数字化应运而生。数字化的电子档案相比纸质档案具有明显的优势,其不仅存储方便、不容易被篡改、而且提高了档案查询速度。因此,如何将纸质档案实现数字化,就成为了我们
学位
在中间节点实施数据融合,被认为是一种十分有效的对带宽和能量等无线传感器网络稀缺资源进行优化的有效方法。然而,这种网内处理却对感知数据的安全性造成了一定负面影响,因
云计算技术最初起源于一种商业界,其快速的发展状况,引发了学术界的巨大反响。商业界越来越多引入了云计算,这些商业云计算系统不同于其他云计算系统,对于其特殊性等问题需要
随着移动互联网与位置信息的加速融合,基于位置服务的研究和应用在人们的生活以及各个行业中已经十分普遍,其中位置感知服务(Location-aware service)也已经成为人们研究的热
近年来,随着群体智能优化算法的发展,智能优化算法已成为解决复杂调度问题的重要方法,其被广泛应用于计算机科学、工程和经济问题等领域。由于复杂优化问题存在着大量局部最