基于知识本体的数学公式语义检索方法与技术研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:jitlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数学知识管理是模式识别与人工智能领域的重点问题,在网络搜索、知识管理、数字化图书馆、教育现代化领域有着极为广泛的应用前景,数学公式作为数学知识的主要表现形式,对其进行基于语义相似度的检索和查询是实现数学知识管理的关键所在。本文对此问题进行研究,主要开展以下工作:   本文首先根据数学公式的特点和描述需求,构建了数学公式的知识本体模型,通过扩展OMDoc标签实现了对数学公式知识本体及本体间关联关系的描述,并以此为基础实现了面向初等代数的知识本体集构建,为数学公式的语义检索提供了知识基础。然后,基于数学知识的本体定义设计实现了数学公式的规范化处理方法和流程,通过去除多余括号、等价运算化简和子节点重排序实现了数学公式的语义规范化。在其基础上,通过改进有序树的匹配方法,并设计精确匹配、语义等价匹配、模糊匹配等处理机制,初步实现了数学公式的语义检索。本文使用真实数据,针对数学公式规范化和数学公式语义检索进行了验证评测,证明了本文工作的有效性。   针对数学公式进行语义检索的研究工作对提升机器理解人类知识并进行智能化重用有着极为重要的意义,本文研究工作可对诸多应用领域提供支撑,同时可作为参考借鉴,进一步实现化学方程式及其他半结构化文档的知识管理提供帮助。
其他文献
随着数据采集制作设备的日益普及,人们越来越方便地生产图像、图形、音频、视频、动画和三维模型等多媒体数据,这些多媒体数据具有异构、非结构化、高维和动态变化等特征,给
现代远程教育是随着计算机网络技术和多媒体技术的发展而产生的一种新型教育方式,是指借助于现代远程教育手段,以学习者为主体,兼容函授、面授和自学等传统教学形式,并采用多种媒
随着计算机技术、多媒体技术和宽带接入技术的不断发展,传统的文字通信和简单的语音通信已经不能满足大家的需求,基于语音视频的多媒体通信成为网络研究的热点,是未来通讯的发展
随着网络技术的飞速发展,特别是大量多媒体实时音/视频业务的广泛应用发展,对传统以TCP协议为主的传输提出了新的挑战。TCP拥塞控制使用的AIMD策略,会引起速率很大的抖动,不适
运动目标检测是计算机视觉研究领域的重要课题,在智能交通、机器人视觉导航、智能监控、军事等领域有着广泛应用。运动目标的检测、特征提取和识别,是视频监控的关键,其中目
随着互联网的快速发展,SNS网站的兴起,人们越来越多地通过网络进行沟通、交流以及形成人际关系,由此产生了大量的用户数据。如何从海量的用户数据中取得更深层次的有用信息,
签名识别是一项古老的身份认证技术,但在现代计算机技术的发展下又焕发了新的生命力,利用模式识别理论对签名进行分析是现今研究的一个热点。一般的签名识别方法分为两种:在
钢铁产业是推动我国国民经济的一个重要支柱产业,钢铁物流直接影响着钢铁产业的发展状况。随着钢铁产能的不断提升和交通手段的多样化,仓储成为了钢铁物流的瓶颈之一。仓储公司
随着网络技术和多媒体技术的飞速发展,视频点播服务的应用越来越广泛,已成为信息服务中的重要组成部分。另一方面,嵌入式技术的不断进步,也使得人们可以根据个人需要随时随地
随着计算机应用范围的日益扩大,数据库技术和挖掘技术的的不断发展,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。关联规则挖掘作为数