基于CRF模型的初等数学问题命名实体的识别

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:frontwave
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能领域机器学习、深度学习技术的发展使语音识别、图像识别取得了巨大的成功,因此人工智能技术越来越受到国内外专家学者的关注,而知识推理是机器学习、深度学习研究又是最重要、最核心的问题。因此基于知识推理的863课题“类人求解系统”相继被提出。然而在初等数学领域的类人解题系统进行知识推理的基础是数学知识的正确获取,然后才能进行准确的推理。所以本文从理论和实践两方面重点研究了如何正确高效的抽取数学领域的知识点。本文主要进行了以下几个方面的研究。1、基于自动解题的初等数学问题的相关研究首先通过分析初等数学语言的特点和基于自动求解初等数学问题的知识表示本文确定了以命名实体的方式进行知识的抽取。因为应用于解题的数学实体没有相关的研究,所以本文依据几何和代数知识的具体特点确定了基于解题需要的数学命名实体的类别。2、提出了新的基于解题的初等数学命名实体标注方法由于代数和几何实体的特点不同以及代数部分实体长度较长、实体边界判断容易出错的原因,本文针对于代数部分提出了新的6词位实体标注法。通过实验的方法证明了代数部分6词位标注方法效果要好于4词位和2词位的标注方法。3、提出了自动生成词典的实体识别后处理方法因为基于统计方法的命名实体的识别并不能达到100%的正确率,而解题需要完全正确的知识才能保证推理的正确。根据几何和代数部分实体的词形构造的特点,本文在统计模型识别之后添加了自动生成词典的识别后处理算法,大大的提高了实体识别的效果,也解决了人工收集词典效率不高的问题。4、提出了将Viterbi算法和规则相结合的剪枝策略本文统计了数学实体标注状态空间的转移规律后发现Vterbi算法在解码过程中的一些搜索路径是不符合实际情况的而且大大的影响了解码的效率。所以本文将发现的标注转移规律以规则的形式应用到解码算法中进行搜索路径的剪枝提高了解码的效率。最后,本文基于一系列方法,本文构建了一个基于CRF的初等数学问题命名实体识别系统。
其他文献
今年的一号文件推出了一系列含金量高的强农惠农新政策,和往年相比,今年的中央一号文件有那些变化和亮点?中国农业大学校长柯炳生表示,今年的一号文件,是在以往六个一号文件的基础
美国发生“次贷危机”后,席卷了美国、欧盟和日本等世界主要金融市场,致使全球主要金融市场出现流动性不足的金融危机。此次全球金融危机,暴露了决策者的决策错误,也产生了对公允
中小学教育是国民教育的重要内容,中小学是培育和塑造社会主义核心价值体系最重要、最关键、最有效的阵地之一。为提高中小学社会主义核心价值体系教育效果,需要在教育教学活
当虎年钟声响起的时候。全球的中华儿女们耳听霹雳般的爆竹声声,眼观连绵不断的焰火银花,围炉把盏,“狼吞虎餐”。深深的情谊与祝福.绵绵的思念与问候,融入多少乡味乡情。干丝肴肉
儿童处于人生的关键时期,环境对儿童的成长至关重要。由于我国经济发展的地区差异性,儿童成长的资源条件都会存在较大的差异,也会衍生不同的特殊问题,其中就包括儿童的低认同
目前我国警税协作共同打击涉税案件,然而这种警税协作机制带来诸多弊端,无法保障良好的税收环境和税收秩序,不能达到将足额的税收上缴国库的目的,因此,建立税务警察是我国未
打击虚开发票涉税犯罪活动,是整顿经济税收秩序,维护市场体制的重要组成部分。多年来,公安、税务部门进行了不懈的打击,取得了显著成效,但要彻底根治这一顽症,尚有很长的路要
功利主义是现代西方社会政治哲学的重要组成部分。约翰.斯图亚特.穆勒既是逻辑学家和实证主义哲学家,也是现代功利主义哲学的领军人物。文章从思想发展的历史和当代哲学的视
<正>齐欣:八年前,我第一次来湖大时认识了魏春雨老师,当时也是UED组织的活动。从那次结识春雨老师后,我们经常见面。这次来,我觉得跟上次来没有太大的区别,对春雨老师和他作
低耗、高效是市场经济对医院经济运行的客观要求,成本核算则是医院实行“低耗高效”目标的基础。成本核算作为企业经济管理的一种有效手段,有效地“嫁接”到医疗服务与医院管理