基于LSTM和Attention的知识点标注系统

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:dx0746
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、云计算等信息技术不断发展,每天产生海量的数据都会被收集到云端。虽然对这些海量数据的自动挖掘处理具有非常高的应用价值,但是往往由于文本的非结构化原因,使得计算机无法有效的处理这些数据,进而使提取到的有价值的信息减少。本文对知识点自动标记系统的关键技术进行了深入研究,重点针对教育领域中数学问题的题目信息提取和信息的表示,提出一种基于深度学习的初等数学知识点的自动标记系统解决方法,同时也完成一套针对初等数学知识点自动标记系统的研发,并利用真实收集数据进行一些测试和应用。本文主要进行了以下几个方面的工作:(1)建立数学领域中知识表示模型数学题目中信息的提取和知识的表示是自动标记系统的前提和基础。本文针对数学知识体系中最常见到的实体以及实体之间的关系,建立统一的知识表示方法,能够将题目中蕴含的信息清晰的表达出来。(2)建立数学语义理解模型本文利用句模实现对数学语义理解模型的构建。介绍了句模的相关概念,句模的匹配算法,以及如何利用句模从题目中获取题目所表达的逻辑信息。对题目中信息的理解涉及到了机器学习和自然语言处理等多领域的技术问题。(3)建立一个知识点自动标记模型对初等数学知识点整理研究发现,通常对于一个初等数学知识点的考察,相同知识点的题型往往是类似的。因此对于知识点的自动标记过程,可以归纳为对于相似题目相似知识点的分类。本文通过提出一种初等数学知识点自动标记系统来实现对题目考察知识点的自动标记。(4)利用推理方式进行知识点标记建立一种利用规则和上下文的知识点标记系统。对于需要标记出多个知识点的题目,通过规则或者上下文特征,标记出多个知识点。本文通过对知识的表示,数学题意理解以及知识点自动标记系统的模型的研究和构建,最终实现了一个初等数学的知识点自动标记系统,系统在自建的题库中对于初等数学知识点自动标记系统的标记准确率达到了70%。
其他文献
以手机、电脑等为代表的多屏幕媒体渗入人们的日常工作与生活中,以多屏信息化来满足人机交互需求的多屏传播时代悄然到来。媒体选择多元化最大限度地瓜分了受众的碎片化时间,
在绵延千年的历史长河中.中国都市曾经给世界留下了辉煌的印迹。长安.盛唐气象.汴京.上河繁华.杭州,更曾是马可·波罗笔下的华丽“天城”。昔日风光依稀远去.而城市的理想始终未
跳远踏板的准确性是跳远教练员和运动员普遍关注的问题,这一环节完成的好坏直接影响着下一阶段的动作质量,并且关系着跳远运动员的最终成绩。我国跳远运动经过十余年的迅速发
在中学教育中,要弄清现有的教育模式和教育质量,进行及时分析探索和实践改革,让素质教育和创新教育渗透在教学的点点滴滴之中,实现教育体系的完善化。
钢坝闸因其行洪影响、景观效果、使用寿命等方面具有较为突出的优点,近年来在城市河道蓄水工程运用较多。以海棠湾水利枢纽工程为例,通过闸型比选得出钢坝闸方案最优。对钢闸
潞安集团在加强煤矿企业井下安全的同时,也非常重视煤化工企业生产安全,ESD(SIS)系统作为安全控制系统,要应用好、管理好,引起高度重视。
SOP(Standard Operating Procedure标准操作程序)作为指导和规范日常工作的标准文件体系,已被广泛用于实验动物科学领域。目前,大量高质量标准化的实验动物特别是啮齿类大小
针对电极旋转运动过程中直流空气电弧动态特性的研究,提出直线+旋转运动的电极运动方案,并与电极直线运动过程中电弧的动态特性进行对比分析。为此,以磁流体动力学(MHD)为基
以新乡平原新区龙源9号楼为例,系统、详细地介绍了方向线交会法在整个异形工程测量放线的应用过程。
2019年8月12日,科学服务领域的世界领导者赛默飞世尔科技(以下简称"赛默飞")近日与山东英盛生物技术有限公司(以下简称"英盛生物")在山东济南正式签署战略合作协议,并宣布英