基于检索的高考历史题答案生成方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:runnerups
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展与普及,互联网上产生了海量的信息,人类需要以更简单快速的方式获取信息,过去的搜索引擎逐渐无法满足人类对于信息获取的要求。而自动问答系统,则是一种比搜索引擎更为高级的信息服务形式,系统返回给用户的不再是根据相关度排序的文档列表,而是更为精准的自然语言答案。人工智能技术的飞速发展对自动问答系统产生了巨大的推动作用,也促进了自动问答系统在更细分的领域的推广,在此背景下哈工大参与了国家的高考答题机器人项目。本文希望构建一个面向高考历史简答题的自动答题系统,并重点探索基于检索的答案生成方法在答题系统中的应用。本文的主要研究内容包括:试题分析与知识库分析。本文对高考历史简答题进行统计分析,在此基础上总结出题目的类型以及每种题目类型的特点;通过网络等渠道获得了一定数量的历史语料,并针对这些语料在高考历史模拟试题上分析了知识库中的知识点对高考知识点的覆盖能力。问题和材料关键词提取。为了更加准确地提取关键词,本文融合了多种方法,利用有监督学习的算法来提取问题中的关键词;对于历史简答题中的材料,本文结合历史题特点,利用词性标注的方法提取关键词。候选答案抽取和排序。本文根据问题和材料的关键词信息,从知识库中检索包含这些信息的文档,并利用滑动窗口方式对其进行切割,最终生成候选答案。为了完成对候选答案的排序,本文预先在大规模语料上训练了基于循环神经网络的语句编码模型,然后利用训练好的语句编码模型分别将问题、材料和候选答案嵌入到语义空间中,并在该空间中利用问题和材料的信息,对侯选答案进行排序。系统性能评价。本文首先对各个模块分别进行了评估,然后对系统的整体性能进行了人工评估。通过对九套试题共95道高考历史简答题的实验,本文的自动答题方法在准确率上比基准方法高出5%。
其他文献
<正>一、前言 饱和砂土体的液化问题是岩土工程中一个引人注目的问题。近20年来,随着土动力学的发展,人们对于饱和砂土液化的机理分析、液化的影响因素,液化的可能性判断以及
新能源产业是宁波工业发展的重点产业之一,市政府一直非常重视。本文在分析了宁波新能源产业发展现状的基础上.指出了该产业发展的优势与困难,展望了今后的发展重点,并提出了可行
目的探讨选择生脉丹参饮联合西药对重症肺胀患者治疗后获得的临床效果。方法选择我院收治的82例重症肺胀患者作为实验对象;采用随机数表法分组后进行重症肺胀药物的研究;对照
列宁青年思想是列宁主义的重要组成部分,他主要从四个方面科学论述了青年理论,即青年的主要任务是学习、青年的成长进步必须参加社会实践、重视青年组织的发展、鼓励青年批判
在大多数人的传统印象当中博物馆展示的物件都是以物为主,摆放在博物馆内,通过物品让人们认识到历史文化的悠久与震撼。但随着科技的不断发展,技术先进的工作人员学会将数字
近年来,国家为了支持某些行业的发展,对企业所得税采取了免征、减征、先征后还的税收优惠政策,对于企业所得税减征和先征后还的会计处理,财政部《关于执行〈企业会计准则〉有
目的观察缰核损毁对下丘脑内GABAA受体α1亚单位(GABAAα1)表达的影响,以揭示缰核与下丘脑之间功能联系的可能的分子机制。方法建立缰核损毁大鼠模型,以假手术组为对照。分离
高速公路交通量的预测是管理部门研究的重要内容,为交通控制和诱导提供数据支撑。针对高速公路交通量的预测问题,引入一种新的基于双向长短期记忆网络(Bidirectional Long Sh
<正>去年以来,北京市出台了10多项举措,解决军人后顾之忧。据北京市退役军人事务局介绍,北京市区两级专门召开军人子女入学保障工作协调会,建立"优待+协调""组织对组织"的军
<正>随着国内经济由高速发展转向高质量发展,汽车行业也随之发生了重大变革。各品牌在更加重视产品品质的同时,纷纷将目光转向了提升服务质量和服务体验方面,而雷克萨斯当属