面向高考阅读理解观点类问题解答方法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:sweetorange888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
阅读理解任务是给定一篇文本,要求机器根据文本的内容回答相应的问题,该任务现在已经成为自然语言处理领域的研究热点。本文以北京语文高考文学类阅读理解解答任务为背景,对其中的观点类问题进行了分析与研究,主要研究工作如下:(1)对高考阅读理解观点类问题进行难点分析,并提出问题扩展和答案句抽取两个关键技术。(2)基于多主题的答案句抽取。为了克服高考阅读理解观点类问题中仅仅利用关键词抽取答案句的不足,通过对单篇文章建立LDA模型,计算阅读材料中每一句话与问题的主题分布相似度,再利用SVM分类器,对主题分布相似度高的句子进行分类,用于获取具有观点特征的候选观点句,最后将其与问题观点进行相似度计算并排序,选取排名前α的句子作为题目的答案句。该方法在标注好的小规模和较大规模的高考观点类问题的答案句识别中,分别达到了47.8%和38.5%正确率,并能将答案句的排序自动提前。同时,实验结果也表明在散文阅读理解题中,采用多主题方法比单主题时具有较好的答题效果。(3)基于上下文循环神经网络模型的问题扩展。为了提高答案句抽取的召回率,需要模型对原问题有更深层次的理解,即找到问题在阅读材料下的相关语义。我们基于层级循环网络的上下文感知模型,建立阅读材料、问题和答案之间的相互依赖关系,并依据此模型对原问题进行语义扩展。实验结果表明,神经网络对原问题的语义扩展准确率达到68%,且在一定程度上扩展了问题的深层语义。同时,使用扩展后的问题比使用原问题,在多主题答案句抽取时,提高了4%的准确率。(4)基于多特征融合排序学习的答案句抽取。为了减少错误扩展信息带来的干扰与人工选择特征权重所带来的不稳定性,我们将L2R排序学习模型应用于高考观点类问题解答中。将扩展后的问题与原问题分别计算与阅读材料的主题分布一致性、内容相似性、观点句特征、BM25得分和Page Rank得分,将这些信息作为特征并融合,构建基于L2R排序学习模型。最后,使用训练好的模型来进行答案句抽取,选取排名前α条句子作为答案句。实验结果表明,在较大规模的测试集上,多特征融合排序学习方法比多主题答案句抽取方法提高了6.5%,达到了45.0%的准确率。(5)观点类问题答题系统实现。将问题扩展、排序学习及答案句抽取技术进行结合,将其应用于真实高考观点类问题解答中,通过对机器获取的答案进行人工打分,本文提出的答题框架在真实高考题数据集中可以达到42.1%的准确率。
其他文献
聚类分析是一种处理无类别标记数据的有效方法,在数据挖掘、信息检索、图像分割以及机器学习等诸多领域皆有广泛应用。大数据时代的到来使聚类分析面临许多新的挑战。例如,当
虾肝肠胞虫(Enterocytozoon hepatopenaei,EHP)是一种严格细胞内寄生的微孢子虫,属于壶孢目、肠胞虫科、肠胞虫属,可感染多种经济虾类,大多存在于虾肝胰腺小管上皮细胞。自2001年EHP被发现以来,世界上主要的凡纳滨对虾养殖地区都有虾肝肠胞虫病的报道,但目前仍然缺乏对EHP生活史和感染机制的了解。目前在微孢子虫孢壁中至少发现了7种蛋白,在EHP中已鉴定并报道了一种孢壁蛋白。
轴承作为旋转机械设备的关键部件,一旦发生故障会使得机械设备振动受到干扰,导致信号不稳定,严重时还会产生重大事故。随着机械设备规模及结构复杂程度的增加,机械设备的维护工作也变得越来越繁重和复杂,出现故障的种类和数量也越来越多。在实际生产中复杂机械系统的轴承出现故障时,振动信号常常表现为非平稳和非线性,并且掺杂大量噪声的特点,能否准确提取出这些特征信号是我们进行轴承故障诊断的关键,因此对轴承振动信号的
当今社会,随着经济的高速发展,城市化进程不断推进,城市人口数量也急剧增加,尤其是像中国这样的人口大国,许多一线二线城市,一系列高密度人口问题愈发突出。大型商场、露天广
商业银行如同生产企业一样,需要通过渠道向消费者提供产品和服务,从而实现其盈利的目标。因其经营领域的特殊性,商业银行主要依靠自身的营业网点和虚拟渠道进行销售活动。从
科学民主的政府决策是社会主义民主政治建设的重要任务,也是实现政府管理现代化以及加强政府自身建设的客观要求,而科学民主的决策离不开专业的决策咨询机构和社会公众的参与
近年微流道器件在生物芯片、微机电系统、光学应用等方面都展现出强大的市场潜能。传统的微流道器件主要通过光刻和3D打印等方法制备,存在耗时、成本高或分辨率低的问题,而高精度微流道器件的制造又存在工艺复杂、成本与实验环境要求高等难题,限制了该器件在产业及科研领域的深入推广。所以本论文提出了一种简单且经济的微流道器件制备方法,主要通过静电纺丝近场直写纤维主模制备PDMS微流道器件。围绕熔融近场直写取向纤维
可再生能源发电单元输出功率具有强不确定性且难于预测,高比例可再生能源接入互联电力系统必然对系统的稳定运行和电能质量造成不利影响。本文主要针对高比例可再生能源系统的负荷频率控制(LFC)开展研究。利用不确定性人工智能-云模型理论,旨在解决实际电力系统运行中不确定性引起的LFC控制器质量下降问题,以满足日益扩大的可再生能源接入规模,提高可再生能源的渗透率。本文首先介绍了云模型理论及其应用,并将云模型算
当前,我国正处于社会转型、经济转轨、观念转变的历史阶段,国内银行所面临的外部环境、约束条件和客户需求发生了前所未有的新变化,经营管理遇到了严峻挑战。这些变化和挑战
目的:本研究观察乌药水提液对IBS-D模型大鼠胃肠功能及血清脑肠肽Ghrelin、MTL、SP、Sec水平的影响,探讨乌药治疗功能性胃肠疾病的可能疗效机制。方法:将60只大鼠随机分成6组