汉语阅读理解问答题解答研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:sdfcasdvgase
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
阅读理解任务是给定一篇文本,要求机器根据文本的内容,对相应的问题作出回答,是目前自然语言处理领域的一个研究热点,也是衡量人工智能水平的一个重要手段。本文以北京语文高考文学类阅读理解的解答为背景,对其中的问答题进行了分析与研究,主要工作如下:(1)高考文学类阅读理解问答题及其解答分析。本文对问答题的类别、难点、研究技术进行了分析,并将本文的研究重点确定为答案句抽取及句子融合两个关键技术。(2)答案句抽取。本文首先使用了三种语义相似度方法进行答案句抽取,分别为:基于HowNet的句子相似度,基于词向量的句子相似度,基于LDA的句子主题分布相似度。在人工标注答案句的高考真题中对三种方法进行测试,结果显示,基于词向量句子相似度的方法效果最好,其答案句抽取的F值可达49.08%。此外,答案句抽取也可以看做二分类问题,本文使用卷积神经网络(CNN)对句子进行分类,从而判别是否为答案句。通过在人工标注数据集上的训练及测试,结果显示,分类为答案句的F值为68.35%。(3)句子融合。针对阅读理解问答题,本文提出了一种兼顾信息量、问题关联度与句子流畅度的句子融合方法来生成答案。句子融合的主要思想为:首先,针对特定的问答题计算词重要度;然后,基于句子拆分和子句重要度选择待融合部分;再次,基于词对齐进行相同信息的合并;最后,利用基于依存关系、二元语言模型及词重要度的整数线性规划优化生成句子。在历年高考阅读理解数据集上的测试结果表明,基于词计算的句子融合的F值达到82.62%。(4)将答案句抽取及句子融合两项技术结合起来应用于高考问答题的解答,通过人工打分,本文提出的答题框架达到了30.84%的答题率。本文对中文文学类阅读理解问答题的研究进行了探索,主要贡献有:(1)尝试了多种技术进行答案句的抽取;(2)提出了面向阅读理解问答题的基于依存关系、语言模型及词重要度的句子融合方法;(3)形成了答案句抽取及句子融合的问答题解题框架。本文的研究为未来阅读理解问答题的进一步解答奠定了一定基础。
其他文献
随着互联网的普及和应用内容的丰富,网络流量已经从文本和语音为主变为视频和实时交互为主。传统网络架构面对复杂的业务类型和巨大的网络流量开始出现瓶颈。在这样的背景下,
视觉是人类获取外部信息的最重要的途径之一。随着机器学习技术的持续飞速发展,计算机视觉在军事领域、视频监控、交通安全、人机交互、体育运动等领域发挥着越来越重要的作
沥青混合料、水泥混凝土等传统路面材料在生产和施工过程中能耗高、废气粉尘排放多,对环境影响较大,且路面材料性能易受环境影响,耐久性和使用寿命不足。本文在形状记忆环氧树脂研究基础上,根据路面使用温度条件,研制一种具有适宜玻璃化转变温度(Tg)、常温施工、柔韧性和变形回复能力良好的高弹性环氧树脂路面结合料与混合料,并对其使用性能进行探索试验研究,以期丰富路面材料,促进路面技术发展。基于路面材料使用要求,
利用智能手机的各种传感器信息实现基于位置的服务,已成为移动互联网领域的一大研究热点。然而,大多数现有的室外定位方法只能获取到用户的物理坐标,而不能识别出用户所感兴
作为英语学科核心素养的重要组成部分,阅读在英语学习中占据着举足轻重的地位。本研究者通过回顾国内外研究者对于英语分级读物、分级阅读以及泛读的相关研究发现,大量的阅读分级读物有助于英语学习者语言能力的进步和阅读理解水平的提高。然而,在针对学生英语水平差异性较大的农村高中学校,利用分级读物开展分级阅读的教学实践与应用研究不足,以此开展的英语阅读教学活动实施的效果有待验证。基于此,本研究以输入假设、情感过
随着高考改革的不断深入发展,在教学的过程当中,我们需要构建全新的模式来开展相关教学活动,无论是教学思想还是教学方法,都与传统教学存在着较大的差别。而在高中学习当中,
随着感知设备和移动通信技术的发展,移动物联网应用逐渐被社会各行业所重视,在工农业生产、智能交通、智能家居、物流监控等领域有着广泛的应用。面向物联网的搜索应用在此背
随着国际贸易的深入发展,中国大量产品加入到国际竞争。在此过程中,用户手册的翻译起到了举足轻重的作用。作为与消费者直接沟通的媒介,用户手册及其翻译受到了商家与翻译爱
代理重加密是指由委派者生成关于受委托者的代理重加密密钥,然后将该代理重加密密钥发送给代理人,代理人使用代理重加密密钥将委派者公钥下的密文转换成受委托者公钥下的密文
物联网的概念自上世纪九十年代提出以来,一直受到国内外广泛关注,物联网技术研究也在不断趋于精细化。窄带物联网NB-IoT技术标准在今年六月份在韩国3GPP RAN会议上审批通过并