散文阅读理解选择题解答研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:liongliong506
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,阅读理解问题研究已成为问答系统研究的热点问题。与以往的问答系统在大规模文档集合中检索答案不同,阅读理解问题更侧重于对单篇文档的深入理解,除了使用信息检索技术还需要更多的自然语言处理技术来进行解答。目前对于阅读理解问题的研究大部分针对选择题,尤其是面向实体等具有简短答案的简单事实类问题。然而,在真实的高考场景中,阅读材料与题目都很复杂。如:散文就是北京语文高考中常见的一种阅读体裁,这是传统NLP很少研究的类型。同时,考察的题型包括问答题和选择题,题目设置相当灵活,十分复杂。本文针对北京高考散文阅读理解中的选择题解答方法进行研究。本文主要分为以下四部分:(1)散文阅读理解选择题分析。从题目形式、考察内容、难点三个方面对高考散文阅读理解选择题进行分析。(2)基于语言模型的解答策略。使用一元语言模型和二元语言模型计算文章对每个选项的支持度,依据支持度计算的结果对选项进行排序,从而对选择题进行解答,取得的召回率为32%。(3)基于启发式信息的解答策略。该方法的主要思想为:(1)基于选项划分信息将选项划分为原文陈述子句和观点理解子句;(2)基于情感极性信息对选项进行初步排除;(3)针对观点理解子句使用反常度信息进行计算,依据反常度计算的结果对选项进行排序。解答的召回率为60%。(4)对选项进行基于SVM的多标签分类。从选项的类别定义和自动分类方法两方面进行研究:(1)将选项划分为概括总结类、因果类、关系推断类、思想情感类、语言鉴赏类、共五个类别;(2)使用融入词汇,语义,语法等一系列特征的词袋模型和利用神经网络训练的词向量累加模型对选项进行表示,采用了基于SVM的Binary Relevance算法和基于SVM的Classifier Chains算法对选项进行多标签分类,标签的完全匹配数为40%。本文的贡献有以下几点:(1)提出并尝试了基于语言模型的解答策略和基于启发式信息的解答策略对选择题进行解答。(2)提出了选项分类任务,定义选项类别体系,尝试了基于SVM的选项多标签分类方法。
其他文献
改革开放三十年来,我国西部地区经济生活和社会结构发生了巨大的变化,与此相应的法律文化观念也有了一定的提高.在社会管理法治化背景下,西部地区复杂的民族成分,多样的宗教
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
随着电子商务的发展以及互联网的广泛应用,网络食品交易也备受广大消费者的青睐。《食品安全法》《消法》《侵权责任法》及相关法律法规规定了平台提供者应承担的民事责任,但
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
科学学科作为一门重视实践成果的学科,对于理性思维的要求比较高,在进行科学实验的过程中,数据信息是整个实验最重要的关键,所以必须重视对于科学实验过程中数据的分析与利用
一口流利的英语离不开大量的词汇积累,掌握一定数量的词汇是学好英???语的基础,否则,阅读、翻译、交流都无法顺利进行。何种教学法,能使小学生更容易地接受并掌握单词?本文提
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
目的:分析肺癌合并肌无力综合征(ELS)的临床特点并进行文献复习。方法:1965~1995年我院收治8例肺癌合并ELS病例,其中SCLC 6例NSCLC 2例;NSCLC Ⅱ期1 例,Ⅲ期1例,SCLC局限期6例。治疗
自2003年以来受伊拉克战争以及'非典'疫情的影响,加之恐怖主义活动的猖撅,以及世界经济形势的相对低迷,进而又有禽流感的疫情……作为全国惟一不设门票的4A级旅游区