基于段落与答案交互的问题生成方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:kms2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网和社交媒体平台与现代人的生活紧密相连,大量的文本信息随之出现,问题生成(Question Generation,QG)引起了越来越多研究者的关注。问题生成作为人工智能的一个重要研究领域,通过输入段落和答案的文本信息,生成针对输入序列相关的问题,问题生成对于帮助对话系统、自动诊疗等领域构建或扩充语义知识库,具有重要的现实意义。目前,基于深度学习的方法在自然语言处理领域,能够有效的提取段落和答案的交互语义,捕捉人工难以识别的特征。因此本文将从普通领域与中医药领域,对基于段落和答案交互的问题生成运用深度学习的方法展开研究。在普通领域中,针对目前序列到序列模型无法捕获到输入段落与答案之间的高层次交互特征信息,本文提出基于双编码和Top3输出指针解码的问题生成方法。通过双编码器对段落和答案文本进行编码,并通过改进门控自注意力机制汇总段落和文本交互信息,然后将编码后的语义信息输入到Top3解码器生成相应的问句。实验表明,该模型能够生成更具有针对性的问题,达到目前比较理想的结果。针对中医药领域,为了使模型能够更多获取段落和答案的交互信息,提升模型鲁棒性,本文提出了基于VATAE嵌入和语义覆盖的模型。针对段落内的答案信息,添加了答案嵌入层,使得模型能够更好的关注到中医药领域段落与答案的交互,并且提升了模型的效果和鲁棒性,缓解了曝光偏差这一问题。同时本文融入自蒸馏的半监督学习方法,解决了中医药领域文本数据资源较少这一问题,使模型学习到更多的段落和答案交互语义,在此基础上通过迭代实现效果提升。最后在中医药领域数据集上对模型进行了实验,并设置多组对比实验进行模型的分析,展现出最优的结果。
其他文献
个人信用支付产品,是依托互联网发展出现的一种消费信贷产品,由金融机构或者非金融机构以消费者的个人信用为基础对消费者发放的,用于购置耐用消费品或者其他费用的贷款,并由消费者定期偿还的信用支付工具。随着便捷支付的普及,司法实践中冒用他人个人信用支付产品的行为不断增多,定性上主要存在盗窃罪与诈骗罪的分歧。就性质而言,个人信用支付产品是消费信贷合同而不是信用卡。由于其形式上不具有发卡主体资格,实质上不具有
学位
随着人工智能技术的突破,多种类型的智能机器人被相继研发投入商业应用,移动机器人、情感机器人、服务机器人、网络机器人等应运而生,基于现行主客体二分的法律体系,智能机器人只能作为法律关系中的客体。然而,智能机器人是否享有法律人格学界鲜有争议。目前普遍的观点有“机器工具说”、“法人人格说”、“有限人格说”、“电子人格说”等。“机器工具说”否定机器人的主体资格,不符合法律人格的实质是人格的抽象化表达,“法
学位
司法解释“立法化”向来是学术界对于司法解释研究无法回避的一个重要课题,但其存在和运行的争议也十分巨大。在全面推进依法治国和构建现代社会主义法治国家的大背景下,司法解释及其“立法化”不论是在法律完善过程中,还是在司法实践过程中,都发挥着无可比拟的重要作用。因此,探索规范司法解释“立法化”的路径,最大限度地发挥司法解释的效能,梳理最高人民法院的基本职责范围与定位,让司法解释“立法化”在合宪、合法、合理
学位
在过失犯罪中,被害人在明知自己实施或者参与行为人某种行为存在风险,依然自愿参与进去或者实施该行为,就会导致被害人因个人行为而自陷风险,在被害人基于主观意愿参与到被行为人操控的风险内,且因为参与其中而导致自身法益被损的场合,被害人真正参与了造成法益侵害的因果流程,需根据期间是否运用被害人同意理论、与正犯相关的事实支配理论、社会相当性理论等进行不法排除。从形式上看,被害人同意与其基于主观意愿自陷风险极
学位
精神损害赔偿制度是民事责任中不可或缺的部分,在二元责任体系下认为,将精神损害的主张排除在违约之诉中,违约行为产生的精神损害如果满足侵权责任的要件,可以在侵权之诉中获得救济,违约精神损害赔偿无存在的正当性以及必要性。物质生活条件得到满足后人们开始追求精神上的愉悦,消费结构的改变也使合同的保护范围由经济利益扩展至精神利益。在违约之诉中主张精神损害赔偿的实务数量增长较快,仅用责任竞合制度不足以解决司法实
学位
我国关于让与担保合同的争议终于在民法典时代尘埃落定。《中华人民共和国民法典》(以下简称《民法典》)第388条对争议多年的让与担保合同的性质进行了明确,规定其属于“其他具有担保功能的合同”;从《最高人民法院关于适用<中华人民共和国民法典>有关担保制度的解释》(以下简称《民法典担保制度司法解释》)第68条可以看出,该司法解释对让与担保进行了更为细致的阐述,强调在完成权利变动公示后,认可让与担保具有担保
学位
随着数字经济的迅猛发展,数据成为生产方式和生活方式变革的重要驱动力,重要性不言而喻。数据商业价值的凸显和交易活动的兴起使实践中的企业数据争夺战愈演愈烈,学界对数据的法律属性和保护路径争议不断,企业数据权益的民法保护面临多重困境亟待破解。数据表现为数字代码符号,是大数据技术发展的基础,是信息的数字化表达。学界对数据具有财产属性的观点已达成共识,但对客体属性的争议较大,由此导致企业数据权益保护模式的选
学位
中国反腐败治理进入了新时期,对反腐败提出了新要求,但受贿罪的法条存在局限性,使之在应用时出现“举证难”等问题,2016年出台的司法解释未能解决现有的问题,应当回归诠释学路径,通过构造新法益,对受贿罪犯的具体应用进行合理阐释。第一部分,基于现有判例的裁判文书检索,得出16年的贪污贿赂司法解释并未在实务中很好运用这一结论,认为现有的司法解释使用率不高且未能解决疑难问题,应通过构造法益对其进行解释。第二
学位
承继的共犯是共同犯罪的一种特殊形态,其核心问题确定归责范围问题,即后行为人是否应当对先行为人先行实施的犯罪行为以及参与后共同实施的犯罪行为整个犯罪承担责任。绑架罪中需明确承继的共犯如何界定,主要包括了两类行为人,一类是实施绑架,另一类是勒索财物,两类行为人是否构成上述关系,对此司法实务界与学界有很大争议,其根源在于对绑架罪的行为构造以及既遂形态理解不一,如果认为绑架罪是单一行为犯,绑架行为完成时犯
学位
运动目标检测技术的主要目的是将运动物体提取出来,为后续的目标识别和跟踪等提供准确、有效的信息。在医疗领域、军事领域和交通领域等有着广泛应用。但在复杂场景下(如背景变化等)的准确率大打折扣,因此研究一种高效、精准的运动目标检测算法有着重要意义。为了能够准确提取运动目标,本文以视频图像的运动目标检测中的Vi Be算法为主要研究对象,工作概括如下:第一,针对Vi Be算法易受光照等背景变化影响、容易将移
学位