基于BERT的机器阅读理解方法研究

来源 :北京印刷学院 | 被引量 : 1次 | 上传用户:jfhz2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大型的预训练模型在自然语言处理中流行,一种“预训练-微调”的范式越来越多的应用在下游任务中,对一个预训练模型进行微调训练后就能取得不错的效果。预训练模型给科研工作带来巨大便利的同时,也朝着更大规模、更加普适的方向发展。同时,这也对使用模型的硬件环境提出了更高的要求,使得在一些边缘设备和计算能力受限的设备中训练或部署模型十分具有挑战性。并且在机器阅读理解任务中,获取大量标注的数据用于模型训练是十分困难的。为了解决数据集稀缺的问题,一种采用“预训练-提示-预测”范式的提示学习方法逐渐成为研究热点。提示学习将下游任务改造成预训练任务,使得模型能够充分利用预训练中获取的知识,从而提高模型的表现。BERT模型是当前热门的预训练模型,能够通过上下文内容动态表征单词,在文本分类、机器翻译、问答系统等机器阅读理解任务上都优异的成绩。然而BERT模型存在着模型体积大、推理速度慢的问题。本文在对BERT模型深入研究的基础上,对其进行优化改进,并且根据模型的特点探索其在提示学习方法上的表现。具体工作如下:(1)针对BERT模型参数量大、训练速度慢和不易部署的问题,本文提出了一种基于知识蒸馏的方法对模型进行压缩。在知识蒸馏的过程中,根据蒸馏的软目标和硬目标,制定相应的损失函数。同时本文对模型的结构进行优化,移除了嵌入层中的句子嵌入,将位置嵌入改为正弦位置编码。并且提出了一种隐藏层调度策略,缓解因参数量减少而造成的性能损失。本文优化了预训练任务中数据的处理方式,增加低频单词被掩码处理的概率。最后通过对比实验证明,改进后的BERT模型能够在少量性能损失的情况下,减少52.1%的参数量,提升25%的推理速度。(2)针对获取大量标注数据困难的问题,本文探究了一种基于BERT模型的提示学习方法,测试其在情感分析任务中的效果。首先对使用的任务数据集进行统计分析,得出各个单词在不同情感极性中出现的频率。然后根据统计结果制定出相应的提示函数和答案空间,将下游任务改造成预训练任务。最后通过实验结果证明,基于BERT模型的提示学习方法在零样本情况下准确率能够达到67%,在小样本情况下也能不同程度的提升模型性能。
其他文献
随着媒介技术的不断发展,以及数字化在社会生活中的渗透,人们原有的规矩和行为方式都发生着改变。在农村,年轻人由于具备较强的学习能力,能够快速适应数字化社会的发展,而年龄较大的亲代则难以快速融入数字化社会,由此农村社会普遍出现了子代对亲代的“数字反哺”。基于上述背景,本文对湖北省枣阳市T村8户家庭进行了深度访谈,并运用扎根理论分析访谈资料,探讨农村家庭内子代在微信使用上对亲代进行的数字反哺问题。对农村
学位
本文是关于擦漆工艺在实用木胎漆器中的应用研究,采用知识储备和经验总结的研究方法。擦漆工艺是漆工艺技法中的一种,即在胎体表面泽漆、擦净、荫干、细磨,反复多次直至胎体表面形成温润的透明漆膜。擦漆工艺有别于髹涂工艺覆盖胎体的效果,而是突显胎体的材质与纹理。经过擦漆的器物,不仅能使胎体拥有漆器特有的质地与手感,还能通过强化胎体的某些机理更突显材料自身的质感,提升实用器物的审美价值。论文从创作依据、实验过程
学位
在基于微服务框架构成的分布式云系统中,负载均衡是其核心组成部分,负载均衡策略及能力直接决定了云系统的运行效率。著名的CPA理论提出了在分布式系统中,Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性)对应着分布式系统的三个指标,而以上三个指标由于分布式系统的复杂性无法同时实现,其中可用性为本文讨论的关键问题。实际应用中一般对于A
学位
目的:探讨公立医院DRG-PPS支付方式下绩效管理遇到的问题与对策。方法:以某医院2021年实施DRG-PPS数据为基础,分析医保支付方式改革过程中医院绩效管理面临的压力,探讨适合的绩效管理优化方向。结果:通过组织架构、医疗质量把控、医保政策培训、病案质控、药耗管控、绩效考核、成本管理、信息化平台搭建等方式,形成适应公立医院面对医保支付方式改革的绩效管理路径。结论:在DRG-PPS支付方式下,公立
期刊
传统手工雕刻技术具有独特的艺术表达效果,在钞票、证券防伪和高档艺术品印刷中占有一席之地,但这种技艺存在门槛高、工作繁重和效率低下等问题。为探索解决这一问题,本文研究如何利用计算机算法在将连续调图像二值化为半色调图像过程中,模仿手工雕刻图像效果,用于印刷防伪和特效印艺图像生成,具有一定的应用和研究价值。本文在半色调加网算法设计中模仿手工雕刻笔法技艺,实现对原连续调图像的二值化处理,生成具有特殊雕刻效
学位
农业产业的发展在现代化进程中发挥着基础性作用,是国民经济社会发展的永恒主题。新时代我国提出实施乡村振兴战略,并将产业兴旺作为该战略的首要任务。本文着重探讨最基层一级的乡镇政府在推动农业产业发展中的作用机制,并以Z市L镇为案例底本展开研究。第一,L镇农业企业、农业专业合作社、家庭农场和小农户等不同类型农业经营主体在发展过程中的需求和困难有差异。L镇企业多为外地企业,因对本地情况不了解,在寻找土地、劳
学位
据调查统计资料表明,我国的恶性肿瘤患者日渐增加,我国已经成为名副其实的“癌症大国”。恶性肿瘤不但让病人身体上受到折磨,也给病人家庭照顾者带来较为严重的身心压力。但在医疗机构中,医生护士和病人亲属大多以患者的健康恢复为主要目标,忽略对家庭照顾者的关心。与此同时,强调助人自助的社会工作,能够利用小组、个案、社区活动为其提供支持,协助家庭照顾者处理在医院面临的困难。本研究以湖北省Z医院为例,将癌症患者家
学位
党的十九大提出了实施乡村振兴的目标任务,涉及到农村人口脱贫、基础设施建设、乡村治理体系、基本公共服务等各方面的内容,在此背景下,可以看出国家非常重视农民在乡村振兴中发挥的作用,而妇女是乡村社会的重要主体,既可以享受乡村振兴的成果,同时也可以参与其中成为乡村振兴推动者和建设者。村庄是农村妇女的主要活动场所,在村庄中开展活动,促进妇女对村庄事务的关注,即可以推动妇女有效地参与村庄治理,营造和谐的社区环
学位
乡村振兴战略为农业农村提供了新的发展机遇,其中提出的特色保护类村庄类型,为富有地域文化特色的村庄指明了新的发展方向——乡村旅游。少数民族村寨作为特色保护类村庄中的子类别,开展旅游项目之后,对增加村民经济收入,拓宽就业岗位,改善基础设施建设等诸多方面有着重大现实意义。但是,我国目前乡村旅游体系尚处于探索阶段,在实践过程中出现了生态恶化、景区趋同化等问题,因此在2022年中央一号文件中就明确提出“实施
学位
传统的多色胶印机墨色控制方法通常是基于单一的计算机系统,在实现远程控制和集中管理方面存在诸多不便。基于云-边-端的新的系统架构,研制新型的多色胶印机墨量控制技术对于进一步提升国产印刷装备的技术水平具有重要意义。本文设计了一种多色胶印机墨色云控系统,并对其关键技术进行研究。本系统主要分为墨量控制终端、图像采集设备和边缘计算平台三个部分。基于云、边、端系统架构,终端层实现墨量控制和印品图像采集任务,边
学位