结合预训练模型和语言知识库的文本匹配方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:xeno
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本匹配任务,该文提出一种大规模预训练模型融合外部语言知识库的方法。该方法在大规模预训练模型的基础上,通过生成基于WordNet的同义-反义词汇知识学习任务和词组-搭配知识学习任务引入外部语言学知识。进而,与MT-DNN多任务学习模型进行联合训练,以进一步提高模型性能。最后利用文本匹配标注数据进行微调。在MRPC和QQP两个公开数据集的实验结果显示,该方法可以在大规模预训练模型和微调的框架基础上,通过引入外部语言知识进行联合训练有效提升文本匹配性能。
其他文献
德国的建筑法规有其独特严谨的体系,其州级建筑法规以联邦模式建筑法规为蓝本。本文介绍了德国模式建筑法规2016版修订后各州(市)转化情况,以柏林建筑法规为例,分析了德国地
密码保护是传统的并且最为广泛应用的网络安全保护方法,然而,面对随着高科技犯罪带来的更严峻的网络安全形势,密码保护方法不再能满足用户的需求。一旦账号密码被盗取,那么用户个人信息面临着被入侵的危险。所以密码保护是一个极其重要,且迫切需要解决的问题。文章提出的基于高斯算法的密码智能识别认证技术是一种密码保护方法,它能有效解决上述问题。文中设计了一种新的基于嵌入式的密码保护系统,能够从软硬件结合的角度有效
历史上,杭州的文人们特别喜欢结社,比如明代杭州的诗社就特别多。其实,宋代杭州诗社也很多,这些诗社大多是"行都士夫及寓居诗人"所结,一般以西湖为社团活动中心。这些诗社对文
10月11日,国际知名的云计算服务提供商Orange公司在北京召开媒体见面会。会议的主题是"让云计算实现您的商业价值",该公司全球服务部及全球通信服务部高级副总裁、
当前,建筑行业"招工难""用工荒"现象加剧,此次新冠肺炎疫情的暴发更是对传统建筑企业的开工和生产带来较大困难。今年全国两会期间,全国政协委员、碧桂园集团董事局主席杨国
聚焦核心素养,基于终身发展和社会发展两方面的需要,五年制高职语文综合实践活动以重思维发展与提升、语言构建与运用、审美鉴赏与实践、文化传承与理解四方面为评价标准,框
回顾和探讨了地下水允许开采量、可持续开采量和安全开采量的概念和内涵的演变,综合考虑社会、经济、技术、资源等多方面约束,定义了安全开采量,并详细剖析了其区别于以往地下水
国际洪水管理大会( International Conference on Flood Management)原名为“国际防洪大会”( International Symposium on Flood Defense),是具有国际影响力的防洪减灾研讨会,至今