【摘 要】
:
随着深度学习的兴起,大量数据的产生,包括文本、语音、图片等等,如何从大量数据中学习到有用的特征是当前最重要的组成部分。在自然语言处理领域,学习文档表示对精确理解自然语言至关重要,同时可以把其运用到各种自然语言处理的任务中去,包括文本分类,文本相似度匹配,命名体识别等等。本文围绕循环神经网络与BERT模型开展研究,对这两个网络架构的输入或者输出进行优化,提高模型的泛化性能,并在文本分类任务上进行研究
论文部分内容阅读
随着深度学习的兴起,大量数据的产生,包括文本、语音、图片等等,如何从大量数据中学习到有用的特征是当前最重要的组成部分。在自然语言处理领域,学习文档表示对精确理解自然语言至关重要,同时可以把其运用到各种自然语言处理的任务中去,包括文本分类,文本相似度匹配,命名体识别等等。本文围绕循环神经网络与BERT模型开展研究,对这两个网络架构的输入或者输出进行优化,提高模型的泛化性能,并在文本分类任务上进行研究,验证分类算法的扩展性。本文的成果与主要工作如下:1.针对长短期记忆网络训练文本分类任务效果不佳,为更好地学习文档表示训练文本分类设计了带池化与dropout的长短期记忆网络来进行文档的表示,其中池化操作可以保留主要的特征同时减少参数和计算量,同时获得定长输出;dropout也对有监督的学习文档表示起到防止过拟合,提高泛化性能的表现。对比词袋模型、卷积神经网络、长短期记忆网络等模型,在四个数据集上优化后的长短期记忆网络比直接利用长短期记忆网络在准确率上至少提升0.2%。2.针对目前在自然语言处理领域表现较好的BERT模型存在输出层softmax产生类别的概率分布过于单一;同时受mixture softmax的启发,对BERT的softmax层进行优化,改用改进版本的mixture softmax,利用集成的思想对每个softmax的输出进行加权求和,在四个数据集上的效果比BERT-Base模型的准确率提高1%以上。
其他文献
<正>经过多次整治和严格监管,视频直播平台涉黄现象得到有效遏制,但类似乱象却悄然向音频直播平台蔓延。不久前,国家网信办会同有关部门针对网络音频乱象启动专项整治行动。
当极端灾害引起大停电事故时,可协同多种电源和储能快速恢复重要负荷,提升配电网韧性。首先探讨多源协同故障恢复对配电网韧性的提升作用,然后以最大化负荷的加权供电时间及
镁合金作为目前世界上最轻质商用金属结构材料,在轨道交通、航空航天、国防军工、汽车轮船等领域具有广阔的应用前景。镁合金生产制造常常涉及到焊接技术。但是采用传统熔化
<正>在台北故宫的二、三层展厅中,展出了一幅幅描绘中国大好河山美景的山水名画,其中有一幅举世无双的名画,那便是赵孟頫的《鹊华秋色图》。《鹊华秋色图》高28.4厘米,横93.2
近年来,越来越多的审计失败事件被曝光,使得人们逐渐丧失了对注册会计师行业的信任;同时,全社会也加大了对注册会计师与被审计单位合谋行为的关注力度。
随着数字技术的发展尤其是4K技术的快速发展和4K数字摄影机在电视剧前期拍摄的大量应用,电视剧的制作流程在不断变化,调色作为后期制作流程一个重要的环节越来越受到重视。现
<正>内皮素(endothelin,ET)由Yanagisawa在1988年分离、纯化并命名,是迄今为止发现的在人体内缩血管作用最强的内源性血管收缩肽。目前,已发现ET家族的4种亚型:ET-1、ET-2、E
目的:观察安胃饮治疗脾胃虚弱型妊娠恶阻的临床疗效。方法:对46例符合诊断标准的患者给予安胃饮治疗。结果:46例患者治愈40例(87%),好转5例(11%),无效1例(2%),总有效率98%。
目的:探索缩短溃疡性结肠炎(乙状结肠-直肠)得到临床缓解的恢复时间的方法。方法:溃疡性结肠炎(乙状结肠-直肠为主)患者药物灌肠治疗的病例158例,随机分为两组:A组:康复新液5
本文通过对SQL的执行计划方面进行切入,结合执行计划的各个方面来进行相应的实验和分析,从而达到提高ORACLE效率,和解决时下由于数据库功能和规模的扩大与数据库性能调优的复