【摘 要】
:
中文标点符号预测是自然语言处理的一项重要任务,能够帮助人们消除歧义,更准确地理解文本。为解决传统自注意力机制模型不能处理序列位置信息的问题,提出一种基于自注意力机
【基金项目】
:
教育部人文社会科学研究青年基金资助项目(13YJC860006);国家自然科学基金资助项目(61170112,61532006);北京市自然科学基金资助项目(4172016)
论文部分内容阅读
中文标点符号预测是自然语言处理的一项重要任务,能够帮助人们消除歧义,更准确地理解文本。为解决传统自注意力机制模型不能处理序列位置信息的问题,提出一种基于自注意力机制的中文标点符号预测模型。在自注意力机制的基础上堆叠多层Bi-LSTM网络,并结合词性与语法信息进行联合学习,完成标点符号预测。自注意力机制可以捕获任意两个词的关系而不依赖距离,同时词性和语法信息能够提升预测标点符号的正确率。在真实新闻数据集上的实验结果表明,该模型F1值达到85.63%,明显高于传统CRF、LSTM预测方法,可实现对中文标点符号
其他文献
目的:研究甲磺酸伊马替尼新辅助治疗胃肠道间质瘤(GIST)的有效性及安全性。方法:经穿刺活检病理学证实的,巨大的(最大径≥10cm)局限性GIST,或切除伴明显脏器功能损伤的GIST患者
单核苷酸多态性(SNP)是人类基因组中出现最频繁的一种遗传变异,目前已知的SNP位点已经超过900万。SNP在揭示疾病分子机制的关联研究中具有重要地位,而高通量关联分析对SNP基
<正>在今天这个盛行反基础主义或反本质主义的时代,讨论一个学科的基础或本质似乎显得不合时宜。但美学学科是个例外,因为它似乎没有坚固的基础或本质可供解构。自从18世纪获
自洽的相对论无规位相近似理论的自洽性要求有两方面的内容:第一,描述原子核的激发态性质和基态性质时必须从同一个有效的拉矢量出发;第二,相对论无规位相近似计算,不但要考虑正能
【目的】探讨小儿厌食症与睡眠障碍的相关性以及影响因素,为临床医师制定婴幼儿早期高质量睡眠提供预防和干预的有利依据。【方法】在兰州城关区1800例年龄在2~12岁的小儿中
β-木糖苷酶在完全快速降解木聚糖类半纤维素为木糖的过程中起重要作用。海栖热袍菌(Thermotoga maritima)是一个极端嗜高温厌氧细菌,所产耐热酶类具有非常可观的工业应用前
我国是世界上产出恐龙属种最多的国家,内蒙古、辽宁、云南、广东、四川、新疆、甘肃、河南、山东等省都相继发现侏罗纪-白垩纪的恐龙化石产地,其中较大规模的化石集群埋藏点
本文是超拒水、防紫外功能型织物的研究,其中包括两大部分的内容:一部分是织物防紫外性能的研究;另一部分是织物超拒水性能的研究。首先用正交实验法系统、定性地研究织物防紫外
近年来,中信出版社通过体制改革在中国的出版界中异军突起,其企业模式给我国出版业以新的视角,中信出版社的成功成为出版业又一值得研究的现象,中信出版社面临的挑战又给出版
分析国际汉语教育专业大学生在职业生涯指导方面的现状,指出解决目前本专业学生学习主动性不足、就业竞争力差等问题的主要途径,提出加强职业生涯规划的指导应在大学阶段采取