基于神经网络纠正器的领域分词方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wenshicai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于神经网络的中文分词方法,以提高分词系统向新领域迁移的适应性和灵活性。该文方法采用了对现有分词器分词结果进行纠正的思路。这种基于纠正的两阶段方法与分词模型解耦,避免了对源领域语料和分词器构建方式的依赖。然而现有的基于纠正的方法依赖于特征工程,无法自动适应不同领域。该文利用神经网络对纠正器进行建模,在无需手工设计特征的情况下即可实现领域适应。实验表明,与当前方法相比,该文方法在领域文本上具有更好的分词性能和鲁棒性,尤其在未登录词召回率方面提升显著。
其他文献
中国共产党第十九次全国代表大会作出了中国特色社会主义进入新时代的重大判断,把习近平新时代中国特色社会主义思想确立为党必须长期坚持的指导思想,对开启现代化新征程进行
舞蹈是一门源于生活、表现生活的艺术形式,舞蹈教学能够帮助学生塑造形体、培养各方面能力,对学生的全面发展具有重要意义。基于此,本文就职业中学民间舞教学与学生创新能力
文本复述判别是一个重要的句子级语义理解应用。该文提出了一个轻量级的基于记忆单元的单层循环神经网络模型,并结合语义角色标注知识帮助进行英文文本复述判别。使用单层的
Full-length nucleoproteins from Ebola and Marburg viruses were expressed as His-tagged recombinant proteins in Escherichia coli and nucleoprotein-based enzyme-l
6月1日,美国总统特朗普宣布退出《巴黎协定》,并表示将开始新的谈判,建立对美国相对公平的标准后再进入《巴黎协定》。这份声明即刻生效,美国将会停止行使一切巴黎协议有关的
<正>Dear Editor,The packaging of viral genomic RNA into virus par-ticles is a critical step for virus maturation.This stepincludes the recognition and interacti
领域自适应研究的目标是建立一种动态调整翻译模型,使翻译模型对目标领域的语言特征具备较强的学习和处理能力,借以保证翻译系统在不同领域获得平衡可靠的翻译能力。现有翻译
Dear Editor,Prototype foamy virus(PFV)belongs to the genus Spumavirus in the Spumaretrovirinae subfamily of Retroviridae.Although PFV and HIV have much in commo
Hepatitis B virus (HBV) biosynthesis is primarily restricted to hepatocytes due to the governing of liver-enriched nuclear receptors (NRs) on viral RNA synthesi
中共中央政治局近日就维护国家金融安全进行第四十次集体学习。习近平总书记在主持学习时强调,金融安全是国家安全的重要组成部分,是经济平稳健康发展的重要基础。