基于双向LSTM神经网络模型的中文分词

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:flyingfish521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文自然语言处理的基础。分词质量的好坏直接影响之后的自然语言处理任务。目前主流的分词是基于传统的机器学习模型。近年来,随着人工智能大潮的又一次兴起,长短期记忆(LSTM)神经网络模型改进了普通循环神经网络模型无法长期依赖信息的缺点,被广泛应用于自然语言处理的各种任务中,并取得了不错的效果。对中文分词,该文在经典单向LSTM模型上进行改进,增加了自后向前的LSTM层,设计了双向LSTM模型,改进了单向LSTM对后文依赖性不足的缺点;并引入了贡献率α,对前传LSTM层和后传LSTM层的权重矩阵进行调节,并设计了四个实验,验证了所建模型的正确性和优越性。
其他文献
影响企业发展的因素众多,激励机制是不可替代的重要因素之一。纺织企业多为劳动力密集型企业,激励机制在企业中的作用尤为突出。本文阐述了激励机制在纺织企业管理中的重要性
集体林权制度的改革产生了林权抵押贷款,林权抵押贷款是林业得以推进融资发展的一条重要途径。福建省与江西省在地理位置上相邻,拥有相似的地理环境、地域特点,并且都是林权
目的对比分析重组人干扰素α-2b阴道泡腾胶囊和重组人干扰素α-2b栓治疗高危人乳头状瘤病毒(HRHPV)亚临床感染的临床疗效和安全性。方法将138例高危型HPV亚临床感染患者随机
制造业是国民经济的基础产业,同时也是支柱产业,是一个国家经济实力与其竞争力的重要标志。智能化、数字化制造是将先进制造技术和数字化技术用于产品的全生命周期,实现产品的设计和功能的仿真。基于模型的定义(Model-Based Definition,MBD)技术是现今数字化设计的主流模式。工艺知识表达等已成为数字化设计模型向智能化工艺信息模型构建与规划的新需求。三维MBD工序模型的创建是现代化三维数字化
目的:探讨腹膜透析患者健康促进行为现状及影响因素,为提高腹膜透析患者健康促进行为水平提供科学依据。方法:于2019年2月1日至2019年8月15日选取在秦皇岛市2所三级医院腹膜
针对球形面喷涂成膜气液两相流动耦合过程,利用欧拉-拉格朗日法建立球形面喷涂成膜模型,模型包括连续相模型、离散相模型和撞击黏附模型,并采用多面体网格和SIMPLE算法对其进
家族性胰腺癌在过去鲜为人知,近十余年来,随着遗传性致癌基因的突变引起家族性胰腺癌逐渐被认同,并随着流行病学资料的积累,才被人们所了解。我院1995—2002年共收治4例,经
我国幼儿园的数学教育长久以来重点关注数学知识的传授,较少关注幼儿解决数学问题能力的培养,然而幼儿能够运用简单的数学方法解决生活中常见的数学问题对于促进幼儿理解数概
本文对02年服装生产和国内外市场及经济运行情况进行了分析,在此基础上预测了03年服装行业发展趋势。
会议
以夫妻共同财产出资并登记在夫妻一方名下的股权的归属问题在理论界一直存有争议,其是否属于夫妻共同共有至今未有定论。这不仅仅成为夫妻离婚时股权分割的一大难题,还涉及到