基于注意力长短时记忆网络的中文词性标注模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:cai372751072
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的基于统计模型的词性标注存在人工特征依赖的问题,提出一种有效的基于注意力长短时记忆网络的中文词性标注模型。该模型以基本的分布式词向量作为单元输入,利用双向长短时记忆网络提取丰富的词语上下文特征表示。同时在网络中加入注意力隐层,利用注意力机制为不同时刻的隐状态分配概率权重,使隐层更加关注重要特征,从而优化和提升隐层向量的质量。在解码过程中引入状态转移概率矩阵,以进一步提升标注准确率。在《人民日报》和中文宾州树库CTB5语料上的实验结果表明,该模型能够有效地进行中文词性标注,其准确率高于条件随机场等传统词性标注方法,与当前较好的词性标注模型也十分接近。
其他文献
<正>卫生中职学校是为国家培养具有良好的职业道德、一定的科学文化知识和现代护理理念的实用型人才的专业学校。随着卫生中职学校改革的深入、学制的缩短,特别是理论教学时
<正>美国学者理查德·桑内特,是德国著名思想家汉娜·阿伦特的学生,而阿伦特又是海德格尔最得意的门生,桑内特在这样的师门背景下,并没有延续老师的道路,而是敢于对老师的观
<正>~~
会议
离心泵在石油化工生产企业应用十分广泛,运行中易发生各种故障。离心泵经过长时间运行,性能会下降,必须有计划的检查维修与保养。由于泵工作的动力较大,它的震动幅度相对也很
目前,中职护理专业多数学生缺乏对专业的学习兴趣,而兴趣是增强学习动机、培养护理能力的内驱力。教师要在护理专业教学中通过不同的途径和采用不同的方法激发学生的学习兴趣
本报讯 记者宋时飞报道今年以来,华东、华中部分省市电力供应偏紧。为缓解这一紧张形势,国家电网公司加大跨区跨省电力交易力度,全力支援江苏、浙江、湖南、湖北等电力供应紧张
报纸
2012年7月12日,中国乙肝随访与临床科研平台(China Registry of Hepatitis B,CR—HepB)在北京协和医院启动。
本文剖析了立德树人教育根本任务的内涵,论述了在医学院校的生物化学实验教学中进行德育渗透的必要性和重要性,阐述了如何在生物化学实验中进行道德品质教育。
目的了解天津市滨海新区居民对结核病防治知识的知晓情况,进一步完善滨海新区结核病防治策略,有效控制滨海新区结核病疫情。方法采用分层随机整群抽样的方法,于2015年8月在天
目的了解四川省结核病不同流行地区高中学生结核病相关知识知晓率及行为现状,为制定有效干预策略、降低结核病高流行地区疾病负担提供科学依据。方法在结核病高流行地区的马