基于栈式降噪自编码和词嵌入表示的维吾尔语零指代消解

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:J2EE_BOY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对维吾尔语零指代现象,提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。首先由大规模无标注维吾尔语语料训练得到富含语义和句法信息的词嵌入表示,将其作为候选先行语和缺省零代词的语义特征;其次根据维吾尔语语言特点,抽取14项针对零指代消解任务的手工设计特征;然后融合word embedding特征和14项hand-crafted特征作为栈式降噪自编码的输入,最后经过无监督逐层贪婪的预训练和有监督的微调过程,使用softmax进行分类完成维吾尔语零指代消解任务。实验结果表明,与传统栈式自编码、浅层机器学习的支持向量机和人工神经网络相比,栈式降噪自编码的F值分别提高了4.450%、10.032%和8.140%,实验结果验证了该方法的有效性及栈式降噪自编码在任务中具备挖掘高层面鲁棒性语义特征的优势。
其他文献
基于偏离-份额模型的分析,本文发现产业结构变迁中要素重置效应对我国经济增长有提升效果,并分析了产业结构变迁中要素重置效应对第三产业的影响模式,得出相关结论。
以InGaAs/GaAs应变量子阱材料为例,讨论了量子阱结构中的应变效应,用k·p微扰理论给出包括重空穴带、轻空穴带和自旋-轨道分裂带相互作用和考虑应变作用的6×6 Lutti
南朝学者颜延之和沈约都曾注释过阮籍的《咏怀诗》,《文选》收录《咏怀》十七首,李善为这组诗作注时,即以颜、沈旧注为基础而稍加补充。按照《文选注》对采用旧注的体例规定,
水力压裂是在高压粘滞流体或清水作用下地层内裂缝起裂与扩展的过程。由于包含岩石断裂和流-固耦合等复杂问题,对该过程的数值模拟具有相当大的挑战性。本文建立基于有限元与
为解决气田高含硫污水易造成土壤污染、管道腐蚀以及污水处理难度增大等问题,提出将超重力技术应用于含硫污水处理领域,设计并搭建了一套超重力氮气气提脱除S2-的实验装置,探
本文结合实验室的实际情况,对连续流动法测定烟草中总氮含量的测量不确定度进行评定,分析了总氮含量检测误差的影响因素,计算了不确定度分量及合成不确定度,并得出测量结果扩
根据采动岩体渗流力学的观点,矿井突水溃沙是液固两相流失稳的体现。基于CFX数值模拟软件建立裂隙水沙两相流数值模型,通过模拟与分析得到裂隙尺寸、沙颗粒直径和液相流速对
对热处理、酸洗磷化连续作业线工作原理、设备情况解剖分析,对各工位工艺参数进行设定。实际生产作业说明.该钢丝热处理、酸洗、磷化连续作业线,可以实现金属制品大盘重周转加工
阐述了国内外滚切剪技术的发展过程及现状,分析了滚切剪在滚切导向技术、结构设计、定尺装置、电控技术、自动优化剪切等方面的技术进展。为了提高国内滚切剪装备的技术水平,提