基于栈式降噪自编码和词嵌入表示的维吾尔语零指代消解

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:xinxinde1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对维吾尔语零指代现象,提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。首先由大规模无标注维吾尔语语料训练得到富含语义和句法信息的词嵌入表示,将其作为候选先行语和缺省零代词的语义特征;其次根据维吾尔语语言特点,抽取14项针对零指代消解任务的手工设计特征;然后融合word embedding特征和14项hand-crafted特征作为栈式降噪自编码的输入,最后经过无监督逐层贪婪的预训练和有监督的微调过程,使用softmax进行分类完成维吾尔语零指代消解任务。实验结果表明,与传统栈式自编码、浅层机
其他文献
在科技领域中广泛应用的双三次曲面,一般都按给定曲面特征点(又称控制点)求解,然而在不少实际问题中,例如地层层面的模拟,都是反过来,即知道曲面上的数据点,求解该曲面的特征
当前图像描述生成的研究主要仅限于单语言(如英文),这得益于大规模的已人工标注的图像及其英文描述语料。该文探索零标注资源情况下,以英文作为枢轴语言的图像中文描述生成研究。具体地,借助于神经机器翻译技术,该文提出并比较了两种图像中文描述生成的方法:(1)串行法,该方法首先将图像生成英文描述,然后由英文描述翻译成中文描述;(2)构建伪训练语料法,该方法首先将训练集中图像的英文描述翻译为中文描述,得到图像
本文对我国海上油田开发的可行性研究和经济评价中如何测算集输设施费用问题,用实际资料结合经济计量学方法,提出了三种测算式供实测选用,并建议用以油轮为主的测算式供今后
近来,关于实体经济税负成本的问题引起社会广泛关注。一时间,“死亡税率”“高税负逼走制造业”“税高费更甚”等观点喷涌而出,围绕着“死亡税率”掀起一场舆论激战。当前我国实
采用改进的半微量相平衡方法研究了La(ClO_4)_3·3H_2o—18c6—C_2H_5OH三元体系在25℃时的溶解度,测定了各饱和液相的检光率,结果表明有了三种化学计量的配合物(4La(ClO
2017年是供给侧结构性改革的深化之年。加大农村改革力度,激活农业农村内生发展动力,充分调动农民创新创业积极性,是推进农业供给侧结构性改革最根本的力量源泉。
"提升科技创新能力,推动战略性新兴产业蓬勃发展,大力发展先进制造业,注重用新技术新业态改造提升传统产业,促进新动能发展壮大、传统动能焕发生机。"3月19日,国务院副总理张高
<正> Haven 油田位于荷兰北海,于1980年发现。试采时日产525m~3流体。但由于水锥问题,在22h 内最大含水量达35%,加之由探边界所确定的藏量下降到不足原估计的1/6,仅有0.62&#2
本文提出了一个双原子分子的四参数势能函数。通过对28个不同电子态的双原子分子的计算表明,该势与RKR势能曲线的平均相对误差仅有1.0%。与其它几个经验势能函数相比较,该势在