多策略汉维句子对齐

来源 :计算机科学 | 被引量 : 0次 | 上传用户:livos
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召
其他文献
目的探讨心脏瓣膜置换术后早期康复指导的临床效果。方法回顾性分析2018-10—2020-03间在汝南县人民医院心胸外科行心脏瓣膜置换术治疗的54例患者的临床资料。依据术后护理方
随着经济上升的还有人们对于生活品质的追求。社会不断发展使得大众文化素养与审美意识都得到明显提升,传统简单的室内环境设计已经无法满足大众的情感需求,人们对于居住的空
PLC编程是一种数字运算操作的电子系统,专为在工业环境下应用而设计,是机电专业必修课程之一。在中国智造的基础上,PLC编程人才培养已成为各个中职学校工程类专业的重点培养
采用LS—DYNA软件对汽车吸能盒进行了8种方案的准静态仿真研究.分析了不同诱导结构、不同材料的填充物对吸能盒的压溃模式、载荷变化和能量吸收情况的影响,并选出方案6为最优方
由于所设计的轿车转向节形状复杂,设计前须先在辊锻机上制坯,然后再在压力机上进行锻造.结果表明,设计工艺方案成形效果理想,且对具有弯曲、孔洞和较大落差特征的复杂零件的锻造生
针对铁路客票自动识别研究中票号与背景难以分离的票号分割问题,提出一种基于改进的离散KL变换(DKLT)的彩色铁路客票票号分割方法。首先,将彩色客票图像进行DKLT,然后,选择主要的特征信息进行图像重构,并采用三维空间直方图来检验处理后票号在图像中的聚类效果来滤除背景,最后,辅助以合适的形态学运算进行票号的有效分割,为铁路客票的识别提供条件,实验结果表明了该方法在铁路客票票号分割应用上的可行性。
车载传感器网络是一种建立在车载自组织网络基础上的以数据为中心的新型移动传感器网络。与传统传感器网络不同的是,车载传感器网络中的节点是高速移动的,从而导致网络间歇连
基于样条函数拟合曲面响应面法,给出确定实验点和拟合响应面的方法,提出一种适用于响应面的一次二阶矩优化算法.算例表明,所提出的拟合曲面响应面算法具有使用简单和计算精度
进入数字时代,真实生活与虚拟空间交织在一起,公共空间与私人空间的界限日益模糊,借助数字技术与软件,数字媒体艺术在空间中的表现形式也发生了改变。以及 90 代以来艺术家对
本文以“植树问题”的教学为例,论述小学数学高阶思维能力的培养策略,建议教师寻找知识点的内在联系,让学生的思维由“单点结构”衍生为“多点结构”;让学生动手画图,培养学