多策略汉维句子对齐

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tianwaiyun6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种错误抑制的多策略算法对齐汉维语句子.针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之问,利用标点符号和长度混合方法进行句子对齐.算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐.
其他文献
产品内分工是国际分工的最新形式。随着全球经济日趋一体化,跨国公司为降低成本提高效益,在全球范围内进行资源最优配置,产品内分工就是全球资源最优配置的结果。汽车业被称为一
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
路透社称,美国种子与农业化学巨头孟山都公司2月3日宣布,中国政府已批准进口其研发的新一代转基因大豆Roundup Ready 2 Xtend。这是孟山都开发的一种可同时耐草甘膦和麦草畏
Dissociation(Ds)transposon is one of thetransposable elements in corn.The trans-posons can be transferred into other plantswhere the transposons were not found.On
期刊
农业是国民经济的基础性产业。由于农业的弱质性和高风险等特点,世界各国政府都对本国的农业生产实施了各种名目的支持政策。同时,农产品的国际贸易也是各国贸易谈判中最艰难的
硕士学位论文《航天信息公司和航天科技公司主营产品结构调整的比较研究》共分5章:  绪论主要论述了论文的选题背景,分析了选题的理论意义与现实意义,勾画了论文的框架结构和
传统的资本资产定价模型(CAPM)(Shape(1964)和Lintner(1965))在给投资组合的定价中仅考虑了收益率的均值和方差两个因素,然而许多研究结果表明投资组合收益率经常不具备正态分
1994年我国实施分税制改革以来,我国的财政实力不断增强,尤其近几年来财政收入大幅增长,政府间的财政关系也日益规范,这为政府不断增强公共产品提供能力,建立公共财政体系提供了强
采用田间小区试验,通过2行玉米间作2行马铃薯、4行玉米间作4行马铃薯及相应单作试验,在玉米拔节期和大喇叭口期比较植株氮磷钾浓度和养分吸收量,研究玉米间作马铃薯中养分吸
The characterization of population structure ofblast pathogen contributes to the rational de-velopment and the deployment of blast-resis-tant cultivars. To stu