一种高效的基于启发式规则和词典相结合的双语词对齐方法

来源 :沈阳航空工业学院学报 | 被引量 : 0次 | 上传用户:yecaifa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法,该方法充分利用现有资源,同时考虑到了后续的应用问题。实验表明,该方法在训练语料规模较小的情况下,取得了较好的对齐结果。
其他文献
随着现代工业高精密加工技术和科学的发展,对产品和材料的无损评价要求也越来越高。无损检测和评价领域越来越依靠光学解决方案,以提供高精度非接触式测量技术。激光超声检测
中国目前存在着房地产过剩的问题,出现了房地产库存量逐年上升,大量商品房空置的现象。基于当前中国房地产业存在过剩问题的事实,文章运用马克思"相对生产过剩"理论细致阐述
电子商务在经济市场中的快速发展与广泛应用,给各国经济带来了重要影响,推动了国际经济与贸易的快速进步。在提升交易效率,节省交易时间和成本的同时,电子商务也使得各国贸易
针对飞行器健康状况难以准确预测的问题,结合GM(1,1)模型和MGM(1,n)模型的各自优点,提出了基于组合预测模型对飞行器健康信息进行预测的新方法。首先对由声发射传感器募集到的飞行器
目的观察美敏伪麻溶液(惠菲宁)联合苏黄止咳胶囊治疗感染后咳嗽的临床疗效及安全性。方法选择2014年6月至2016年6月在内科就诊的感染后咳嗽患者60例为研究对象,按随机数字表
为了深入研究改型对跨声速翼型气动性能的影响,对NASA SC(2)-0614翼型进行多种方案的改型,包括前缘半径、厚度、弯度、翼型上表面形状等,并得出最终优化改型方案。数值模拟结果表
针对人工免疫木马检测中检测器的冗余,检测过程中成熟检测器和记忆检测器在检测到自我抗原或年龄过大时,被直接删除造成的非我信息资源丢弃等问题,引入限次变异对检测器的生成进