基于单语语料的面向日语假名的日汉人名翻译对抽取方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:jianglihongnj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体的翻译等价对在跨语言信息处理中非常重要。传统抽取方法通常使用平行语料库或可比语料库,此类方法受到语料库资源的质量和规模的限制。在日汉翻译领域,一方面,双语资源相对匮乏;另一方面,对于汉字命名实体,通常使用汉字对照表;对于日语纯假名的命名实体,通常采用统计翻译模型,此类方法受到平行语料库的质量和规模的限制,且精度低下。针对此问题,该文提出了一种基于单语语料的面向日语假名的日汉人名翻译对自动抽取方法。该方法首先使用条件随机场模型,分别从日语和汉语语料库中抽取日语和汉语人名;然后,采用基于实例的归纳学习
其他文献
针对材料早期微损伤检测这一热点问题,基于导波在固体中传播的波动方程以及固体力学的非线性理论,利用 Murnaghan 模型进行电磁超声非线性有限元仿真分析。通过模拟不同程度
运用聚集度指数法、频次分布检验法、线性回归方程检验法探讨云南松一种重要害虫,即中华松针蚧成虫的空间分布型及抽样技术,揭示其成虫的行为、习性、活动规律,确定了其在林
目的探讨四联疗法治疗幽门螺杆菌(HP)阳性胃溃疡的临床效果。方法选取2016年2月~2018年2月在我院接受治疗的78例HP阳性胃溃疡患者,按照就诊顺序分为观察组(n=39)与对照组(n=3
鹅的繁殖是维持养鹅再生产的重要环节,因此掌握鹅的繁殖技术,对于提高鹅群质量,推广良种,扩大饲养规模具有现实意义。1种鹅的选择总的要求是:具有突出的该品种(系)的外形特征,体质健
衡阳盆地形成受基底构造控制,沉积厚度大,“盆”“岭”反差大,盖层伸展构造为矿液运移提供了通道和储集空间;盆地四周和盆内不同期次的岩浆热液活动为成矿提供了热源和物源;NE向、
用GC/MS和GC/FTIR分析了聚合物驱油田采出水及其生物膜法生化处理水中可被XAD系列树脂富集的有机组分,并用超滤技术测定了COD的分子量分布.结果表明:两次采集的生化处理进水
李渭心学仁体论建构于对治理学僵化和王学末流玄虚的时代语境中,是在心学视阈内对理学有限度的回归和对传统仁学与阳明学的融合发展。李渭心学仁体论的内涵包含仁的内在主体
吴耀宗先生是中国基督教的杰出领袖,中国基督教三自爱国运动的主要发起人。
现如今,随着人们健康意识的日益提高和人工智能技术的逐步成熟,人工智能技术在医疗领域的应用已经在理论和实践上取得了诸多成果。无疑,以人工智能技术为内核的智慧医疗模式
本文简要的列举实例就高考中集合问题的常见考查题型与解题技巧进行分析,以期为提高学生的集合问题解决能力与质量的提升提供参考。