融合人名知识分布特征的汉泰双语人名对齐

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:dragonlztf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语人名对齐方法研究直接影响到跨语言信息处理的效果,由于泰语与汉语的发音差异大,汉泰双语平行语料库资源有限,基于统计的音译人名对齐模型难以解决汉泰双语人名对齐问题,提出一种在音译特征基础上融合人名知识分布特征相似性的汉泰双语人名对齐方法。计算双语人名音译相似度特征,通过卡方检验等计算汉语人名与泰语人名的知识分布相似度特征,借助支持向量机学习汉泰人名翻译对的两种特征生成人名翻译对分类器,对分类器分类结果调优生成对齐结果。实验结果表明该方法在汉泰人名发音差异大和缺少双语语料资源支持的情况下取得了较好效果。
其他文献
三十年前的1972年2月底,中美两国政府发表了上海公报,美国在公报中声明"认识到""只有一个中国,台湾是中国的一部分".[1]1978年12月,中美建交公报发表,宣布"美利坚合众国承认
监察委员会的独立性地位,是由宪法法律来赋予的。要准确把握监察委员会的独立性地位,应该从国家监察体制改革初心和监察权的属性、人民代表大会制度的权力结构形态、"一府一
<正>一、宏观环境(一)2018年中国经济运行稳中有变,变中有忧,经济发展长期处于重要战略机遇期2018年是全面贯彻党的十九大精神的开局之年,在以习近平同志为核心的党中央坚强
在线性回归模型Y=Xβ+ε;E(ε)=0;cov=σ~2Σ;Σ〉0下给出了有偏估计β*(K,c)=c(X^TΣ^(-1)X+K)^(-1)(X^TΣ^(-1)Y+β*),其中K〉0,c〉0为参数,β*表示线性回归模型的广义最小二乘估计,讨论了这种
书籍艺术设计理念随时代不断演绎完善,本文从建筑设计的视野探究书籍形态设计的发展与演进,对比书籍形态设计与建筑设计的共性与不同,阐释书籍形态设计的建筑之美,并从中得到
现行法律法规要求董监高在公司债券发行文件上签字,承诺募集说明书真实、准确和完整,是强化董监高勤勉尽责义务及相应法律责任的一种手段。但现行公司债券董监高签字要求存在
为了充分协调"依法裁判"与"个案正义"之间的张力,裁判理由的获取需要遵循一种从问题性思维向体系性思维逐渐过渡的开题程序。其中,"问题性开题"负责"裁判论据"的开放性寻找,"
目的:建立高效液相色谱法测定人血浆中马来酸氟伏沙明浓度。方法:以安定为内标,待测血浆样品经乙醚萃取后,用高效液相色谱法紫外进行检测。色谱柱为Discovery RP Amide C18(5μm,15
本文采用熔体抽拉法制备了直径4050μm,长度510cm的多晶Ni50Mn25Ga25-xFex(x=16)纤维。研究了制备态和热处理态纤维的微观组织、马氏体相变、超弹性和形状记忆效应、磁性能及磁
本研究从高职学生口语教学考核评价体系展开,从"课证融通"的视角分析了存在的问题,进行了归因分析,提出了把三一口语证书考试融入英语口语教学考核评价体系,提高学生实际应用英