汉维时间数字和量词的识别与翻译研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:hongwei3330857
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计机器翻译对时间、数字、量词的泛化能力较弱,为了提高汉维机器翻译系统对时间、数字和量词短语的翻译性能,该文利用双语语料库挖掘并提取汉语时间、数字、量词表达与翻译模式,实现了基于模板的时间、数字、无歧义量词翻译方法及基于上下文的有歧义量词翻译方法。时间、数字、无歧义量词、有歧义量词的翻译F值达到了93.23%、90.15%、96.55%、87.58%,实验证明,该方法具有简单高效的优点。
其他文献
记得大学时代,我和周围的很多同学一样,手捧一本“红宝书”,背着那些极其陌生而又枯燥的英文单词,为得就是取得TOFEL或GRE的好成绩,梦想有朝一日去大洋彼岸的美国。但随着毕业后疲
今年的六月,上小学的儿子特别高兴,因为除了“六一”儿童节,端午节也放假!六月的天渐渐热起来,我把新买的田园风格的桌布、椅垫、沙发抱枕等统统都换了出来。碎花绿叶看上去相当
动态情感知识的获取,特别是领域相关极性词典的构建一直是意见挖掘和情感分析系统在开放应用时面临的主要挑战之一。该文面向产品评价文本提出一种汉语情感极性词典扩展方法。该方法首先采用序列标注方法从意见文本中抽取产品意见要素,同时构建属性-评价对;然后,对抽取的属性-评价对进行正规化,以减少词典扩展中的复杂性和噪声;最后,改进PolarityRank算法的构图方式以使其适用于汉语文本,从而完成词典扩展。在
本文系统地介绍了利用NI公司的软硬件测控产品开发卫星测试系统,以求提高卫星测试的可靠性和在线分析能力,降低测试成本.
(一)人生自古 谁无死 死了 也是种自私 亲人 会悲伤 自己怎悲伤
万户桃符伊始齐 十分萌子淡装宜 待到惊蛰抽丝雨 去看黄花正应期
本文分析了在工程应用中元器件失效的原因,并提出了相应的解决方案.
色相皆空,城廓河山尽幻影;烟云过眼,神仙富贵了无痕。观以上对联仿佛是一幅笔墨酣畅的水墨画,不由得令人浮想连翩。本人出生于战乱年代,为避免日寇烧杀,生后三天便逃荒,为此
在线媒体快速发展,为用户带来丰富多彩信息的同时,用户的参与也给在线媒体本身带来巨大的经济利益。因此,如何通过精确预测用户的偏好以增加在线媒体点击,成为一个学术界和工
该文针对手写维文字符识别中字符宽高比变化剧烈,单一模板归一化后提取字符特征,不能有效增加异类字符之间的差异性,提出了针对维文字形特点的多模板归一化算法。训练阶段,由多模板归一化字符图像,提取特征并训练对应分类器;识别阶段,用主笔画散度方向作为维文字形参数,对不同字形选用最优模板进行归一化处理后提取特征,并送入该模板对应的分类器。多模版归一化有效利用了手写维文字符字形特征,克服了单模板归一化时异类维