平行语料库中双语术语词典的自动抽取

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zx20060522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词短语生成侯选术语集。然后对每个英文侯选术语计算与其相关的中文翻译之间的翻译概率。最后通过设定随词频变化的阈值来选取中文翻译。在对真实语料的术语抽取实验中取得了较好的结果。
其他文献
亚当·斯密在《国富论》中有过这样一句话:“劳动是财富的源泉。”从生产力角度,也就是劳动者利用劳动工具,作用于劳动对象的过程,这是创造财富的真正力量。在市场经济条件下能够以劳动的形式创造财富的主体就是实体经济。作为国民经济的细胞,当前我国实体经济发展状况却并未与我们对财富的渴望程度成正比。  实体经济发展现状不理想。从生产资料所有制上看公有是主体,国有是主导,这一定位不能动摇。国有经济在发展中也面临
采用问卷调查法与访谈法,对淮北市城区民办幼儿园开展体育活动的现状进行调查分析。结果表明,淮北市城区民办幼儿园开展体育活动存在着时间不足、组织形式单调、园内体育场地设
器乐教学做为中小学音乐教学的一个重要组成部分,已经被正式列入国家教委颁发的《九年义务教育教学大纲》。器乐教学进入音乐课堂,改交了我国近一个世纪以来中小学音乐课只教
【摘要】高速发展的数学科学,其用性日益明显。根据数学的这一特点,在数学教学中不仅要传授学生繁杂的数学知识,更重要的是培养和发展其基本的技能,才能使学生今后更好地学习新的数学知识,并把学过的知识运用生产和科技领域,要做到这点,必须注重学生智力的开发。  【关键词】智力开发 发散性 解题思路  数学是小学教学中的一门主要学科,对于开发学生的智力,培养其灵活的思维能力和创造能力,提高少年儿童的素质,起着
过去的五年,极不平凡。经过五年努力奋斗,我国社会生产力快速发展,综合国力大幅提升,人民生活明显改善,国际地位和影响力显著提高,社会主义经济建设、政治建设、文化建设、社会建设以及生态文明建设和党的建设取得重大进展。  从今年开始,我们已进入“十二五”时期。“十二五”时期是全面建设小康社会的关键时期,是深化改革开放、加快经济发展方式转变的攻坚时期。  五年一个刻度,中国跃上新的台阶;五年一个单元,中国
<正>~~
人工神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的数学模型,广泛应用于自动控制、模式识别等领域.本文首先简单的介绍了人工神经网络的相关理论,接着重
<正>~~
神经外科病人病情重,昏迷病人多,生活自理能力差,还有些病人有精神症状,并发症多,病人及家属情绪变化大.神经外科重症监护室护士每天承受着巨大的心理压力,这无疑对护理工作
在建立统计语言模型时,往往会遇到词典的词汇量不够的问题.对于医学等专业领域的语料,这一问题尤为严重.针对这一问题,本文提出了一种新的基于统计的识别新词方法--右边缘扩