基于英汉平行语料库术语词典的自动抽取

来源 :电脑知识与技术:学术交流 | 被引量 : 0次 | 上传用户:chibi2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注。统计双语语料库中的名词和名词短语生成候选术集。然后对每个英文候选术语计算与其相关的中文翻译间的翻译概率。再通过设定阈值过滤掉一些与该英文候选词无关的中文翻译,最后通过贪心算法选取概率最大的词作为该英文候选词的中文翻译。
其他文献
随着智能卡应用的推广,为克服广泛投入使用的芯片在容量方面的不足,该论文研究并分析芯片COS的文件读写编码算法,按照I2C总线规约写入字节的可读性与可控性。设计一种有效的
该文通过对某市财政系统的政府网络现状的分析,提出了基于热备路由协议的可靠性网络设计的解决方案。在文中对主要的可靠性协议一热备份路由协议的实现原理进行的详细介绍,同时
本文从前辈学者有关贺兰山岩画的研究成果出发,分别对贺兰山岩画的断代问题、空间分布情况、内容分类以及贺兰山岩画的美学等四个方面进行文献综述。
存在不完整的、不一致的和含噪声的数据是现实世界大型的数据库或数据仓库的共同特点.基因表达数据也存在这种情况。因此,在数据挖掘之前对基因表达数据进行预处理非常必要。
2012年3月,我们从乌鲁木齐出发,前往阿克苏地区新和县。飞越天山山脉时,我从飞机的舷窗看到被白雪覆盖的连绵起伏的山脉,从未有过的一种震撼在心中油然而生。在群山间一块巨大的
世界的目光,聚焦太平洋西岸、东海之滨、钱塘江畔——9月5日,二十国集团领导人第十一次峰会在杭州圆满落幕。
该文首先介绍了工程实践中利用VC进行串口通讯的一种常用方法,同时提出了利用API函数开发串行通讯对此方法进行改进,得到两种新方法。
针对Windows操作系统计算机提出简单实用的安全防护措施和安全配置方法。
[摘要]吴忠西郊唐墓位于宁夏回族自治区的吴忠市新区,唐朝属于灵州所辖,灵州在历史上有“塞北重镇”、“历代粮仓”的称谓,其重要性不可忽视。2003年,考古发现前后共清理出唐代砖石墓120座,其中包括18具未成年(小于15岁)个体,为研究唐代下层阶级儿童提供了很好的实物材料。  [关键词]吴忠唐墓;未成年人;墓葬文化  [中图分类号]K878.8 [文献标识码]A [文章编号]1005-3115(20
据phys.org网站1月11日消息,近日NASA研发团队演示了太空X射线全自主导航技术,利用毫秒脉冲星精确定位以每小时数千英里运动的物体的位置.此次演示证明了X射线脉冲星导航作为