双语平行网页挖掘系统的设计与实现

来源 :计算机工程 | 被引量 : 0次 | 上传用户：lidongying

【摘要】

：

针对双语语料是开发统计机器翻译系统的重要资源，提出一种从网络中自动挖掘双语平行网页的方法。与传统从指定网站中挖掘平行网页的方法不同，该方法从整个互联网中自动挖掘平行

【作者】

：

陈伟黄蕾刘峰赵志宏

【机构】

：

南京大学软件学院

【出处】

：

计算机工程

【发表日期】

：

2009年14期

【关键词】

：

自然语言处理统计机器翻译双语语料网络挖掘 natural language processing statistical machine translat

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对双语语料是开发统计机器翻译系统的重要资源，提出一种从网络中自动挖掘双语平行网页的方法。与传统从指定网站中挖掘平行网页的方法不同，该方法从整个互联网中自动挖掘平行网页，对新的语言对和内容领域有很强的适应能力，实现双语平行网页挖掘的系统。实验结果显示，该系统可以为统计机器翻译系统提供大量高质量的平行网页。

其他文献

新常态下企业如何迎接新发展——CIMT2015参展企业高端访谈——达诺巴特：为中国用户提供完整的自动化解决方案

第十四届中国国际机床展览会（CIMT2015）于2015年4月20～25日在北京中国国际展览中心（新馆）成功举办。全球业界知名机床工具企业及其代表们汇聚于此，开启了全新的机床工具创新展示之

期刊

中国用户参展企业国际机床展览会自动化中国国际展览中心机床工具工具企业

我国ETFs的运作状况研究及前景分析

ETFs(Exchange Traded Funds)是可以在交易所交易的基金。自从1989年第一只ETFs出现后,尤其是1993年美国的第一只ETFs——SPDR诞生以来,ETFs正式进入资本市场。在短短的十多

学位

ETFs指数基金跟踪误差折溢价率50ETF

《战狼Ⅱ》的启示

《战狼Ⅱ》是今年电影市场的一个奇迹。它的成功是爆炸性的，反响也是爆炸性的，引发的话题比这个酷暑还要火热。　　《战狼Ⅱ》一举驱散了半年多来笼罩在中国电影市场上的阴云，不仅打破了目前中国电影市场的最高票房纪录，也继《血战钢锯岭》《摔跤吧！爸爸》等引进片现象之后，成为主流观众期待已久的国产现象级电影，让人们再次沉醉于电影艺术为社会所“喜闻乐见”的同时，也为国产电影提供了更加广阔的想象空间和迷人前景。　　

期刊

中国电影市场国产电影电影艺术想象空间爆炸票房

标准模型下的安全短签名方案

提出一个新的短签名方案，证明该签名方案在适应性选择消息下是不可伪造的。将该签名方案的安全性归约到q-SDH问题的安全性。对方案的有效性进行分析，将其与目前最新的在标准模

期刊

数字签名标准模型双线性对digital signature standard model bilinear paring

全域旅游背景下区域产业融合发展探究——以河北省兴隆县为例

本文以兴隆县全域旅游建设为背景,对兴隆县旅游产业融合发展现状进行实证研究;对全域旅游下兴隆县发展旅游产业融合的可行性进行分;对兴隆县近五年旅游业和相关行业的灰色关

期刊

兴隆县全域旅游旅游产业融合灰色关联分析

数据清理中同体不同源数据的数化算法研究

在数据仓库构建的数据清理过程中，同体不同源数据的发现一直是清理过程的难点。在现实情况下，存在的单一实体在不同的数据源中以不同的方式进行存储或者表达的同体不同源数据，传

期刊

同体不同源数据数化数据清理Same entity from different sources（SEDS） Digitization Data clean

中国健康信息数据集的一种本体处理架构

针对中国健康信息数据集规范不支持语义集成、自动处理和推理，在Description Logics数学基础上，提出一种基于本体数据库的知识基（KBS）处理架构。该架构将健康信息数字化建设纳入

期刊

健康安全隐私本体数据库知识基healthcare security privacy ontology database Knowledge Base（

零件加工时静液压工装的应用

本文以一种壳体零件车床工装设计方案为例,介绍了一种利用轴向移动作为液压源的新型夹紧方式,该种夹具结构紧凑、稳定可靠且便于安装调试.

期刊

工装设计壳体零件静液压应用工时夹紧方式结构紧凑安装调试

股票型开放式基金实证研究

随着我国国内银行利率的下降以及证券业的发展,投资基金特别是规模日益增长的开放式基金逐渐成为人们投资的热点和重点,对我国的开放式基金的业绩进行评价分析也由此成为经济

学位

股票型开放式基金业绩评价业绩持续性

高光泽不锈钢抛光溶液

用所发明的溶液抛光不锈钢可以提高其表面的光泽度15％左右，而且可以进行大批量生产，处理成本低。该溶液由质量分数为40％－75％的硫酸3－60g/L的谷蛋白及水组成，溶液的电导率高。

期刊

高光泽不锈钢抛光溶液光泽度质量分数谷蛋白水组成电导率

双语平行网页挖掘系统的设计与实现

与本文相关的学术论文