构建集成系统:基于规则与统计数据的机器翻译

来源 :广东商学院 | 被引量 : 0次 | 上传用户:yfyzp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译的发展从最早提出理论设想到今天已经经历了六十多年的历史了。如今主流的机器翻译算法主要分成两大阵营:基于规则以及基于统计数据的机器翻译。基于规则的机器翻译核心是依赖于预先人工设置的语法规则模块作为语法分析的凭据;而对于基于统计数据的机器翻译来说,翻译的核心就是网络爬虫的文件扫描归类机制,以及该机制所创建的动态参考数据库。也就是说,基于规则的机器翻译是模块性系统,而基于统计数据的机器翻译是基于过程类系统。本论文从乔姆斯基语法的视角下阐述基于规则的机器翻译系统独特的模块化处理优势以及在具体自然语言处理上的不足,并从奈达对翻译过程的理论的视角下分析基于统计数据的机器翻译系统的过程优势以及语法分析不稳定的劣势。本论文通过结合基于规则的翻译系统的“图书馆”和“语法分析器”以及基于统计数据的翻译系统的“爬虫”(也称漫游)机制来建立一个集成模块优势和过程优势的系统,通过将图书馆的语法机制融入奈达的翻译步骤来解决基于统计数据翻译系统中的语法分析不确定性,弥补前者在自然语言处理上的不足以及后者在语法分析上的薄弱。本文最后勾勒了机器发展将来以图书馆和语法分析器为借鉴,以爬虫建立后备资料数据的趋势,并在系统和接口硬件上集成的趋势以及展望
其他文献
本文对ASP.NET的特性和优势、应用程序的结构、数据访问做了探讨,论述了ASP.NET的多方技术优势和优良的程序结构以及方便高效的数据库访问机制。
地方政府在落实中央政策和谋求自身发展的过程中,通过多种渠道筹措资金,加大举债和投放力度,促进了区域经济的迅速回暖和各项社会事业的快速发展,尤其是在基础设施和城市建设方面
进入21世纪,人类社会迈入信息时代,随着经济全球化、政治多极化、网络信息化和文化多元化趋势的迅猛发展,我国的职业教育迈入了新的发展时期,面临着许多新的挑战。当前我国职业教
类风湿关节炎是一种病因未明的慢性、进展性、侵蚀性的自身免疫系统疾病。早期治疗尤为重要。现代临床治疗主要以非甾体类抗炎药、激素、免疫抑制剂和生物制剂对症治疗为主,
目的采用改良和优化的护理服务措施,观察改进后的方案在体检静脉血采集中的应用效果,并分析相关因素。方法纳入同一批次的需要集体体检静脉采血的人群300例。随机分为两组。
从广义上来说,阐释学可以定义为“一门对于意义的理解和解释的理论或哲学"。阐释学对于翻译研究的关照主要表现在:理解是历史的,文本意义具有开放性,允许多元阐释的存在;理解者和
采用透射电子显微镜和扫描电子显微镜观察了苯乙烯-丁二烯-异戊二烯三元橡胶(SIBR)增韧制备的具有超高冲击强度的高抗冲聚苯乙烯(HIPS)的微观结构,发现SIBR增韧HIPS的形态结
汉蒙词典历史悠久,早在13世纪随着汉族与蒙古族交际日益频繁,汉蒙词典就已问世。从古到今,汉蒙词典作为在汉族与蒙古族语言交际之间架起的桥梁,发挥了应有的作用。随着人类社
随着我国经济的不断发展,人们的生活水平不断提高。人们居住水平也在不断的变化着,小区的安全防范系统也是保障小区居民能都安居乐业的重要保障。小区安全防范系统的全面升级
风险认知往往被作为风险分析、风险评估、风险决策、风险管理、风险治理的基础与前提。为了更好地把握国际传播学领域中风险认知研究的概况及其前沿进展,本研究基于WOS核心合