基于块语法的英文复句自动分解技术研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:wanghua035871
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言复句(长句)的自动分解与合成对机器翻译技术的应用具有重要意义。这是因为机器翻译作为一种复杂的自然语言处理技术,迄今尚未达到十分成熟的程度。许多机器翻译系统还不能很好地分析处理结构较为复杂的复句,但能够处理好简单句。因此,研究如何将自然语言复句自动分解为一组简单句以及将一组简单句自动合成一个复句,对机器翻译的实用化和推广应用,将具有极大的实用价值。 本文针对英汉机器翻译应用的需求,对英语复句的自动分解进行了研究,提出了基于块语法分析的英文复句自动分解方法。为此,首先研究分析了块语法的理论机制,探讨了其对识别分析英语复句结构的可行性;进而以形式化的角度分析了英语复句的结构,并以块语法的规则形式开发了英语块语法,设计实现了英语复句自动分解系统,进行了试验测试和结果分析。试验表明:基于块语法分析的英语复句自动分解的技术方法是可行的。 本文的创新之处是:提出了基于块语法分析的英文复句自动分解方法,该方法综合利用词性标注、命名实体识别、关联词识别、标点符号分析等各种关键的句子处理技术,在对句子进行语块分析的基础上将复句进行切分简化处理。为英语复句分解结果提供一个形式化表示,最后生成的简单句组合中有原复句结构信息表示。
其他文献
对于那些没有机会进入大学等高等教育机构的学生来说,想要为其提供世界范围内各种各样的教育,远程教育是最受欢迎的教育形式之一。像赞比亚这样的发展中国家,在没有足够的基础教
医疗档案管理是医疗机构管理和国家信息资源管理的重要组成部分。随着社会的不断发展,医疗档案重要性的日益增强,医疗档案管理也越来越受到社会各界重视。目前我国的医疗档案管
随着科技的进步和网络技术的飞速发展,已有的学习方式已不能满足现代人们快生活节奏的需求,移动学习和在线学习应运而生,成为一种新的趋势。微课程以其内容短小、集中,获取便
风电的大规模渗透,使分布式发电系统的自动发电控制(automatic generation control,AGC)必须应对自然环境不确定性所带来的影响,构建了风电机组参与频率调节的区域互联电网AG
期刊
随着信息技术和计算机网络技术的巨大发展,信息化已经成为人类社会经济发展的关键因素,政府部门的信息化建设在社会和经济的信息化中处于重要地位。因此,对政府实行政务信息
通过对关于社会网络、知识创新和开放式创新相关文献进行回顾,试图探索社会网络的不同类型、社会资本的不同维度如何影响知识创新。分析结果显示出社会网络不同因素与其成员
在Human Library服务中,图书馆、高校院系、高校社团协会、政府部门、民间非营利组织、媒体等都可成为图书馆的合作对象,合作内容包括真人书资源的共建共享、真人图书馆员的
目的探究肿瘤标志物CA724、CEA、CA242、CA199在胃癌检验中的临床应用价值。方法选取本院2015年2月到2016年2月收治胃癌患者450例作为胃癌组,选取同期患其他胃部疾病患者450
档案是人们社会实践活动的历史记录,是文化发展社会进步的历史见证。档案文献遗产作为一种人类社会的信息资源与知识载体,具有重要的历史文化价值与文化遗产的丰富内涵:是不可再