英语句子边界的识别

来源 :2002年全国机器翻译研讨会 | 被引量 : 0次 | 上传用户:swordhero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语句子边界的识别是英文文本分析的基本问题,是进一步进行英汉机器翻译的基础.本文采用了统计决策树与错误驱动相结合的方法进行英语句子边界的识别,首先通过决策树学习训练语料中的句子划分规则,之后用错误驱动的方法对所获得的结果进一步修正.对Penn TreeBank语料进行测试,正确率达到98.6﹪.
其他文献
本文是郑州大学化工实验厂的新产品A310Q氨合成触媒的使用报告.简单介绍了该触媒的使用情况并比较了它与A110的有关技术参数.
本文介绍了一个基于CFG的汉语句法分析器的模型,以及作者通过这个模型的实验提出的在求解一个汉语句子的句法树时用于消歧的最简结构原则.
本文总结了在译星多语翻译网站建立中,网上语言翻译改进的一系列策略.其中,对于翻译策略,提出了"语义优先"和"词组本位"的处理原则.
表示是否判断的语句是普遍存在的一种复杂的语言现象,是人类思维活动基本内容之一的是否判断在语言中的反映.作为HNC理论57组基本句类的一种,是否判断句(jDJ)旨在对这一语言现象进行了多维描述.本文通过对汉英对照语料的研究和通过对三个汉英机器翻译系统的错误分析,概括了是否判断句的几种主要类型,并尝试提出了汉英机器翻译中是否判断句句类转换和格式变换的一些规则.
本文用三个汉英机器翻译系统翻译了来自真实语料的一批含有动结式的汉语句子,然后分析得到的英语译文.分析的着眼点主要放在与动结式相关的成分的句法表现上.根据英语译句的表层结构信息,归纳出词语表达、结构表达、状语表达、定语表达、谓语并列、成分丢失,以及动补堆砌等七种表现汉语动结式的手段.然后分补语非虚化句和补语虚化句两类讨论各种情况.希望能够说明机器翻译汉语动结式的某些特点和结症.
大型电子词典的研制开发,可能需要较长的时间和不断的修订,如何有效地维护各个版本之间的数据一致性就成为一个很关键的问题.本文通过对数据进行自动比较,以直观的方式显示其变化情况,使校对者能够把注意力集中在发生了变化的部分,工作效率得以提高.同时通过其前的版本命名和其后的定版签名,使阶段性成果得以巩固,形成可以不断向前推进的工作流程.
本文选取了目前市场上常见的四种机译软件,以40句英文否定句为对象进行机译测试,运用语言学知识对其结果进行分析统计,对这四种机译软件进行了初步鉴定.
本文通过分析不同用户对机器翻译系统的需要和目前机器翻译技术开发面临的主要问题,提出了建立通用的机器翻译系统设计规范的设想,并给出了设计规范的雏形、希望借此规范机器翻译系统的开发过程.
目前汉英机器翻译中存在着几个主要问题,其中一些只有在句组平面上才能得到解决.本文从话语分析的角度讨论了这些问题并尽可能提出解决的办法.
理性主义方法和经验主义方法之争论由来已久,随着争论的进行,越来越多人意识别,将两种方法结合使用以便提高机器翻译系统的整体翻译质量是一种更好的思路.这样,如何将这两种差别如此巨大的方法很好地结合起来以解决机器翻译中的具体问题成了机器翻译界的研究新热点.本文探讨了结合使用理性主义方法和经验主义方法的几种方式,并将它们具体应用来解决汉英机器翻译中的英文生成选词问题,设计了一个结合理性主义方法和经验主义方