关于双语语块规范的几个问题

来源 :第十一届全国民族语言文字信息学术研讨会 | 被引量 : 0次 | 上传用户:shanwq1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前语块库的构建越来越受到重视,但对语块标注和部分句法分析的研究还比较少,对双语语块的研究则更少。这样,在构建双语语块的过程中,势必会遇到一些问题,这些问题很难用一个简单的规范来解决。本文在亲自标注两万句汉英语块的基础上,列举了习语、歧义、词性标注错误等六个问题,并对其进行了相关论述。这些问题的解决对于语块标注规范的制定,以及语块库的构建工作都会有所帮助。
其他文献
一九五三年,我们到了抗美援朝的前线。在灾难深重的年代,与英勇的朝鲜人民亲密地会见,这是一生难忘的。我们为朝鲜人民斗争的胜利而高歌,也为朝鲜人民所遭受的侵略而愤慨!时
本研究采用SSR分子标记方法,分析了36份制干辣椒品种资源间的遗传关系。从36对SSR标记中筛选出12对进行电泳分析,这12对引物扩增条带清晰且多态性丰富。分析结果表明:12对SSR
“矿床讲座”从今天起和读者见面了。这时候,北京正在举行全国第一次职工科学技术普及工作极积分子大会,动员职工向科学技术进军。广大职工都在热烈地响应党的号召,努力学习
在自然语言处理研究中,知识表示、知识获取是核心课题。建立知识系统的主要问题就是通常所说的知识的获取和表示。只有对自然语言知识进行高度形式化的充分描述,才可能建市起
会议
導言病理生理学是醫學的基礎理論科學之一,它的任務是研究疾病發生的原因(病因學)、疾病發展過程和歸轉的規律(發病機制),即恢復健康(痊愈機制)和死亡的規律。簡言之,病理生
本文介绍了多语言农业知识处理平台的基本结构,其中遇到的几个基本问题:控件中的民族语言显示问题,语言模型与翻译模型训练问题,翻译通信问题。本文对这几个问题提供了解决方
本文给出了ISO国际标准《语言资源管理:面向单语种和多语种书面语信息处理的分词──第一部分:一般原则与方法》中的核心概念体系,以期征求意见并改进之。
本文主要介绍了《蒙古语及三少民族语言语料库资源管理平台》建设课题的研究背景和内容,提出了蒙古语及三少民族语言资源管理平台的建设目标和规划,主要包括《蒙古语语料库语
本文针对民族语言消亡现象日趋紧迫的现状,提出采用多模态语料库进行濒危语言抢救的方法.首先比较了文本语料库、语音(口语)语料库和多模态语料库,指出多模态语料库在语料内
本文通过多方面的分析,提出了古维吾尔文(察合台文)文献数字化整理系统构建中察合台文的转写为现代维吾尔文所需要的关键技术、基于UNICODE的转写符号方案.初步探讨了察合台