汉文-维吾尔文双语对齐语料库的实验性研究

来源 :第十一届全国民族语言文字信息学术研讨会 | 被引量 : 0次 | 上传用户:llllgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文阐述了汉文-维吾尔文双语对齐语料库的构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法。本文所实验的语料库收集汉文-维吾尔文双语句子对齐语1000句左右,可进行汉文和维吾尔文关键词检索,查询语料库中的汉文-维吾尔文维对译句子,进行汉文-维吾尔文句子对比分析研究。
其他文献
本研究采用SSR分子标记方法,分析了36份制干辣椒品种资源间的遗传关系。从36对SSR标记中筛选出12对进行电泳分析,这12对引物扩增条带清晰且多态性丰富。分析结果表明:12对SSR
“矿床讲座”从今天起和读者见面了。这时候,北京正在举行全国第一次职工科学技术普及工作极积分子大会,动员职工向科学技术进军。广大职工都在热烈地响应党的号召,努力学习
在自然语言处理研究中,知识表示、知识获取是核心课题。建立知识系统的主要问题就是通常所说的知识的获取和表示。只有对自然语言知识进行高度形式化的充分描述,才可能建市起
会议
導言病理生理学是醫學的基礎理論科學之一,它的任務是研究疾病發生的原因(病因學)、疾病發展過程和歸轉的規律(發病機制),即恢復健康(痊愈機制)和死亡的規律。簡言之,病理生
本文介绍了多语言农业知识处理平台的基本结构,其中遇到的几个基本问题:控件中的民族语言显示问题,语言模型与翻译模型训练问题,翻译通信问题。本文对这几个问题提供了解决方
本文给出了ISO国际标准《语言资源管理:面向单语种和多语种书面语信息处理的分词──第一部分:一般原则与方法》中的核心概念体系,以期征求意见并改进之。
本文主要介绍了《蒙古语及三少民族语言语料库资源管理平台》建设课题的研究背景和内容,提出了蒙古语及三少民族语言资源管理平台的建设目标和规划,主要包括《蒙古语语料库语
本文针对民族语言消亡现象日趋紧迫的现状,提出采用多模态语料库进行濒危语言抢救的方法.首先比较了文本语料库、语音(口语)语料库和多模态语料库,指出多模态语料库在语料内
本文通过多方面的分析,提出了古维吾尔文(察合台文)文献数字化整理系统构建中察合台文的转写为现代维吾尔文所需要的关键技术、基于UNICODE的转写符号方案.初步探讨了察合台
目前语块库的构建越来越受到重视,但对语块标注和部分句法分析的研究还比较少,对双语语块的研究则更少。这样,在构建双语语块的过程中,势必会遇到一些问题,这些问题很难用一