汉文-维吾尔文双语语料库中段落对齐技术研究

来源 :新疆大学学报:自然科学版 | 被引量 : 0次 | 上传用户:flymummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.
其他文献
目的:为充分利用玉米须植物资源,探讨玉米须总皂苷的提取工艺和影响因素.方法:采用乙醇浸提法并以齐墩果酸为对照品,紫外分光光度法测定总皂苷含量.结果:综合单因素实验和正交实
利用TEM,XRD,CO-TPR和比表面积的测定等手段对β-酸氢化反应体系的Pd/C催化剂活性进行了研究.结果表明,反应体系中Pd/C催化剂中毒的主要原因是表面活性中心被污染物覆盖而造成的活
利用光学吸收技术,测定了Li(2P)+H—LiH+H的反应截面.仅在LiH基态的v=0能级才发现有布居.通过吸收谱的测量,确定LiH(0,J)的转动态分布.由速率方程分析得到反应截面σ(J),总的反应截面为所有
近年来,钢结构建筑发展迅速,各种结构形式、异形截面构件大量采用,异形钢构件的简化计算需慎重考虑.对于钢结构错层处梁的常用几种形式的研究中,针对某钢结构错层处异型粱按简支集
胡红英。女,汉族,1969年出生,博士。新疆大学生命科学与技术学院副院长,教授,博士研究生导师。现兼任新疆动物学会理事、新疆植物保护学会理事、中国昆虫学会会员。
在许多平面解析几何的考题中,阿氏隐圆经常被“植于”题中,且不易被学生发现.文章对一道以阿氏隐圆为背景的线段最小值问题进行探究.
本文利用γ射线散射法研究了土层厚度对测量原油管道内油垢厚度的影响.实验装置由60Coγ射线的准直束、NaI(Tl)探测器和BH1324多道谱仪组成.同时结合蒙特卡洛(MCNP)程序模拟与之对
塔里木马鹿是国家Ⅱ级保护动物,马鹿众多亚种中分布于荒漠地区的特殊亚种之一.其分布范围十分狭小,仅分布于塔里木河中下游和车尔臣河下游地区.塔里木马鹿野生资源由于其栖息地的
本文提出了一个基于规则的哈萨克语词干提取的一种解决方法.该方法首先找到待切分词的所有可能的词干,然后以带变形词的词典和分类的附加成分表为基础,对找到的若干个词干进行词
近年来,平阴县通过完善水土保持配套法规体系、增强水土保持监督管理机构履行职责能力、规范水土保持监督管理工作、健全水土保持监督管理制度,做到了水土保持监督管理"五完