汉藏辅助翻译研究与实现

被引量 : 0次 | 上传用户:taixiangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学技术突飞猛进、信息量急剧增加的当今社会,新鲜事物不断充斥着我们的生活,驱使我们的社会和个人都须及时更新和掌握新的知识和技能,以适应社会的高速发展。在学习接受新的外来事物的过程中翻译起到了至关重要的媒介作用。藏语文是藏民族地区最重要的交际工具和文化载体,若要使多数藏族群众通过藏语文获知社会各方面的信息,则必须要做大量的翻译工作。另一方面,大量用藏文记载的关于西藏的灿烂文化和悠久历史等各类信息也迫切需要被翻译成汉文或其他语言文字,以便被更多的人获知并得以传播,从而进一步推动西藏地区经济、社会、文化等各方面的发展。然而目前的藏文翻译工作仍然是采用纯人工方式,计算机只是简单的充当译文录入的工具,对翻译过程并未起到任何辅助作用,因此翻译人员的工作效率比较低,翻译能力远远不能满足社会发展对藏文信息的需要,导致很多有用的汉文或其他语言文字信息都不能及时地被藏族群众获知,与此同时诸多藏文信息内容也无法被外界熟知。因此翻译工作者迫切需要一种高效的翻译工具,来缓解当前的翻译需求。人们希望无需人工干预仅靠计算机就能够全自动高质量地实现不同语言之间的互译,自然语言处理领域也长期对机器翻译作了深入的研究,但是目前的机器翻译水平比较低,实用性较差。而通过人机协作进行翻译的计算机辅助翻译工具却能在一定程度上提高当前的翻译效率,用人机交互式的翻译工具辅助翻译工作,缓解与日俱增的翻译需求。所以研发汉藏辅助翻译系统顺应藏族地区社会发展的趋势,是当前急待解决的一个突出问题。从学术角度看,汉藏辅助翻译研究也是藏文信息处理领域非常有意义的研究课题,具有一定的复杂性和挑战性。汉藏辅助翻译系统的研发将积极推动藏文信息处理技术的发展,丰富辅助翻译技术研究内容,促进计算机科学、藏语文等学科及其交叉学科发展。由于藏文信息处理研究起步较晚,且对藏文机器翻译的研究尚处在初级阶段,藏文自动分词、藏文机器翻译、计算藏文句子相似度等的算法和相关语料资源都相当欠缺,很多基础性研究工作尚未完成,可以借鉴和能够直接应用的资源都相对较少,因此论文在研究设计汉藏辅助翻译系统时不得不从最基础的工作做起。论文通过深入细致地研究,在前人研究的基础上设计并实现了汉藏辅助翻译藏文预处理用藏文自动分词算法,且该算法具有较高的切分精度,达到一定的实用化程度;提出了汉藏句型转换翻译算法,借助汉藏相同句型的结构特征可高效地实现汉藏双向翻译;改进通用的编辑距离算法,在辅助翻译过程中能够为用户找到与原文相似度较精确的翻译实例;结合以上研究成果论文设计并实现了能够进行汉藏双向翻译的汉藏辅助翻译系统,为汉藏翻译人员提供了高效便捷的汉藏辅助翻译工具。
其他文献
近年来信息无障碍技术越来越受到关注,它主要研究如何帮助老年人和残障人士自由参与社会活动,而基于头势的人机交互是信息无障碍研究领域中的一个热点,因此基于头势的智能轮
医保覆盖率的逐步全面化、老百姓生活水平的稳步提升,人民群众对健康的需求标准和期望上升,长期自主择医的看病方式造成大量患者涌向综合医院,三级医院看病拥堵,基层医疗机构
近几年来我国的洗涤剂工业发展迅猛,其中阴离子表面活性剂所占比例大于70%以上。以烷基苯磺酸钠为代表的阴离子表面活性剂,其主要特点是稳定性良好、降解性能较差,当其随着生
航空航天、国防军事等一些尖端技术领域对自润滑关节轴承的使用越来越广泛,关节轴承在这些领域中的工作工况较为复杂,往往承受高摆频、重载荷以及复合摆动的共同作用而失效,
全球500强之一的德国汉高公司,是全球最大的胶粘剂生产和销售商,公司提供包括烟用胶粘剂在内的几乎所有的胶粘剂产品。汉高烟用胶粘剂在除中国市场之外的市场占有率达到85%,
西藏区域经济发展具有非常特殊的区域属性,今后如何从特殊的区域属性出发,选择一条具有中国特色的反映西藏区域特点的新型经济发展道路,就成为全国人民瞩目的焦点。本文主要
目的探讨乳腺癌患者治疗期间疾病适应行为的特征和变化趋势。方法采用质性研究中的现象学研究方法,应用半结构式深入访谈和现场观察法对方便抽样获取的15例乳腺癌改良根治术
本文的研究对象是西班牙黄金世纪的经典小说《堂吉诃德》。在疏理四个世纪以来浩如烟海的学术史的基础上,作者提出的问题是:信与不信,即塞万提斯究竟是“罗马教会忠诚的儿子
森林土壤碳在陆地生态系统碳循环中占有重要地位。森林土壤有机碳库的变化及其对陆地生态系统和大气CO2的源汇效应越来越受关注。经济林是森林资源的重要组成部分,国内研究者
随着我国经济的持续发展,产业集群已经成为区域经济发展的重要支撑力量。国内外学者对产业集群及中小企业融资的研究表明,一般情况下,企业融资结构应为内部融资、债务融资,最