日-维机器翻译系统中词典的研究

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:uj_mosquito11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日-维机器翻译输入的原文是日文语句,通过自动执行日-维翻译处理软件,输出的译文是维文语句.在日-维机器翻译系统中,词典占据极其重要的地位.机器翻译的各个过程,从自动分词,语法分析,语义分析到目标语的生成等都需要频繁地访问词典.词典的组织,既要考虑到分词,又要照顾到分析与生成,如何提高系统的速度等.
其他文献
虚拟现实技术(VR)在近年来在大量领域得到越来越广泛的应用。作为一种可以给人同时提供视觉、听觉和触觉等多感官信息的交互技术,虚拟现实中不同感官信息的相互协调对其沉浸感有很大的影响。本文来源于虚拟现实环境开发实践,针对不同运行环境中VR系统的多感官信息同步问题,提出一种同步控制模型,用来在多感官信息之间协调控制,重点解决了VR环境中声音与图形的同步控制问题,提高VR系统的沉浸感、以及鲁棒性和可移植性
本文首先介绍了网格,在此背景下阐述了对网格进行模拟仿真的必要性和重要性。构造网格系统是一项极为复杂的系统工程,需要考虑许多实际问题,网格仿真模拟就是这个工具,通过仿真,模拟实际环境中的各种应用,以此研究不同问题,分析其可行性。本文针对目前网格仿真的分类,着重介绍了当前一些主流网格模拟器,分析了其主要用途、工作原理、性能评价,以及仿真网格的应用。
本文研究的机器人视觉系统主要应用于国内的烟草物流企业卷烟辅材配盘系统。该系统能够实时、精确地完成在卷烟辅材配盘过程中目标盘纸的图像采集、图像处理、图像定位,计算出盘纸在平面上的偏移量,为机器人对盘纸的精确抓取提供视觉引导,从而成功地解决了烟草物流企业盘纸配盘由人工配盘向机器人自动化配盘发展过程中的难题。
本文提出了一种新的二维自适应小波变换,对更新算子和预测算子分别进行设计。更新部分,主要是基于Gemma Piella等人的工作,利用多决策重新设计更新算子,使所得低频信号更加保持原有信号的特点;预测部分,根据图像的局部梯度信息和给定的阈值自适应的选择预测方向和预测算子.与自适应更新小波和CDF53小波相比,本文所得分解图像熵更低,为零高频系数更多,更加满足某些图像压缩的需要。
以计算机为核心、计算机网络为传输媒介的视频传输系统越来越引人注目。本文介绍了传输协议RTP/RTCP、服务质量QoS、组播Multicast和用来视频解码回放的DirectShow技术。最后给出了在Internet环境下实现此系统的具体方法和流程。
随着图像传感器技术的发展,多传感器图像融合已成为图像理解、计算机视觉以及遥感领域中的一个研究热点,广泛应用于自动目标识别、智能机器人、遥感、医学图像处理和制造业等领域。像素级多传感器图像融合获取的原始信息量最多、检測性能最好、应用范围最广,是各级图像融合的基础.本文给出了像素级多传感器图像融合的概念。总结了常用的像素级多传感器图像融合方法,讨论了像素级多传感器图像融合的现状、应用与意义。
语料库的开发、应用和管理需要元数据作为交流平台.以便明确、显著地表达各个语料库在资源存储、组织和内容描述上的基本特征.本文介绍了元数据和两个广泛使用的元数据标准--都柏林核心集DC和文本编码提案TEI及其在语料库中的应用,并探讨元数据在汉语语科库中的应用问题.
一个公司通常拥有多个名称,比如中英文全称和缩略名称等.这为中文命名实体识别、信息抽取等带来了很多困难.为解决这些困难,本文提出一种利用Web信息建立公司名称知识库的方法,该方法基于链接分析的假设,利用网站主页的特点,自动搜集主页周围的各种公司名称,建成知识库,并在这个知识库基础上开展一系列的应用.实验表明本文方法建立的知识库可以应用于公司名称的归一,名称的扩展等各个方面,对于公司名称的识别特别是缩
模式推理,又称为推理,是一个有着重要研究价值的课题.在问答系统的研究中,模式推理作为一种新的研究途径,具有较高的应用价值,也因此受到较高的关注和研究.在问答系统领域,模式推理方法提出的较早,但是在国内,目前相关的研究并不多,所以,本文就致力于解决这个问题.本文首先介绍了模式推理的相关定义、研究现状;然后给出了模式推理的模型和机制;并给出了模式推理的一个基本性质及其证明.在此基础上,重点给出了模式推
面向限定领域的特定任务翻译服务,在有限资源的掌上电脑(PersonalDigitalAssistant,PDA)上实现快速语音翻译这一实际问题,本文提出了一种基于suffixarrays数据结构的快速翻译算法.在该算法的基础之上我们建立了旅游信息查询领域的汉英语音翻译模块,并在PDA平台上加以实现.初步的实验结果表明,该系统不仅具有较好的实时性和比较高的正确率,能正确处理一些语音识别产生的错误,而