计算机盲文翻译的研究与实现

来源 :沈阳工业学院 沈阳理工大学 | 被引量 : 0次 | 上传用户:jackydmb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先简要介绍了机器翻译技术的发展现状和几种主流的机器翻译方法,探讨了基于规则和基于统计两种主要的语言模型,对基于这两种语言模型的盲汉翻译方案进行分析和比较,论证了用统计语言模型来进行盲汉机器翻译的可行性和优越性.该文的主要研究工作在于盲汉机器翻译系统的设计原理与实现.汉语盲文实质上是一种用盲文点字来表示声韵母和其它字符的拼音文字,盲汉翻译首先要对盲文进行断句,利用规则进行消歧,将盲文中的拼音流和标点符号等其它字符区分开来,提取出盲文句子,然后构建盲文句子的候选汉字矩阵,在其候选汉字矩阵中搜索一条概率最大的路径,该路径上的字词序列组成的句子就是翻译结果.文中详细介绍了中文字词邻接概率统计技术、统计库的哈希表构建技术、汉字文本的Markov模型及其平滑、用Vlterbi算法在候选汉字矩阵中搜索最佳路径.
其他文献
UML是一种工业界应用最为广泛的建模语言.自1997年OMG提出UML概念至今,UML得到迅速的扩充和发展,目前已经成为面向对象系统的规范语言标准.但是由于缺乏形式化的语义及其多视
单元测试是软件测试流程的第一步,充分有效的单元测试可以尽可能多的发现软件故障,降低开发成本,提高软件质量。代码测试系统(Code Testing System,CTS)是一款由Java语言实现
Email是Internet上进行通讯最常用的方式,而邮件用户代理(MUA)是用户用来发送或接收Email的客户端程序。目前广泛使用的MUA是针对具体平台开发的,例如Microsoft公司的Outlook E
该论文根据Jones提出的文档方法论,采用包括J2EE和LDAP在内的先进的软件技术,设计了基于J2EE的文档管理系统的体系结构和软件层次模型.这是一个配置灵活的、可伸缩的以及具有
该文针对当前分布式安全现状和现实需要,分析和跟踪了国外分布式安全和应用服务器的最新进展,并就基于J2EE的分布式安全体系结构进行了比较深入的研究.在分布式环境下提供的
该论文主要包括五个方面内容.第一部分,定义告警信息语法模型;第二部分,如何从含有很多噪音的告警数据中,发现告警相关性规则的数据挖掘算法的研究;第三部分,如何进行增量数据挖
随着互联网的快速发展,云计算概念持续升温。云计算所具有的高可靠性,可扩展性,按需计费,虚拟化等特性使其在产业界、学术界、政府等各界引起强烈的关注。在互联网的冲击下,
随着移动计算机日益广泛的使用和人们对网络依赖性的增加,如何让人们能够随时随地的访问Internet,在移动的过程中保持通信不间断已经成为当前Internet技术研究的关键问题.传
随着计算机技术和电信技术不断发展和进步,加上日益旺盛的社会需求的持续推动,呼叫中心行业一直处于高速发展。但是多年以来呼叫中心的建设模式还是以自建为主,其高昂的建设
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。被信息产业界认