盲文点字输入系统中盲汉置换方法的研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:lcsuoboger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,辅助盲人使用计算机的软硬件技术取得了长足的进展,盲人使用计算机已经越来越方便。然而,还是有一些因素使得我国盲人无法和明眼人一样熟练便捷的使用计算机,其中,输入汉字困难是制约我国盲人使用计算机的重要因素。盲人输入汉字的困难,一方面是由于盲人所使用的中国盲文与汉语存在一些差异,盲人并不熟悉明眼人常用的输入法;另一方面,即使新型的硬件设备已能够满足盲人直接输入盲文的愿望,但现有的技术和方法无法快速准确的将盲人输入的盲文转换为汉字。   为了提高中国盲文转换为汉字的正确率从而解决我国盲人使用计算机时输入汉字困难的问题,针对现行中国盲文自身的特点,本文提出了一种新的现行中国盲文到汉字的转换方法,该转换方法提出了一种将盲文分词连写规则与N-gram语言模型相结合的改进的语言模型,并充分利用现行中国盲文的声调信息,从而提高中国盲文到汉字转换的准确率。同时,利用转换得到的或者用户修正的正确结果建立自适应模型,对统计语言模型进行自适应,使得模型更加接近当前应用环境,从而使转换得到的结果越来越准确,进一步提高转换性能。此外,在上述研究成果的基础上,设计并实现了一个面向盲人的盲文点字输入系统。   本文的研究工作重点围绕融合现行中国盲文特点的盲汉转换方法,主要包括以下四个部分:   (1)基于盲文分词连写规则的盲汉转换算法。该算法以N-gram语言模型为基础,并且在转换过程中有效的利用了中国盲文最显著的特点--盲文分词连写规则,将这些规则与N-gram语言模型相结合,提出一种改进的语言模型,使之更容易“理解”盲人用户的要表达的意义,实现了准确的盲汉转换,同时给出了相关的实验结果和分析。   (2)基于盲文声调信息的词语选取算法。本文提出了一种候选汉语字词匹配的算法,该算法在为盲文词选取其对应的候选汉语词时,充分利用现行中国盲文的声调信息,排除声调不匹配的候选汉语词,减少候选个数。同时,本文还总结了现行中国盲文中盲文词标调的规则,根据此规则提出了一种对于重复出现的标调盲文词的候选选取方法。实验结果表明基于盲文声调信息的词语选取算法能在提高盲汉转换的正确率方面起到关键作用。   (3)基于正确结果的语言模型自适应方法。本文提出了基于已有转换结果的无监督语言模型自适应方法和基于用户修正的有监督语言模型自适应方法,这两种方法充分利用了即时应用环境和交互信息。实验结果表明这两种方法能够有效提高盲汉转换的正确率。   (4)盲文点字输入系统。结合实际应用需求,本文设计并实现了一个盲文点字输入系统,该系统使用新型的盲文点字手写输入设备,满足了盲文用户按他们的书写方式直接手写输入盲文的愿望。同时,该系统采用本文提出的盲汉转换方法将盲人用户输入的中国盲文准确的转换为汉字。这个系统可以使我国盲人更加高效便捷的使用计算机输入汉字。   综上所述,本文提出的盲汉转换方法充分利用了现行中国盲文自身的特点以及语言模型自适应技术,能高正确率的将中国盲文转换为汉字,从而解决了盲人输入汉字困难的问题。本文的研究工作是对当前盲汉转换技术在实际应用中的发展和创新,具有重要研究意义和产业应用前景。  
其他文献
煤炭安全生产涉及到对煤矿生产现场的人、设备、生产环境各方面的监测,随着矿井自动化技术的提高,大多矿井已建立了多种自动化系统,如监测井下生产环境(瓦斯、CO、温度等)的瓦斯安
隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的重要地位。G.Lakeoff和M.Johnson认为,隐喻不仅仅是一种语言修辞手段而且是
随着工艺集成度的增大和芯片主频的提高,功耗已经成为限制处理器性能提高的主要因素。过高的功耗影响了芯片的可靠性和寿命,增加了冷却成本,限制了部分高性能处理器应用于移动终
传统的IT系统管理只是强调对IT基础设施的监控管理,而未考虑与这些设施关联的上层服务。基于服务的管理方式将上层服务与底层基础设施关联起来,确保在服务的关键流程被中断或用
群是近年来即时通信平台中日益流行的概念,她比普通的好友分组具有更多的含义,更丰富的功能。用户可以在群内相互交流意见,共享资源,开展集体活动,协同办公。服务器运营商可以利用
近年来,GPU(Graphic Processing Unit)并行加速技术成为解决高复杂度计算问题的重要手段,特别是2007年NVIDIA公司的CUDA(Compute Unified Device Architecture)平台推出后,对多
人类对超级计算的性能追求从未止步。计算机Top500的统计结果表明,从1993年到2010年,超级计算机的性能一直保持每3年提升一个量级的速度。超并行处理(HyperParallel Ptocessing
改善无线Mesh网吞吐量是当前无线Mesh网研究中的关键问题。随着无线电技术的发展,无线接口已逐渐具备频率捷变的特性,即无线接口能在短时间内动态地重配置通信信道的中心频率与
群机器人是典型的群体智能系统,主要研究一群能力相对有限的自主移动机器人如何在有限感知情况下,通过局部交互机制涌现出群体智能行为来合作完成相对复杂的规定任务。群机器
随着集成电路制造和设计技术的不断进步,芯片中晶体管的数目以指数性增长,这导致电路的测试数据量和测试时间急剧增加,测试成本显著上升。测试压缩技术在保障测试质量的前提下,能