基于Android的联机手写维吾尔文识别研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:kuwaning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔文是新疆维吾尔自治区少数名族的主要交流文字,为了便利当地人们交流,开展有关维吾尔文文字处理技术的研究是很有必要。在当今社会,常用电子信息设备都已经进入了平常百姓家,特别是手机移动终端设备,已经成为了人们日常生活之中不可缺少的通信工具,开展有关手机移动终端上的维吾尔文文字信息处理技术已显得迫切需要。目前,针对维吾尔文字的识别技术主要有印刷体识别和联机手写文字识别。在印刷体文字识别方面,已经取得了较大发展,但有关联机手写文字识别方面的研究还比较少并且大部分研究都是以字母为基本识别单位的。以字母为基本识别单位,其优点就是需要建立的字符模型少,识别效率快。但其缺点也较为明显,首先要面临的就是字母切分困难问题。因为维吾尔文属于黏着性语言文字,其大部分字母都可以粘连书写,具有天然的草书特点,并且字母变体多,如何切分出正确的字母一直都是研究难点。再就是针对基本字母的识别无法满足人们在触屏手机上进行单词输入的实际应用需求。为了解决此问题,本文主要针对基于Android移动终端上的手写维吾尔文字识别方法进行了研究。首先研究了在Android手机上针对维吾尔文单词进行采样的方法,其次,以采集的样本信息为基础,对维吾尔文单词的预处理和特征提取方法进行了研究。同时为了满足可以识别维吾尔文整词的需求,本文中根据维吾尔文单词都是由多个连体段组成的特点,选取以连体段为基本单位进行特征的提取,然后通过拼接连体段特征构成一个单词的特征向量。最后,通过本文中提出的特征压缩方法将已提取的单词特征向量转化为离散隐马尔可夫模型可以读取的观察值序列,接下来使用隐马尔科夫模型完成对单词的建模和识别测试。本文主要研究了在安卓移动设备上对手写维吾尔文单词进行识别的方法。通过在手机上完成维吾尔文单词采样后,前期研究工作主要是在电脑端完成的,后期再将识别程序移植到手机设备,初步在安卓移动终端上完成对手写维吾尔文单词的识别。
其他文献
随着机器翻译技术的迅速发展,命名实体识别与翻译研究取得了突破性的进展,它是在自然语言处理中的关键性研究分支。如今,汉语-维吾尔语机器翻译领域中开展了大量的研究工作。
随着模型驱动开发技术的逐渐成熟以及代码自动生成技术的出现,基于模型驱动的开发方法在软件开发领域被广泛应用。模型驱动开发使得开发人员可以更多地关注于系统逻辑设计,即在
蛋白质-蛋白质对接是指在两个蛋白质分子之间试图找到最好匹配,蛋白质-蛋白质相互作用过程中通常会发生骨架构象变化,蛋白质-蛋白质骨架柔性对接就是设计相应的对接算法和协议
现代DSP(Digital Signal Processor)处理器大多使用VLIW(Very Long Instruction Word,超长指令字)体系结构,它主要通过挖掘指令级并行性,即将多条指令放在同一时钟周期发射来
电子技术、计算机技术、通信技术的飞速发展为我们的生活带来了便利,也为医疗体系的发展带来了新的机遇。无线通信技术已经在医疗监护领域取得广泛应用,主要包括远程医疗、跟
微弱信号检测是一门新兴的学科,从噪声背景中提取微弱有效信号是近代信息论中的一个重要内容,也历来是信号处理领域的核心问题和前沿课题之一。利用传统的功率谱,线性滤波等
在我国,由于人口众多、地区发展不平衡,教育资源分配也不均衡。在某些地区教育资源还是非常缺乏,东部沿海开放地区集中了大量的优势教育资源,而广大的西部地区教育资源却非常
H.264/AVC是最新的国际视频编码标准,该标准具有更强的网络适应能力,代表了未来多媒体数据压缩编码的发展趋势。及时跟踪和掌握H.264/AVC的核心技术,并结合实际应用在某些关
随着Internet的快速发展,关于某一主题的信息会通过不同渠道充斥着整个互联网。面对大量内容相近的主题文档集,有效地获取到真正需要的信息变得越来越困难。如何向用户提供全
手持设备的广泛应用对汉字输入技术的要求越来越高。本文通过对智能输入技术的研究,构建了动态自适应语言模型,并将此模型与输入系统实现技术相结合,实现了一个基于动态自适