论文部分内容阅读
近年来,随着全球化进程的快速推进,国际交流日益增多,如何能快速、准确、方便地获取某个单词的中文释义,愈发迫切需要满足。另一方面,随着具有高清晰度摄像头的智能化手机的普及,在安卓操作系统这种高普及率智能手机上运行的基于摄像头的实时词典会成为一个非常有吸引力的应用。本文设计和实现了一种基于安卓平台的实时中英文词典的应用,该应用可以根据手机摄像头获取的英文文本和部分手写字体的照片,经过模式识别和在线词典查询获得该英文的中文解释。本文的研究工作重点围绕现有的光学字符识别方法,系统主要包括以下三个部分:摄像头取词;光学字符识别;本地/网络释义。具体研发工作包括:为了在智能手机上实现由摄像头拍摄后释义,做到随拍随得,本文结合现有的字符识别领域中的图像处理技术,对截取的字符图像分为预处理和标准化两个模块的操作。在预处理模块中,使用了自适应二值化算法,打破固定阈值的弊端,并结合漫水填充算法,提出了一种有效地去除离散噪声算法。在标准化模块中,将竖直分割和蛇形分割相结合,有效地分割出交缠在一起的字符,并在重定位后,利用双线性插值算法标准化字符。本文利用谷歌的开源字符识别库tesseract中的tess-two分支进行字符识别。对识别后的单词提供本地释义和网络释义功能。其中,本地释义采用安卓系统的SQLite数据库,对SD卡中的.db文件进行查询,单词库较小、解释粗略;网络释义采用有道翻译API,在线查询翻译结果,单词库大、解释详尽。实验结果表明,系统实现了在线词典的功能,并且系统对暗光、少量噪声下的字符都有十分出色的识别率,达到90%以上。