基于多模态信号识别的无障碍电子书阅读器的研究和实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangtianmei01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机的大范围应用,手机上的电子书App渐渐成为人们学习和阅读的主要方式之一。但是视障人群由于视力问题在使用电子书的过程中遇到了很多问题,比如很多电子书App无法支持语音朗读、控件不符合无障碍设计,使得视障人群使用电子书效率低下,甚至根本无法使用,所以为视障人群定制一款无障碍电子书阅读器十分重要。于是本文设计并实现了一款为视障人群使用的无障碍电子书阅读器。首先,本电子书实现了市面上一般电子书的通用功能,并且添加了很多手势和语音合成部分,实现了基于语音识别的交互技术,可以通过简单的语音指令实现一系列操作。本文对传统的语音信号端点检测算法稍作改进,然后用线性插值法替代了逐帧移动算法来进行关键字检出,提高了时间效率。其次,为了解决视障人群键盘输入图书名字困难的问题,改进了基于神经网络的图像匹配算法,用该算法使得视障人群通过拍摄书本封面图片然后和数据库中的图片库进行匹配即可得到电子书资源。本文对传统的特征点检测算法Fast算法进行改进使之具有缩放不变性和尺度信息,然后用稀疏自编码器训练数据来计算特征描述子,并且对其进行改进,在损失函数中加入了参数正交的约束并且将全连接改为了局部连接,使得参数更加有效,计算出来的特征描述子更具有表达性。通过该算法使得视障人群检索书目更加方便。第三,本文针对视障人群之间分享交流电子书冗余的问题提出了基于加密二维码的分享功能。将电子书的URL进行RSA加密后生成二维码再分享给其他用户,其他用户扫码解密后即可进行电子书的下载。RSA加密算法保证了电子书分享过程中的安全性,二维码分享的形式大大简化了视障人群之间分享交流的流程。最后,本文结合以上所述技术实现了 iOS平台上的无障碍电子书阅读器,使得视障人群的学习阅读更加便利高效。
其他文献
通过多黏类芽孢杆菌液体发酵技术得到富含果胶酶的发酵液,对葡萄籽进行酶解处理提取原花青素。以葡萄籽原花青素提取率为指标,在单因素和正交试验的基础上,确定了原花青素提取的
随着《2006-2020国家信息化发展战略》、《国家电子政务总体框架》、《中华人民共和国政府信息公开条例》等政策条例的陆续颁布实施,我国政府网站不断发展进步。党的十七大报
为了研究同氮源及含量对黏性红酵母(Rhodotorula mucilaginosa)WP3生长及类胡萝卜素积累的影响,从不同氮源入手,应用单因素法研究了不同氮源和氮源含量对细胞生长和类胡萝卜素合
本文给出了数列极限常用的计算方法,并通过例子说明.
一、背景2001年,我行完成了全省范围内的数据集中,数据集中带来业务生产系统更加安全稳定运行的同时,产生了大量的业务数据和业务报表,如何把业务数据更好地利用起来,为经营
<正>~~
会议
目的:通过对长期拉米夫定治疗无效的慢性乙型肝炎(CHB)病例分析,寻找可汲取的临床经验和教训。方法:观察和随访长期(12-60mo)拉米夫定治疗无效的CHB或伴有早期肝硬化患者共106例,项目
<正>清代是满洲贵族所创建的中国历史上最后一个封建王朝。满族本是活跃于白山黑水间的游猎民族,经济文化相对落后,但明末清初,满族社会飞速发展,满族又善于吸收周边民族的先
会议
纵观供应链金融发展的历史可以发现,信息在供应链金融运行中所起的作用越来越重要,供应链金融价值创造的功能越来越突出,供应链金融与实体产业的结合越来越紧密。互联网与供应链
1免疫失败后要及时查找原因疫苗的保管、运输、使用不合理.没有低温保存,运输途中没有低温设备,使疫苗长时间暴露在常温下导致疫苗失效.稀释液的质量不好,矿物质的含量过高或