论文部分内容阅读
3月的一天,在宁波念书的大三学生成瑞肚子饿了,他来到学校附近的一家餐馆,准备找人帮他报读菜单——这对全盲的他来讲并不自在,但却稀松平常。“使用支付宝扫码点单,不用排队哦!”这个声音犹如天使在唱歌,成瑞立刻掏出手机,凑在耳边,听着读屏软件的语音提示,手指不断在屏幕上滑动和点击。他准确地打开支付宝的扫一扫功能,在服务员的引导下对准二维码。支付宝弹出“口碑”小程序,成瑞继续滑动,手机扬声器传出菜名:黄焖鸡米饭、黄焖排骨饭……“黄焖排骨饭”,听到这5个字,成瑞肚子更饿了,就吃它了!他双击屏幕,在读屏模式下这本是“选中”操作,此刻却失灵了。他一遍又一遍地双击,读屏软件一遍又一遍念着“黄焖排骨饭”,就是下不了单。成瑞最终还是像过去无数次那样,在服务员的帮助下点单就座,心里郁闷极了。不是所有人都用一种方法使用手机。对于成瑞这个90后来说,手机是生活的触角。用钉钉请假,用QQ聊天,用淘宝买东西,用美团点外卖,用支付宝付款……全盲的他自有一套操作逻辑:读屏软件开到几倍速,手指翻飞操作,效率不比所谓“明眼人”低。意外却时有发生,比如支付宝内的口碑小程序,能读“黄焖排骨饭”却无法点单,让人干着急。这样的BUG就宛若九曲十八弯最后戛然而止的“盲道”,留给行人一头问号。我们看到的手机屏幕是前端显示,是“前台”。每一个布局,每一个按钮背后都有代码的支撑,那是我们不需要知道的“后台”。程序员在后台敲代码,我们在前台看到图像。视障用户也需要程序员在后台敲代码,才能在前台听到提示。“读屏”这个辅助功能已经比较成熟,iOS端有VoiceOver(旁白),安卓有TalkBack,还有天坦读屏这样的第三方读屏软件,但是手机软件如果没有按照无障碍优化的技术规范开发也白搭。读屏软件不是“看图说话”,而是需要读取后台敲好的代码“标注”。不管是iOS还是安卓,都有公开的、通用的无障碍编程接口和规范,一旦没有标注到或是“焦点混乱”,让读屏软件没法选定目标或东一榔头西一棒子没个顺序,读屏软件也无能为力。就好比屏幕上直接显示了后台代码或者干脆显示一串乱码,“明眼人”的双眼也无能为力。像成瑞这样的视障人士,中国有1700多万,也就是每100个人当中就有1个,他们在读屏模式下操作手机。除此之外,还有听障人士(可以用震动或灯光反馈替代声音)、肢体残障人士(可以用语音指令取代手动操作)、阅读障碍人士(可以用语音朗读取代文本阅读)等,根据中国残联估算的数字,截至2010年,中国的残障人士超过 8500万人。这还远远不是障碍人士的全部,截至2017年,我国60岁以上的老年人人数已经高达2.41亿,他们的使用需求更加多元。当手机软件只考虑到了一种使用人群的时候,就竖起了障碍。让所有人能无障碍地获取信息,就是信息无障碍优化。而手机几乎是现在最重要的生活工具之一。一个更容易被忘记的事实是,任何所谓“健全人”都可能遇到功能受限的情况:开会的时候朋友发来一条语音,在微信里语音转文字;走路不方便打字却必须文字回复客户的时候,用讯飞输入法将语音直接转成文字;懒得起来拿手机的时候喊一声“Siri”,让它给你放歌听。
在人面前,有障碍的是产品
用户积极反馈,产品进行“触发式修复”,几乎是国内信息无障碍优化的一个“风俗”。这源于无障碍优化这件事的特点。一是无障碍优化的BUG经常会直接导致障碍用户用不了产品,这不是不痛不痒的小BUG,而是使用过程中的毁灭性打击;二是障碍用户对于手机产品的依赖程度往往较高,一个常用的APP突然抽风,对于这些用户来讲格外糟心。城市中的无障碍设施有太多需要改进的地方,过去,大多数残障人士都被隔绝在主流社会之外,没人协助寸步难行——小台階太多,轮椅需要有人抬;盲道走着走着戛然而止、红绿灯没有声音提示,视障者不知所措;客服多为电话接听,聋哑人槽多无口……移动互联网大大提高了他们的独立性。“牙膏没了,普通人下楼就买了,也可以点外卖美团就送来了。但对于障碍人士来说前者的难度高很多……这不是改善问题,而是解决了问题。”刘彪是一位工程师,本身就是视障者的他已经是无障碍优化领域的专家。移动互联网不仅给了障碍人士更多便利(或者说弥补了环境无障碍优化中的诸多不足),也让他们更加独立。很多人借助科技实现了经济独立,刘彪是其中的佼佼者,还有人通过淘宝开店做起买卖,有人在喜马拉雅上开读书节目成为红人。障碍用户这么重视手机的使用,刘彪觉得再自然不过:“移动互联网对于健全人来讲是锦上添花,对于障碍用户,也许就是雪中送炭。”正因为如此,用户迫不及待地想尽各种办法做“自下而上”的反馈,在无障碍优化还不完美的情况下还会继续下去。进行信息无障碍优化,会遇到各种问题。“按规矩做无障碍优化”是国内信息无障碍优化的第一步。这一步,国内的互联网大企业如IBM(中国)、阿里、腾讯、百度、讯飞等都陆续跨出来。而无数的中小企业仍旧卡在这里。现在国内仅有40多款APP进行了信息无障碍优化改造。规范虽有,却并不深入人心,国内的信息无障碍进入大众视野较晚,是一个客观因素。刘彪在日常生活中,能体会到大众对于障碍人群的不了解。刘彪使用滴滴打车的时候,几乎每次都会被司机问:“你是怎么用手机打车的?!”对大多数人来讲,这是完全想象不到的。大众不了解玩手机的1万种方式,很多来自大众的工程师对此也没什么概念。在“按规矩”做了无障碍优化之后,还有不断的检测和修复。不能真的跑起来的话,充其量是面子工程。即便工程师在后台敲代码到吐血,最后还是要拉出来跑跑看好不好用。在理想状态下,应该自动检测反复跑,用技术手段发现70%的问题;然后由像信息无障碍研究会中的专业人士进行检测,加上用户反馈,逐渐修复一些自动检测发现不了的问题。不同类型的用户,有不同的使用逻辑,所谓“健全人”其实并不能完全理解所有的使用情景。信息无障碍优化尤其离不开各个障碍群体的亲身体验。有一个全民熟知的冷笑话:把大象放进冰箱,一共需要几步?答:3步。打开冰箱门,把大象放进去,把冰箱门关上。信息无障碍优化这件事,深究起来奥妙多多,但是总结起来也无非是3步:打开思路,意识到应该做“无障碍优化”;放进条条框框,按照编程接口和规范做开发;最后还得把门关上,让产品运行起来,通过用户的反馈不断持续优化,努力做到无障碍。 信息无障碍优化,不仅仅是慈善
在技术领域,很多功能是可以共用或者互相借鉴的。依照编程接口和规范做产品开发只是无障碍优化的一个基本线,还有很多互联网企业在探索其他办法,比如利用人工智能的力量,使得无障碍优化更好。QQ空间曾经推出“图片语音即时描述功能”。该功能基于腾讯AI Lab的“图像描述生成技术”,能自动识别图片内容,读出“一个男人拿着咖啡杯”这样的图片信息。刘彪介绍,这个功能的精确度也许还有待提高,明明是果汁却认成咖啡也是可能的,但是大大好于“图片”“图片”“图片”的反馈。而OCR文字识别技术在无障碍优化方面的应用表现也很突出,这项技术可以帮助用户读取图片中的文本。2018年,手机淘宝推出了“读光OCR”的功能,并赶在“双十一”前上线。由于淘宝卖家很喜欢用直接设计好的图片作为宝贝详情展示,里面包含大量的文字,有了“读光OCR”的加持,用户点击图片,就能听到图片上的文本内容,不管是“静音设计,适合办公场景”还是“双十一大促销惊喜价格”,都可以被读出来了。功能上线之后,读光OCR日均识别图像数量持续上升,从2018年10月的日均500万,到“双十二”期间日均识别量将近1亿。这是对障碍人士有着很深了解的手淘团队也始料未及的,他们追加了一个服务器。OCR功能的应用场景十分广泛,提取PDF文件中的文本以及有些软件提供的“拍照获取文本”的功能,都和OCR文字识别有关。技术领域没有完全的分割,各个初衷不同方向不同的努力,也会相互裨益。
“科技向善”并不是一句口号,它正在发生。各种手机软件拓宽了障碍人士的生活边界,但这不会是终点,信息无障碍的意义也绝非是“让所有人流畅地玩手机”。科技的应用早就溢出了个别终端的边界,四处蔓延,越来越多的物品“智能化”。这表示人与人之间更加平等、共享更多生活空间的可能性在变高,当然,前提是信息无障碍优化一起蔓延开来。医院的大厅摆满自助机器,有些功能例如“就诊报到”甚至必须在机器上完成,其系统却几乎没有任何信息无障碍优化,视障人士如何使用?小区的角落总有黄绿蓝各种快递柜,老年人面对看似简单的操作不知所措,不得不求助于一边的小青年。商场里,“迎客机器人”用屏幕显示出一副快乐的神情,用语音招呼着客人,听力障礙者该怎么“读懂”它热情的自我介绍?刘彪作为一名信息无障碍工程师,成天给产品提优化建议,作为一位视障者,也的确体会到了更多便利。他可以轻松网上购物,可以快速打车去较远的目的地,但是一旦脱离互联网,他的日常生活依旧常常得靠记忆和摸索。他的脑袋里装着数个产品说明书——洗衣机的左起第三个按钮按四下是甩干;空调上次设定的温度是23度,手指摸到尖头朝下的按钮按3下调到20度,再按最右侧的按钮开启强风。未来的世界,智能化的物品会越来越多,而消除人与人之间不平等的一把钥匙,正在信息无障碍优化身上。科技可以创造这样一个世界,障碍人士不再存在,几亿人在智能生活里得到不曾有过的自由。