论文部分内容阅读
文本输入是人机交互中最基本的任务之一,是人向计算机表达交互意图的重要途径。在传统物理键盘之外,触屏等新型交互接口不断出现,在提高了交互自然性的同时,却显著降低了交互的性能,其原因是输入噪声较大和反馈信道受限,导致交互信噪比较低。如何兼顾交互的自然性和高效性,成为人机交互研究中的难题。研究者趋于采用贝叶斯方法解决文本输入中的这一难题,但往往仅考虑了落点位置信息,作用有限。本文面向多种输入接口,从点击模型精度优化(提升计算精度)、面向不确定性输入映射的计算方法扩展(扩展计算方法)和文本输入手部动作建模(扩充先验知识)方面优化了文本输入的基本贝叶斯方法,相应的技术实现大幅度提高了自然文本输入的交互性能。本文还提出了单词混淆度的计算方法,为测试集这一输入评测的关键工具提供了优化依据和公开数据集。具体研究贡献包括:(1)提出了触屏软键盘上精度优化的点击模型:针对胖手指难题,在设计实现触摸落点位置的高精度识别方法的基础上,建立了接口尺寸与输入速度、准确率和落点分布的作用关系,提升了软键盘输入贝叶斯方法中点击模型与输入行为的吻合程度,算法能在智能手表全键盘上达到与智能手机相当的35 WPM的输入速度,并能将手机输入的错误率降低23%。(2)提出了面向不确定性输入映射的贝叶斯方法:针对文本输入的基本贝叶斯方法只适用于确定性输入映射的限制,提出了多错误类型、多输入信号概率融合的扩展计算方法,不仅首次实现了智能手表上多光标加速的文本输入方式,而且算法在物理键盘和手机软键盘上,针对多种输入接口上普遍存在的四种输入错误(多输、漏输、替换和交换)的纠错性能显著优于现有主流商业产品。(3)提出了双手盲打输入的手部动作运动模型:提取了单指击键动作的运动学特征、落点的三维高斯分布参数、特别是手指联动包含的文本输入意图信息,显著扩充了贝叶斯算法中的先验知识,将VR空中虚拟键盘盲打的准确率提高到近100%,在空中打字这个已存在数十年的交互概念上实现了技术突破。(4)提出了优化文本输入测试集的单词混淆度计算方法:建立了单词混淆度与评测结果(输入速度和准确率)的量化关系,基于帕累托联合优化的二元字母频率、可记忆性、单词混淆度等测试集关键指标显著优于现有方法,得到的不同规模上的最优化测试集可作为相应评测任务的公开数据集,能够保证评测结果具有很高的外部效度。