基于触摸屏的中文拼音输入法的输入及预测优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zj280078064
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人类与计算机的交互方式多种多样。近年来基于触摸屏的智能手机变得愈发普及,人机间的交互更加纷繁复杂。而在其中,输入法作为一种重要的文本输入软件,有着其不可替代的地位。而在中文输入法领域,相较于诸如五笔输入法等其他形式的中文输入法,中文拼音输入法毫无疑问是最受欢迎的输入法,考虑到时下基于触摸屏的中文拼音输入法在中国市场上大行其道,本课题着眼于从多个方面提升触屏拼音输入法的性能。中文拼音输入法的发展始于上个世纪七十年代,有着近40年的发展历史,从最初的字词到如今的整句输入,在技术层面上看似已非常成熟,伴随着机器学习技术的兴起,包括微软、搜狗在内的互联网公司纷纷进驻智能拼音输入法市场,将机器学习技术成功应用到输入法上,并且依靠着采集到的海量用户输入数据所训练而来的语言模型保证了输入法的高准确率,看似中文拼音输入法已经发展到了接近饱和的时期,本课题却打开思路,从拼音输入法的键盘、语言模型、乃至整体架构三个方面尝试优化,并取得了一定的成果。相较于实体键盘,触摸屏设备的虚拟键盘没有键位的触感和敲击感,误触的情况时有发生,而不同的触屏设备具有着各异的屏幕尺寸,使得键盘布局的合理性成了很大的问题,与其设计一款适用于所有屏幕的“通用”键盘,不如让键盘本身去适应屏幕和用户的输入习惯,应用增强学习的方法,我们设计了一款自适应的键盘,每次用户完成了一次按键时,下一个可能的按键会不同程度地放大并向用户当前的手指位置靠拢,不仅如此,这款智能键盘还会依据用户输入的速度变化在线学习出其最适应的键盘布局,实现自适应。我们研究分析了现代拼音输入法的典型工作流程。拼音输入法的第一个环节是拼音切分,通常采用的是基于规则的匹配分词算法,会遇到歧义拼音的问题而产生错误。拼音切分之后是候选词查找过程,这个过程是典型的字典查找,但是大多数技巧性很强的调整都在这一过程中进行,如模糊拼音,简拼等。最后是候选句生成,通常采用的算法是利用语言模型使用动态规划在候选词的组合中找到概率最大的序列。在此框架下,语言模型相当于是拼音输入法的核心,对于语言模型而言,传统的n元组语言模型有着其简单高效的显著优势,而时下流行的神经网络语言模型则在预测性能和训练所需样本数上优于传统语言模型,本课题考虑将两者的优势相结合,提出基于神经网络语言模型的n元组语言模型,在不增加额外计算开销的前提下提升拼音输入法的整句生成准确率,并取得了实验上的成功。之前的研究和实验都是基于现代输入法典型的架构,如何突破传统工作流程的束缚成为了我们所考虑的重要问题。输入法和机器翻译作为自然语言处理的领域的两个典型应用,一直以来被看做是两个不同的研究领域,本课题大胆尝试,用机器翻译的思想解决输入法的问题,该研究或能颠覆经典的中文拼音输入法框架,具有很强的启发意义。
其他文献
马克思世界历史理论是分析人类社会发展趋势和当今全球化浪潮的理论指南。全球一体化的进程,印证了马克思世界历史理论关于“历史向世界历史转变”的思想,使各个民族和国家不得不思索如何更好地融入和应对全球化的问题。处在全球化浪潮中的中国亦是如此。历经改革开放40余年的伟大实践,中国的综合国力和国际地位显著提升,使中国受到世界各国的普遍关注。特别是党的十八大以来,中国的发展模式或者“中国道路”引发了国内外学者
学位
煤浆电氧化制氢技术是一项极具前景的产氢技术,它将煤炭的清洁利用技术和可再生电力“电改气”技术结合起来,通过在酸性水溶液中引入煤炭的方法大大地降低了产氢的电能消耗。相比电解水制氢技术,该技术在生产相同量的氢气的条件下,大约能够节省一半的电能。但是该技术存在一个非常严重的问题——产氢速率极低,常温电解电流密度不足10m A/cm~2,这也是该技术至今为止不能商业化应用的一个重要的原因。该问题的关键在于
学位
近年来,在人工成本上升、产业结构升级的背景下,各国政府相继推出不同政策来促进经济发展,机器人技术作为对未来新兴产业发展具有重要意义的高新技术之一,得到了广泛关注。工业4.0时代的到来以及全球企业的智能化转型使得“人机协作型机器人”成为工业机器人发展的新形态。所谓“人机协作型机器人”,就是“机器人系统”与人之间的协作,通过人机协作,可以把人的智慧和机器人的高效率结合在一起,共同完成作业。然而,机器人
学位
在反应堆严重事故下,熔融物堆内滞留(In-Vessel Retention,IVR)是保护反应堆安全的有效手段,通过向堆腔注水并淹没反应堆压力容器(Reactor Pressure Vessel)实施外部冷却(External Reactor Vessel Cooling,ERVC)是其重要措施之一。其目标是通过自然循环将反应堆衰变热带出,确保压力容器下封头热流不超过临界热通量(Critical
学位
本文针对新松1代和3代7轴协作型机械臂在无力/力矩传感器的情况下,仅基于关节内部传感器信息即电流传感器的电流信息,绝对值编码器和相对值编码器形成的双编码器差值信息以及温度传感器的温度信息,开发了相应的牵引示教算法,初期主要基于电流使用force-free控制方法在新松1代和3代7轴机械臂上实现了机械臂的牵引示教。之后针对长期运行关节摩擦力矩下降的问题引入了温度信息修正基于电流的关节摩擦力矩补偿模型
学位
将理论的创新性发展与现实的批判性分析相结合,是马克思深入探讨人与自然关系的重要方法。这一方法也是研究《1844年经济学哲学手稿》(后面简称《手稿》)生态观的方法。具体来说,就是马克思在对19世纪资本主义发展状况深入分析的基础上,继承和发展了前人的理论成果,突破了国民经济学抽象化人与自然关系的局限性,从而实现了人与自然关系的社会历史性变革。在《手稿》中,马克思明确提出了人与自然的对象性关系,看到这种
学位
Mg-Gd-Y系合金的室温力学性能和高温抗蠕变性能优异,是高性能轻质镁合金材料研究和应用的热点。本文基于高性能Mg-10Gd-4Y wt.%(GW104)合金,通过筛选添加1 wt.%的Mn元素或1 wt.%的Zn元素,采用半连续铸造、热挤压和热处理等常规工艺手段,系统研究Mn元素、Zn元素和各个工艺参数等对GW104合金相组成、微观组织和力学性能的影响规律,为进一步提高镁合金的性能和工业化应用奠
学位
学位
自从有了人类文明几乎就有了“辩论”,从古至今“能言善辩”是衡量一个人是否具有聪明才智的重要标准,同样辩论对于新世纪人才的培养,有着不可估量的作用。但遗憾的是我们很少将辩论引入课堂,也没有对辩论式教学做进一步的研究。基于此原因,本论文对辩论式教学的原则、辩论式教学的特点、辩论式教学的价值及组织形式展开研究,同时以甘肃省W县四所高中为例,对辩论式教学在语文课堂开展过程中出现的问题及原因进行分析,并提出
学位
结构钢丝是钟表工业、太阳能光伏产业切割用钢丝的总称,也称为切割钢丝。作为取之不尽,用之不及的清洁能源,太阳能得到了越来越广泛的应用,太阳能晶体硅是人们利用太阳能的主要利用媒介之一,绝大多数的太阳能硅晶片使用结构钢丝切割制得。结构钢丝的形状参数对于切割制得的硅晶片表面质量有着至关重要的影响。结构钢丝的生产工艺是在精密直钢丝基础上,使用水平和竖直两个维度的特殊齿轮,在直钢丝上轧制出正交的正弦波形。两个
学位