面向机顶盒的云输入法的优化研究

来源 :山东建筑大学 | 被引量 : 0次 | 上传用户:hbzhwyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在视频点播中,关键字查询为观众提供了从海量资源库中搜索目标节目的高效手段,同时Internet业务的开展也需要用户提交信息,这些都需要机顶盒具有中文输入能力。机顶盒主要采用遥控器输入,输入效率低,并因处理能力弱、缺少存储能力无法实现智能输入。为此把云计算技术与机顶盒结合,提出了面向机顶盒的云输入法,通过实现词组学习、次序调整和联想等智能输入,从而来改进输入效率:用户的遥控器按键信息经过机顶盒,通过网络发送到云端服务器,服务器端进行输入法计算,将计算得到的候选字或词反馈给用户进行选择,服务器进一步分析用户的选择,对输入法字词库进行智能化调整。这样利用云端服务器强大的计算能力和存储能力为用户提供了智能输入服务,并降低了机顶盒进行中文输入计算的开销。传统中文词库很大,但是在视频点播应用中,观众主要是对节目名、演员名和剧情内容进行查询,因此输入的内容只有包含在节目元数据内才是有效的。为此利用全文检索技术来提升云输入法的效率:对节目元数据进行中文分词,构建片名词库、演员名库、虚拟角色名库以及剧情词库,同时提供对中文人名输入的支持,观众请求输入法服务时根据节目检索类别只从与之对应的词库中进行查询、提取有效候选词返回给用户。与通用词库相比,一方面词库规模缩小,检索速度提高;另一方面返回的候选词数量减少,减少甚至是避免了用户因候选词过多而造成的翻页查找,提高了输入效率。根据机顶盒输入法对人名库完备率的高要求,本文在对传统的基于姓氏的人名识别方法研究的基础上,对其进行了改进。同时,剧情中的角色名大都是虚拟名字,一般不包含在传统词典中,并且出于其组成结构复杂多样,现有的中文人名识别技术很难将其提取。针对这部分未知人名,本文提出了一种新的中文人名识别算法剩余分词:通过将中文分词处理后剩余的分词碎片的进一步处理,将剧情中的未知人名提取出来。实验测试,剩余分词对剧情中的未知人名提取效果良好。同时,本文对搭建、运营机顶盒的云输入法服务的过程中所涉及的相关工作进行了优化研究,并加以实现,减少了搭建机顶盒输入法服务的工作量,提高了输入法的服务性能与稳定性。
其他文献
现今网络时代的快速发展,扩大了电子政务系统在机关部门的覆盖范围。这些电子政务系统在数据的处理中,跨越性质相同与不同的部门,而且在处理不同的数据信息时,具备复杂性。情
对于句子进行分析,通常要满足句子分析的功能和意义两个标准。满足这两条标准通常要求对句子进行浅层的分析,同时也要对句子进行深层的分析。汉语作为世界上使用人数最多的语
近年来,虚拟化技术以其良好的独立性、高的资源利用率及易管理性而备受关注。目前常用的虚拟化软件Xen具有占用资源少、性能高和开源等优点,常被用来搭建高性能和高可靠的虚
随着科技进步与计算机技术的发展,计算机的应用范围日益广泛,软件产品在日常的生产生活及工作中占据越来越重要的地位。随之,计算机软件也变得越来越复杂,产品的生命便是产品
随着科技的发展和物联网技术的广泛应用,物流管理自动化和智能化的需求也越来越突出。智能化的仓储管理保证了货物的入库、翻堆和出库等业务能够及时准确地进行,而无线通信技术
针对近年来我国多次出现的煤矿安全事故的状况,国家制订了煤矿安全的应急响应预案,但是煤矿安全事故是一种突发性的事件,单靠计划性的预案方式无法满足事故发生时的特殊性要
随着互联网技术在21世纪的迅速普及和发展,互联网对于社会经济的发展产生了深远的意义,人们的生活越来越离不开互联网。近年来,电子商务的出现,通过网络进行的电子商务交易行为更
近年来社交网络服务(Social Networks Services,SNS)发展迅猛,尤其是微博系统凭借其社交特性、媒体特性、终端可扩展性,逐渐发展成为主流社交媒体,是目前人们实现社会交往、
随着P2P网络的高速发展,P2P技术带来的问题日益严重起来,大部分的ISP都有过封杀或者限制P2P应用的政策,但是P2P技术已经渐渐渗入到几乎所有的网络应用中。目前互联网中70%以上的
近些年,随着互联网的普及和广泛应用,不管是在各种文档、网上银行、收发e-mail,还是在其它对安全性要求极高的数字通信领域,加密技术已经成为了保证数据传输私密性的一个重要