汉语智能输入方法与实现

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:hx147852
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何设计和实现以普及输入为目的的汉语键盘输入方法是该研究的主要目标.该文的主要工作和成果如下:1.综述了现行输入技术(包括字编码输入方法、拼音词输入方法、连 续拼音语句级输入方法和基于短语分析的输入方法),分析了字编码输入不能很好推广的原 因,拼音词输入的同音词选择以及目前连续拼音语句级输入方法的弱点.2.分析连续拼音语句级输入方法的实现方法.总结并提出了关于分词(包括拼音分词和文本分词)问题的认识,综述了分词方法,发现"分词的循环死锁"现象,认为语言书面确实应该改革.3.分析了语言认知过程和自然语言处理的难度.4.分析了搭配在自然语言处理中的重要性并介绍吴蔚天老师的"关系语义场"的概念,根据体谓关系语义场,提出了名词自动层次分类方法.5.提出"词和句相结合的汉语键盘输入形式",从不同的角度论述该形式的可行性和合理性,提出了活性词和固定词的概述,然后论述了在 采用该输入形式下,同音词识别所采用的理论模型.6.提出采用基于语言知识的理性分析方法进行同音词识别的思路,即广泛使用搭配原则、语义关联、固定搭配、语句模式、封闭词句法信息等语言知识,采用评估函数对可能语句进行判定得到最优句,要求最优句内部的各词之间的语法关联程度和语义关联程度最大.7.总结各种典型构词规则和词组固定格式,提出词组固定格式匹配原则和词语相似度算法;根据<<现代汉语离合词用法词典>>所提供的数据,分析离合词的离合特点,并将其应用在同音词识别中.8.总结相邻词的约束关系,扩充了吴蔚天老师提出的"属性约束文法".9.分析不同类型词语搭配关系并提出词语搭配的使用原则,分析名词性词组的语义聚合原则,并提出具体的语义聚合算法.10.综合<<知网>>、"关系语义场数据"和<<现代汉语信息词典 详解>>(北京大学计算语言研究所),建立自己的知识库,设计和实现了I<2>汉语键盘智能 输入系统.
其他文献
本文对门限群签名做了研究,首先介绍了文章中用到的基本概念和工具, 然后总结了门限群签名应该具有的八条性质,以这些性质为标准仔细分析了现 有的 DF、L
通过对自然语言表初等几何命题语言的研究,该文了一个基于模式匹配的面向几何元素的语言模型,以达到对此类受限自然语言进行计算机理解的目的.该模型的基本语言单位是词素,在
最近的科学发展表明,情绪在决策、感知、学习以及其它一些类似的行为中发挥着重要作用;换句话说,情绪影响着真正的理性思考的机制.如果研究人员想让计算机拥有真正的智能,自
该论文首先采用面向对象技术,研究了单元几何法建立地质实体模型的理论、方法及过程.分析了传统表示复杂形体CSG与Brep方法技术的缺点,引出适用于地质实体的几何单 元生成方
近年来,随着计算机网络的快速发展,社交网站如微博、人人等新兴的网络应用开始逐渐流行,基于此类社会网络的信息传播也成指数级增长。因此,基于社会网络的课题研究越来越流行
该文在介绍了网络管理系统和网络计费管理系统的基本概念和广泛使用的网络管理协议SNMP的基础上,讨论了网络计费管理系统设计的基本思想和若干关键技术,以及系统的总体设计方
随着计算机网络技术的不断成熟和迅猛发展,如何更合理、有效地利用有限的网络资源,逐渐成为网络运营者和Internet接入用户所共同关心的问题。网络的计费管理工作在整个网络运营
该文在对网络安全审计系统的发展与技术研究的基础上,着重分析与介绍了网络安全审计中智能分析与流量分析的算法与实现.在对网络安全需求了解的基础上,该课题分两个阶段进行.
该论文的背景是开发基于国产开放系统平台Cosa/Cosix的Java虚拟机CoJava,主要的工作是为CoJava开发了即时编译器,并参与虚拟机主体的实现.在第一章前言之后,对虚拟机的设计和
该文基于经济、灵活、对实现环境的要求低的原则对网络监测系统进行了一些研究,对网络管理和网络监测的概念、功能进行了详细论述,提出了基于简单网络管理协议SNMP和以太网的