论文部分内容阅读
如何设计和实现以普及输入为目的的汉语键盘输入方法是该研究的主要目标.该文的主要工作和成果如下:1.综述了现行输入技术(包括字编码输入方法、拼音词输入方法、连 续拼音语句级输入方法和基于短语分析的输入方法),分析了字编码输入不能很好推广的原 因,拼音词输入的同音词选择以及目前连续拼音语句级输入方法的弱点.2.分析连续拼音语句级输入方法的实现方法.总结并提出了关于分词(包括拼音分词和文本分词)问题的认识,综述了分词方法,发现"分词的循环死锁"现象,认为语言书面确实应该改革.3.分析了语言认知过程和自然语言处理的难度.4.分析了搭配在自然语言处理中的重要性并介绍吴蔚天老师的"关系语义场"的概念,根据体谓关系语义场,提出了名词自动层次分类方法.5.提出"词和句相结合的汉语键盘输入形式",从不同的角度论述该形式的可行性和合理性,提出了活性词和固定词的概述,然后论述了在 采用该输入形式下,同音词识别所采用的理论模型.6.提出采用基于语言知识的理性分析方法进行同音词识别的思路,即广泛使用搭配原则、语义关联、固定搭配、语句模式、封闭词句法信息等语言知识,采用评估函数对可能语句进行判定得到最优句,要求最优句内部的各词之间的语法关联程度和语义关联程度最大.7.总结各种典型构词规则和词组固定格式,提出词组固定格式匹配原则和词语相似度算法;根据<<现代汉语离合词用法词典>>所提供的数据,分析离合词的离合特点,并将其应用在同音词识别中.8.总结相邻词的约束关系,扩充了吴蔚天老师提出的"属性约束文法".9.分析不同类型词语搭配关系并提出词语搭配的使用原则,分析名词性词组的语义聚合原则,并提出具体的语义聚合算法.10.综合<<知网>>、"关系语义场数据"和<<现代汉语信息词典 详解>>(北京大学计算语言研究所),建立自己的知识库,设计和实现了I<2>汉语键盘智能 输入系统.