论文部分内容阅读
针对目前龙芯平台上Linux中文操作系统的需求,本文研发了以SCIM为架构的中文拼音输入法,并根据龙芯处理器的体系结构进行优化。文章深入分析了龙芯处理器的体系结构、SCIM输入法架构以及针对龙芯处理器体系结构的优化方法,为了提高输入法的高速实时性和可扩展性,针对龙芯Ⅱ号体系结构和输入法引擎算法分别进行优化,有效提升了输入法在龙芯平台上的性能。
本文的工作集中于结构相关优化和结构无关优化两个部分。在结构相关优化方面,从龙芯2E处理器体系结构的特点出发,对龙芯指令集、内存管理、处理器工作模式以及Cache结构进行逐一分析,针对访存的延迟这一关键问题,提出从软件预取角度进行优化的方案,通过根据龙芯的结构和应用程序的特性调整预取相关的启发式参数、修正预取的条件、建立访存的延迟模型以及排序要预取的归纳变量来进一步改进GCC的数据预取算法,从而生成效率更高的目标代码。在结构无关优化方面,从汉字语法语义输入法体系结构出发,以模块化、灵活性和扩充性为原则,选择SCIM输入法作为框架,分析了SCIM的层次结构以及各个模块的工作机理,针对输入法引擎算法的智能性这一关键问题,研究了输入法引擎的实现方式,分析其主要的数据结构设计,在SCIM的拼音输入法引擎中添加了词频调整算法,对输入法引擎的自学习功能模块进行了算法设计。
论文以提高龙芯Ⅱ号平台上Linux操作系统整体性能为目标,实现以SCIM为架构的高匹配性、高性能的开源中文拼音输入法,并对其进行结构相关以及结构无关两个方面的优化,有效提高了输入法的性能,使其具有使用简单、接口灵活、易于扩展等特点。