论文部分内容阅读
本论文提出了一个在不降低基于错误实例系统准确率的前提下提高系统效率的方法:就是通过stringkernel、KPCA、K-means聚类等技术来提取系统错误实例数据库各个表的特征,为各个特征建立一个特征索引表,并把数据库按照这些特征分成各个特征表;同时,对于没有特征的错误实例就放到一个无特征表里。最后,我们通过借鉴修改stringkernel思想为语法检查系统建造了一个分类器。待检查的句子只要通过这个分类器就可以被分配到它该属于的那个特征表里面去搜索,这样就大大的提高了检查的速度。
新的系统运用了基于负实例特征的方法来弥补单纯实例模式匹配方法的不足.通过与Wordhelp原系统的语法检查功能进行比较测试,新的系统显示出在相同的精确度下较高的检查速度,并且具有灵活的扩展性。