基于错误实例与错误特征相结合的语法检查系统的实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:laiwuywg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本论文提出了一个在不降低基于错误实例系统准确率的前提下提高系统效率的方法:就是通过stringkernel、KPCA、K-means聚类等技术来提取系统错误实例数据库各个表的特征,为各个特征建立一个特征索引表,并把数据库按照这些特征分成各个特征表;同时,对于没有特征的错误实例就放到一个无特征表里。最后,我们通过借鉴修改stringkernel思想为语法检查系统建造了一个分类器。待检查的句子只要通过这个分类器就可以被分配到它该属于的那个特征表里面去搜索,这样就大大的提高了检查的速度。   新的系统运用了基于负实例特征的方法来弥补单纯实例模式匹配方法的不足.通过与Wordhelp原系统的语法检查功能进行比较测试,新的系统显示出在相同的精确度下较高的检查速度,并且具有灵活的扩展性。
其他文献
随着全球经济的迅猛发展,交通紧张问题日益严峻,为此提出了ITS(智能交通系统)作为解决这一问题的全新方案,车辆导航监控系统是ITS的重要组成部分,本文所设计的车辆导航监控系统由车
本论文的研究背景是:①IPv6协议集的测试,特别是对IPv6路由器设备的测试技术已经成为从现有Internet向基于IPv6的NGI(Next Generation Internet)过渡的关键技术之一;②现代路由
  本课题的目标是研发出性能和精度达到一流水平的新一代数字化科氏流量计。本文主要研究二次仪表的信号处理问题,即科氏流量计的流量信号的算法研究和实现。  本文对科氏
  在智能规划的研究上,存在领域相关和领域无关两个方向的研究,其中,领域无关规划是研究的热点和难点。长期以来,由于领域无关规划器很难充分利用特定研究领域的专家信息,领域无
本论文对anycast技术在解决负载平衡所存在的不足进行了分析,提出了一种包含反馈技术的anycast下负载平衡的动态解决方案,并且对该方案的可行性进行了分析,在该方案的实现过
Next Generation Network(NGN)是基于分组的网络,能够提供包括电信业务在内的各种业务,其业务相关功能与承载的传送技术无关,充分体现了分组化、多业务、开放性、兼容性、业
蓝牙是一种实现短距离无线数据与语音通信的开放技术标准,近年来得到了广泛的关注。组建无线自组织网络是蓝牙技术的一个重要应用领域。 但是,在蓝牙规范中只对微网结构的
移动自组网是一种特殊的无线网络,它的组建不依赖于预先存在的网络基础设施,如基站或接入点,而是由若干个带有无线收发器的移动节点构成。与传统的无线局域网不同,移动自组网是一
数字图像的压缩很长时间里是人们研究的一个课题,人们提出大量的图像压缩标准来适应不同的应用。压缩的任务是降低各种形式的数据的传输的带宽和存储要求。尽管现在越来越多的
目前,基于磁盘文件的数据库系统,例如BerkeleyDB、SQLite,虽然代表着嵌入式数据库应用的主流,但仍有一些应用场合的需要难以满足。它们所提供的库函数都是依托于文件系统的,所以,其