基于最大熵模型的介词纠错系统

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:angel5tears
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语介词纠错系统,针对英语学习者英语语言中常见的介词错误进行计算机自动纠正.首先,对标注过得语料库中介词错误进行了分类统计,总结出21种常见介词,在英语wiki语料库中利用计算机自动错误插值算法获得训练集合.然后在训练集合基础之上,通过使用基于最大熵模型的分类器,选择了包括上下文、介词补足语等特征,在训练集上进行模型的训练,最后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小、迭代次数对于测试集效果的影响,并且比较了朴素贝叶斯模型的结果,
其他文献
<正>特定日的报道包括各种纪念日报道、节假日的报道和其他一些特殊意义日期的报道,如每年一度的国庆节的报道,元旦春节的报道;母亲节、儿童节、老人节的报道;爱眼日、爱牙日
报纸要按照新闻传播的规律办事,一张报纸的头版如果靠某种无聊的东西取悦读者,连在头版及时呈现读者关心的新闻都做不到,那头版还有什么意义呢?
根据GenBank中的鹅细小病毒(GPV)和鸭瘟病毒(DPV)基因序列,分别设计合成了针对GPVVP3和DPV UL6基因片段的2对引物,以GPV—GZ1株鹅胚尿囊液和DPVSD株鸭胚尿囊液的核酸提取物混合液作
改革开放以来,我国广大地区农村居民生活水平普遍有所提高,价值观念也发生了许多变化,但是,他们的消费水平与城镇居民相比仍然偏低。在当前全球性金融危机的大背景下,如何进
房地产业作为新兴的产业,对社会经济发展具有举足轻重的作用。以往的研究偏重于国家或者大中城市房地产业的发展,小城镇的相关研究略显单薄。因此,本文以湖南省望城县为例,采
中俄两国具有很大的资源互补性,加强双方在能源领域经济合作的深度和广度无疑具有十分重要的战略意义。目前,中俄两国在石油、天然气、煤炭、电力等领域已经展开广泛的合作,
<正>我国新闻传播媒介在世界新闻传播市场上是比较特殊的一种类型。尽管它也具备世界上所有新闻传播媒介具有的一些共性,但更多的是其自身的特性。其中最重要的媒介控制力量
犹如温水中的青蛙一样,在缓慢、渐进、周密,甚至"科学"的洗脑流程之下,在一个封闭的系统之中,在一股庞大的无处不在的"气场"的影响下,经过无数次的"洗脑攻心"后,仅仅在传销组
期刊
煤矿区煤层气开发利用是指结合煤炭生产布局而开展的一系列煤层气开发利用活动。煤炭行业占煤层气地面产气量的半壁江山,但地面产气量离《煤层气(煤矿瓦斯)开发利用"十二五"
甲胺(CH3NH2)是一种重要的有机类化工材料,其主要用于合成橡胶的硫化功能促进剂、药类、驱虫产品、印染产品、活性剂等。山东华鲁恒升集团,建有产能为8万吨/年的甲胺装置,该