用于词性标注的一种快速学习算法--对Brill的基于变换算法的一项改进

来源 :计算机学报 | 被引量 : 0次 | 上传用户:kobiko
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种快速学习算法,它解决了Brill基于变换的学习方法中规则获取时间过长的问题.在每次迭代过程中,该算法仅需调整受到影响的小部分变换模式,而无需遍历所有变换模式,大大节省了学习时间.应用这一快速学习算法,以SUSANNE英语语料库作为训练文本,获得300条英语词性标注规则和生词处理的概率知识,实现了一个英语词性标注系统,系统封闭测试和开放测试的正确率分别达到了98.2%和96.6%.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
讨论了指令级并行运算环境中多媒体数据处理的实现方法和性能.围绕MMX技术,提出了面向数据流的并行程序开发方法,实现和测试了典型的多媒体数据处理算法,研究了指令级并行计
【摘要】 目的 探讨术前细针穿刺细胞块对胰腺占位性病变的诊断价值。方法 回顾分析本院2005年1月至2010年6月收治的胰腺占位性病变83例,术前均行B超引导下穿刺作细胞学涂片及细胞块检查,并与最终病理诊断作对比研究。结果 细胞学涂片和细胞块切片的准确性分别为89.2%、97.6%,两者比较差异显著(P<0.05)。细胞块诊断实性假乳头状瘤和胰腺内分泌肿瘤的准确性均为100%。结论 术前穿刺细胞块
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
目的 探讨总结晚期产后出血的原因及防治措施.方法 检索2009-2010年问有数据统计的关于晚期产后出血的学术总结65篇,抽样其中5篇所涉医院的晚期产后出血数据,结合自身临床经
脑卒中是临床上一种常见病、多发病,其发病突然,通常包括脑出血、脑梗死、蛛网膜下腔出血,是发病率、致残率,复发率、病死率极高的疾病.由于肢体功能障碍、偏瘫、失语、恢复
目的观察空气波配合中药熏洗治疗糖尿病下肢缺血、周围神经病的疗效。方法80例糖尿病下肢缺血、周围神经病患者随机分为治疗组和对照组各40例,治疗组采用空气波配合中药熏洗
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
分布式计算中的稳定性质是那些在计算中一旦成立将保持成立的性质,如分布式死锁、分布式终止和分布式废码等.稳定性质检测是分布式计算中的重要问题,常通过构造一致全局系统
本文完成了一种新的组网分群算法——最大链路数分群算法,并与美国HF-ITF的LCA算法及其改进算法作了比较,结果验证了它的正确性和有效性。