用于词性标注的一种快速学习算法:对Brill的基本变换算法的一项改进

来源 :计算机学报 | 被引量 : 0次 | 上传用户:yaoyao115711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种快速学习算法,它解决了Brill基于变换的学习方法中规则获取时间过长的问题.在每次迭代过程中,该算法仅需调整受到影响的小部分变换模式,而无需遍历所有变换模式,大大节省了学习时间.应用这一快速学习算法,以SUSANNE英语语料库作为训练文本,获得300条英语词性标注规则和生词处理的概率知识,实现了一个英语词性标注系统,系统封闭测试和开放测试的正确率分别达到了98.2%和96.6%.
其他文献
参数化设计以其强有力的草图设计和图纸尺寸驱动功能已成为实现产品的初步设计,系列设计以及变异式设计的核心技术,本文提出了一种新的基于微妥观点的参数化设计方法,其基一思想
本文研究了具有优先级特征的分布式多媒体流的资源管理,提出了一种基于节优先级的资源管理的设计方法,包括资源管理机制,资源管理策略,服务质量(QoS)协商调整算法和高优先级节枪占算法
高校辅导员与学生、教师、家长及社区具有特定的联系,并承担一定的责任。应以发展的眼光对待自身工作,以开放的态度研究与工作相关的问题。这既是职业的内在规定性,也是获得
高校辅导员的工作绩效关系到大学生的成长成才,提高辅导员工作绩效是其自身、高校和社会等普遍关心的问题。辅导员应该从创新工作理念、提高工作素质、注重工作方法、讲究工作
本文在提出一个直接和间接相联模块间相似性的表示方法的基础上,提出了一个基于自组织神经网络的性能驱动MCM划分的神经学习方法。算法求解如何在高层设计中将功能模块分配到MCM芯片
分布式多媒体系统面临的最大挑战是支持稳定的连续媒体流和媒体流间同步,分布式多媒体资源管理模型是保证它们的关键,本文提出了一种基于节的资源分配和管理模型,在资源分配时,它
提高化学课堂效果,教师须不断研究总结教学中新课的导入艺术。本文从新课导入的四原则角度,总结了常用的新课导入的六方法。
为适应新课程改革,着力培养学生的创新能力和实践能力,结合初中数学教学的特点和规律,笔者就以培养初中生的阅读兴趣、阅读能力和阅读方法三个方面为着眼点,对初中数学教学中如何
在CAD/CAM和CIMS等领域的分布协同计算中,分布人工智能领域的多Agent技术已逐步得到越来越多的应用,本文阐述了MACE(Multi-AgentCooperativeEnvironment)多Agent协同工作环境中有关Agnet的概念,分类和结构,多Agent系统结构,人与人交互界面,公用语言以及运行
近几年来,人们对于电力资源需求越来越高,这就对电力系统运行提出很高的要求。电力系统运行的负荷逐渐增大,导致电力系统存在 一定的安全隐患,如果不能及时处理,就可能会影响