论文部分内容阅读
交通工具名的正确识别对信息抽取、自动问答等信息处理任务意义重大。为了解决获取标注语料困难这个问题,本文实现了一种基于Bootstrapping的交通工具名识别方法,其特点是:(1)通过手工标记小部分语料逐渐学习得到大量标注信息,(2)其中评价模式和样例时采用了计算信息熵增益的方法,以便更加精确地得到它们的度量方法。在ACE语料上进行测试,实验表明该方法在交通工具名识别中是有效的。