论文部分内容阅读
人工方法获取的规则准确率有待验证,所以从数据挖掘的角度运用Apriori算法对词性标注规则的获取进行研究。用户根据需求自定义支持度与置信度,在满足规定支持度的前提下,先从候选集模式中挑选出高于支持度的模式,再挖掘出高于置信度的产生式规则,获取的规则是隐含在数据中不易被发现的,其表达上是明确的。实验表明,自动获取的标注规则具有很好的利用价值,可以提高词性标注的正确率。