论文部分内容阅读
本文致力于信息抽取中时间表达式的识别与提取研究。首先针对基于规则方法时间识别的缺点,将统计序列标注模型——条件随机场应用于时间识别中,充分利用时间表达式的内部和外部特征进行时间识别,提高了时间识别的准确率。然后通过对识别结果进行分析,自定义规则对识别错误结果进行后处理,进一步提高时间识别的召回率,弥补了机器学习模型获取知识不够全面而导致的召回率偏低的问题。实验结果表明,本文方法开放测试的准确率、召回率和F-值分别到达了91.65%、88.13%和89.85%,较传统方法均有所提高,是一种有效的时间表达式识