论文部分内容阅读
针对科技资源中缩略语大量出现,但传统算法识别准确率不高,运行速度较慢问题,提出一种基于逆序扫描和共现分析相结合的术语缩略语快速提取算法。从科技资源中提取缩略语、候选全称及上下文信息;采用启发式模糊匹配算法,对缩略语及候选术语全称从右向左进行逆序扫描,在不要求缩略语中字母全部正确匹配的情况下,识别出规则的术语缩略语及其全称;最后对不规则候选缩略语及全称进行共现分析。同以往算法相比,该算法无论在时间复杂度,还是在准确率和召回率上都取得了明显进步。