论文部分内容阅读
针对航空安全报告中结构化属性和非结构化属性共存、人工分析耗时耗力的现状,本文提出结合领域专家知识,采用基于切分单元的最大匹配算法得到候选集,利用互信息对其进行筛选,建立了专用的航空安全词典。为进行更进一步的数据分析、数据挖掘和识别隐藏在航空安全数据中未知的、潜在的问题、提高航空安全性能提供了基础。