论文部分内容阅读
[目的]从文本中抽取脆弱生态治理技术、实施地、实施时间等命名实体,并分析相关态势.[方法]利用Bi-LSTM+CRF结合基于特征的命名实体知识库对脆弱生态治理领域CNKI数据库中的相关文献进行脆弱生态治理技术、地名实体、时间实体的自动抽取和标记.[结果]对于中文文献中生态治理技术相关实体的抽取,获得P值74.34%、R值64.04%和F1值68.81%.采用Bi-LSTM+CRF神经网络模型与单纯采用CRF相比,P值提高9.41%,F1值提高4.26%,R值基本持平.[局限]依赖于中文分词工具的准确性;仅对相关的实体进行抽取,尚未抽取实体之间的关系.[结论]Bi-LSTM+CRF结合基于特征的命名实体知识库抽取命名实体技术,可用于基于细粒度内容的资源环境情报分析.