基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:zym_Java
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]从文本中抽取脆弱生态治理技术、实施地、实施时间等命名实体,并分析相关态势.[方法]利用Bi-LSTM+CRF结合基于特征的命名实体知识库对脆弱生态治理领域CNKI数据库中的相关文献进行脆弱生态治理技术、地名实体、时间实体的自动抽取和标记.[结果]对于中文文献中生态治理技术相关实体的抽取,获得P值74.34%、R值64.04%和F1值68.81%.采用Bi-LSTM+CRF神经网络模型与单纯采用CRF相比,P值提高9.41%,F1值提高4.26%,R值基本持平.[局限]依赖于中文分词工具的准确性;仅对相关的实体进行抽取,尚未抽取实体之间的关系.[结论]Bi-LSTM+CRF结合基于特征的命名实体知识库抽取命名实体技术,可用于基于细粒度内容的资源环境情报分析.
其他文献
期刊
[目的]从网络舆情数据流中获取潜在热点主题,帮助政府与企业进行重点舆情监测与正确舆论引导.[方法]对微博实时数据流进行增量式舆情主题检测,选取并量化能够区分主题热门与