论文部分内容阅读
随着大数据时代的到来,信息剧增,从海量文本中迅速捕获有价值的知识是目前亟待解决的问题,知识图谱就此问世。虽在其他领域,已经成功构建了很多知识图谱库,但针对专业性领域的知识图谱构建还处于起步时期,尤其是能源电池领域,这严重阻碍了该领域知识的应用和共享。因此,本文以该领域50篇科技论文作为研究对象构建知识图谱,研究主要集中在四个方面,即词性标注、实体抽取、关系抽取以及图谱构建。词性标注。首先,依据论文和中英文的结构特点,提取文本中具有特殊特点的实体,经去重、排序,补充到自定义词典;然后,运用HanLP的