论文部分内容阅读
大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米管研究领域项目数据进行了语义组块标注实验。实验结果表明,在B.SUB、I-SUB、B—ACT、I-ACT、B—GOL、I-GOL、B—IMP7种标签标注中,增加混合内容线索特征后的精度值分别达到84.43%、89.09%、84_38%、89.87%、51.33%、50.37%、37.8