论文部分内容阅读
在科技情报收集过程中,网络信息源来源广泛且数据量庞大,对人工分析造成了巨大的压力。对从网络信息源采集的网页进行文本提取,过滤无关信息,使用主题模型对文本进行主题抽取,对抽取的主题进行可视化分析,提取出与需求相关的主题后对信息源进行分类分析。这一流程增强了信息处理能力,提高了情报收集的效率。