论文部分内容阅读
[目的/意义]大数据时代,金融行业面临着海量多源异构信息源所带来的巨大挑战;针对大数据环境下存在的多源异构金融数据,通过对企业风险知识单元进行挖掘和聚合,从而使其有序化地收敛于高效的金融知识服务,这对于投资决策、风险管理和金融监管等金融决策支持过程具有十分重要的意义。[方法/过程]文章从知识挖掘、知识组织和知识服务的相关理论、方法和技术出发,构建了基于风险短语挖掘的知识聚合模型,该模型主要由知识采集模块、知识挖掘模块和知识服务模块等三大模块所组成。[结果/结论]文章利用N-gram算法来挖掘上市公司年报文本中的候选风险短语,并利用基于统计和基于规则的方法来实现候选短语的过滤,形成可复用的风险短语知识库;将短语作为知识聚合的粒度,利用聚类分析、共现分析和知识检索等技术进行了多种形式的知识聚合,从而为决策者提供智能化的金融知识服务。