基于中文知识图谱的金融领域问答系统的研究与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:XIEJUANJUAN1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,问答系统为用户提供智能知识服务而受到青睐。本文从金融领域的角度出发,针对用户所提问句的不确定性和多样性,对金融领域中文数据进行分析梳理和结构化,构建了知识图谱,研究并实现了基于中文知识图谱的金融领域问答系统(CF-KGQA)。主要工作如下:1.获取与存储数据,构建了具有金融领域特性知识图谱。(1)搭建了一套一主十从的分布式爬虫系统,且为保障数据存储的安全,搭建了可主从备份的数据库集群。(2)定义知识图谱中实体、实体间关系的概念。在构建知识图谱时,不仅要考虑金融领域特性设计图谱结构,还要根据问答系统的实际需求不断进行调整。2.提出了基于深度学习的金融领域问句语义依存分析方法。提出了一种基于讯飞开放平台的语义依存图分析(Semantic Dependency Graph Parsing,SDGP)、双向长短期记忆网络(Bidirectional Long Short-Term Memory,BLSTM)和条件随机场(Conditional Random Field,CRF)的语义依存分析方法(DR-BLSTM-CRF)。(1)结合BLSTM和CRF的命名实体识别(Named Entity Recognition,NER)算法对问句进行命名实体识别,获得一个包含字符标签信息的序列。(2)采用基于讯飞开放平台Web API对问句进行语义依存图分析,获得一个包含语义依存信息的句子表示,再结合(1)中的命名实体识别结果,通过依赖缩减得出更为准确的语义依存图。实验结果表明,在自建的约140000条金融领域问句数据集上,本文提出的方法与语言技术平台(Language Technology Platform,LTP)的语义依存分析效果相比,准确率、召回率和F1值分别提高33.4%、33.9%和34.2%,该方法可以有效地对金融领域问句进行语义依存分析。3.设计并实现了基于知识图谱的问答系统。在之前理论和实验基础上,将知识图谱和基于深度学习的金融领域问句语义依存分析方法应用于问答系统,设计知识图谱模块、前端展示模块和问答模块三大功能模块,并将问答结果在网页以动态图的形式进行展示。
其他文献
“傻大个”这个词也许并不是一个准确的形容词。据美国心理科学中心网站报道,美国科罗拉多大学博尔德分校的心理学和神经科学研究人员进行的一项新研究证实,个子高的人往往会比
目的 对比腹腔镜与开腹结直肠癌根治术的近期疗效.方法 从就诊于我院结直肠癌患者中选取131例作为研究对象,分为腹腔镜组(65例)与开腹组(66例).统计手术基本情况(术中出血量、通气
钾二次电池是一种新型的能源存储与转化装置,是对锂二次电池的拓展,具有原料来源丰富,成本低,循环寿命长等优势,未来有可能作为低成本长续航电池得到大规模应用。关于钾二次
目的:了解北京市药品"零差率"政策对农村慢性病病人的影响。方法采用典型抽样方法,对274名"零差率"政策实施前后均在社区卫生服务机构就诊的慢性非传染性疾病患者进行问卷调查,同
本文结合一份数学中考模拟卷评析课的教学实践,从分析统计、展示学生奇思妙解、引导学生在纠错中分类评析、拓展学生解题思路,到运用“错误”变式训练,逐一阐述如何充分利用学生
遵照伟大领袖毛主席“备战、备荒,为人民”“节约粮食问题一定要十分抓紧”的伟大教导,我们学习了河北省束鹿县和辽宁省营口市的经验,经过反复试验,成功地把猪的发酵饲料应用
“华康2号”是中国农业科学院蚕业研究所培育的对家蚕血液型脓病(BmNPV)具有高度抵抗性的蚕品种。2013年获贵州省农作物品种审定委员会审定通过(黔审蚕2013002号)。桐乡市于2
镇赍县水草资源比较丰富,是大量发展畜牧业的好地方。但是,原有的牲畜质量很差,生产性能低,经济价值不大。为了迅速发展牲畜,提高牲畜质量,逐步繁育良种,适应集体经济发展的
进入21世纪后,随着国家“东桑西移”和浙江省“蚕桑西进”工程的实施,蚕桑产业快速发展,桑苗产销旺盛。为适应日趋激烈的市场竞争,创建优质桑苗品牌,在海宁市周王庙镇星火村党支部
目的:了解四川省城市孕妇孕前健康检查工作的开展现状,发现该项工作开展过程中可能存在的重难点,为推进全省出生缺陷一级预防工作提供参考依据.方法:随机抽取四川省八个地区(成