煤矿行业智能问答系统设计与实现

来源 :河北工程大学 | 被引量 : 0次 | 上传用户:jianyong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今人们习惯通过网络获取信息,但是互联网返回的网页数据通常比较杂乱,用户需要自己花费时间和精力对繁多冗余的信息进行判断,并不能直接得到准确的答案,而煤矿行业的知识更是分布散列,细小繁多,难以快速查找。基于知识图谱的智能问答系统可以通过解析用户的问题,捕捉用户意图,在知识库中搜索出最为准确的答案直接返回给用户。本课题的主要研究内容包括:(1)知识库构建:使用Scrapy爬取下载煤矿知识网站上的文件获取数据源,然后将文件进行格式转换,再通过LTP对文件内容进行分词等预处理,利用基于词的Bi LSTM-CRF命名实体识别模型与基于Bi GRU融合Attention机制的关系抽取模型,从标注好的文本中数据得到<实体1,关系,实体2>的结构化数据,将其存储至Neo4j图形数据库中,构成煤矿知识库。(2)问答实现:首先爬取常见的问句,获得用户常问的问题类型,构造问句模板,然后预处理问句集,使用TF-IDF提取问句的特征词,构成特征词词典,再将问句集分别使用支持向量机和朴素贝叶斯行训练,得到问句分类器,并对两种分类器的训练结果进行测试与分析,最终选择效果更好的朴素贝叶斯分类器对用户在问答系统中输入的问句,进行类别判断,匹配问题模板,得到完整的Cypher查询语句,之后在煤矿知识库中搜索答案,将答案填充到回答模板返回给用户。(3)系统前后端交互:本文使用Django框架实现问答系统与煤矿知识库的连接和数据交互,使用Bootstrap和JS实现前端界面,最终得到完整的问答系统。本课题的研究可以为煤矿领域的专业人员提高获取信息的效率,减少时间上的浪费,对于其他领域知识库问答的研究也有重要的借鉴价值。
其他文献
数学课堂教学中的活动教学,有些活动教学的实施并不能很好地体现活动教学的实际意义和内在价值。如何解决当前课堂活动教学中存在的问题?下面,我就多年实际教学经验,与大家探讨一
结合典型病例分析产科革兰阴性菌败血症的早期诊断、治疗原则和教训。
本文介绍国产尿液快速诊断八联试纸的研制原理、临床应用及使用时之注意事项。
<正> 慢性肾小球肾炎(CGN)是肾衰的常见原因之一。各种肾小球肾炎(GN)都有其不同的自然过程。作者总结了香港大学肾内科经肾活检证实的原发性GN 428例[包括部分血乙型肝炎表
本文对尸解证实的24例新生儿肺出血进行初步分析,本症常为各种疾病的激期发生肺出血,其病因与感染和新生儿高粘滞综合征关系密切。发病日龄多在12小时内,可有肺部湿啰音。X线
植物中的硒及其生理作用施和平(华南师范大学,广州510631)SELENIUMANDITSPHYSIOLOGICALROLESINPLANTS¥ShiHe-Ping(SouthChinaNormalUniversity,Guangzhou510631...
目的:借助中医传承辅助平台(V2.5)软件,采用数据挖掘的方法总结国医大师吕仁和教授诊疗消渴病的组方规律。方法:整理吕仁和教授诊治消渴病患者的相关医案共74例,进行规范化处
《幼儿园教育指导纲要》明确指出:“充分利用社会资源,引导幼儿实际感受祖国文化的丰富与优秀。”《幼儿园工作规程》规定:幼儿园要将“萌发幼儿爱家乡、爱国、爱集体的情感
阐述了国内外学者对技术机会概念的界定,利用文献计量方法分析了国内外对技术机会的研究重点、采用的研究方法及应用状况。